火車(chē)頭采集器破解版(又名火車(chē)采集器)是一款可以采集互聯(lián)網(wǎng)上任意網(wǎng)站的輔助工具,功能強(qiáng)大的網(wǎng)絡(luò)數(shù)據(jù)/信息挖掘軟件,它的功能真的十分強(qiáng)大,可以采集任何信息,并且可以把采集的文件保存在本地、數(shù)據(jù)庫(kù)、網(wǎng)站發(fā)布等等,是信息采集人員和站長(zhǎng)必備的一款工具。
火車(chē)頭采集器破解版亮點(diǎn):
程序支持遠(yuǎn)程下載圖片文件,支持網(wǎng)站登錄后的信息獲取,檢測(cè)文件的真實(shí)地址,支持代理,支持防盜鏈的收集,支持收集數(shù)據(jù)直接入庫(kù),模仿人工發(fā)布等多種功能特征。
列車(chē)收集器支持從任何類(lèi)型的網(wǎng)站收集所需的信息,如各種新聞網(wǎng)站、論壇、電子商務(wù)網(wǎng)站、求職招聘網(wǎng)站等。
同時(shí)具有強(qiáng)大的網(wǎng)站登錄采集、多頁(yè)和分頁(yè)采集、網(wǎng)站跨層采集、POST采集、腳本頁(yè)采集、動(dòng)態(tài)頁(yè)采集等高級(jí)采集功能。
強(qiáng)大的php和c#插件支持,通過(guò)二次開(kāi)發(fā)可以實(shí)現(xiàn)更強(qiáng)大的功能。
幾乎所有網(wǎng)頁(yè)都能采集
無(wú)論什么語(yǔ)言,
無(wú)論什么編碼。
速度是普通采集器的7倍
火車(chē)采集器采用頂級(jí)系統(tǒng)配置,
反復(fù)優(yōu)化性能,讓采集速度快到飛起來(lái)!
和復(fù)制/粘貼一樣準(zhǔn)確
采集/發(fā)布如同復(fù)制/粘貼一樣精準(zhǔn),
用戶(hù)要的全都是精髓,怎能有遺漏!
網(wǎng)頁(yè)采集的代名詞
獨(dú)具十年歷練,成就業(yè)界領(lǐng)先品牌,
想到網(wǎng)頁(yè)采集,就想到火車(chē)采集器!
火車(chē)頭采集器軟件特色
1.通用性強(qiáng)。
無(wú)論是新聞、論壇、視頻、黃頁(yè)、圖片、下載類(lèi)網(wǎng)站,只要通過(guò)瀏覽器可以看到的結(jié)構(gòu)化內(nèi)容,指定匹配規(guī)則,就可以收集必要的內(nèi)容。
2.穩(wěn)定高效。
五年磨一劍,軟件不斷更新進(jìn)步,采集速度快,性能穩(wěn)定,占有資源少。
3、擴(kuò)展性強(qiáng),適用范圍廣。
定制網(wǎng)站發(fā)布,定制主流數(shù)據(jù)庫(kù)的保存和發(fā)布,定制本地php和.net外部編程接口處理數(shù)據(jù),使數(shù)據(jù)能夠?yàn)槟褂谩?/p>
火車(chē)頭采集器功能介紹:
1.新建分組
新建一個(gè)任務(wù)分組,選擇所屬分組,確定分組名稱(chēng)和備注。
2.新建任務(wù)
確定所屬分組,新建一個(gè)任務(wù),填寫(xiě)任務(wù)名稱(chēng)并保存。
3.Web發(fā)布配置
Web發(fā)布配置定義了如何登陸一個(gè)網(wǎng)站以及向該網(wǎng)站提交數(shù)據(jù)。
主要涉及到登錄信息的獲取,網(wǎng)站編碼設(shè)定,欄目列表的獲取,以及使用數(shù)據(jù)測(cè)試發(fā)布效果。
4.Web發(fā)布模塊
可以定義網(wǎng)站登錄,獲取欄目列表,獲取網(wǎng)頁(yè)隨機(jī)值,內(nèi)容發(fā)布參數(shù),以及上傳文件,構(gòu)造發(fā)布數(shù)據(jù)等高級(jí)功能。
5.數(shù)據(jù)庫(kù)發(fā)布配置
數(shù)據(jù)庫(kù)發(fā)布配置定義了數(shù)據(jù)庫(kù)鏈接信息的設(shè)置以及數(shù)據(jù)庫(kù)模塊的選擇。
6.數(shù)據(jù)庫(kù)發(fā)布模塊
用于編輯數(shù)據(jù)庫(kù)的發(fā)布模塊,方便我們將數(shù)據(jù)發(fā)布到配置好的數(shù)據(jù)庫(kù)中。
火車(chē)采集器可選mysql、sqlserver、oracle、access四種數(shù)據(jù)庫(kù)類(lèi)型,在文本輸入框中填寫(xiě)sql語(yǔ)句
(需有數(shù)據(jù)庫(kù)相關(guān)知識(shí)),并可使用標(biāo)簽替換相應(yīng)數(shù)據(jù)。也可在采集器模塊文件夾中加載某一模塊進(jìn)行編輯。
7.計(jì)劃任務(wù)
設(shè)置列表中采集任務(wù)的啟動(dòng)計(jì)劃,可每間隔、每天、每周、僅一次、或自定義Cron表達(dá)式,
(Cron表達(dá)式的寫(xiě)法可參考相關(guān)術(shù)語(yǔ)中的介紹)。保存設(shè)置后,任務(wù)即可按照設(shè)置執(zhí)行。
8.插件管理
插件是可以用來(lái)擴(kuò)展火車(chē)采集器功能的程序
火車(chē)采集器V9支持PHP源碼、C#源碼、C#類(lèi)庫(kù)三種類(lèi)型的插件,
可用于擴(kuò)展http請(qǐng)求、內(nèi)容處理和文件下載的功能,并可以分別進(jìn)行測(cè)試。
9.http二級(jí)代理
網(wǎng)絡(luò)中的服務(wù)器,可以讓網(wǎng)絡(luò)用戶(hù)去取得所需要的網(wǎng)絡(luò)信息。
代理的功能有可以突破自身ip的訪問(wèn)限制訪問(wèn)國(guó)外站點(diǎn),訪問(wèn)一些單位或團(tuán)體內(nèi)部資源,
突破電信的ip封鎖和隱藏真實(shí)的ip等。
火車(chē)采集器V9支持http代理、socket4和socket5代理。
10.http模擬請(qǐng)求
可以設(shè)置如何發(fā)起一個(gè)http請(qǐng)求,包括設(shè)置請(qǐng)求信息,返回頭信息。并具有自動(dòng)提交的功能。
基本功能
1、規(guī)則定制-通過(guò)收集規(guī)則定義,可以搜索所有網(wǎng)站收集大部分類(lèi)型的信息。
2、多任務(wù),多線程-可以同時(shí)進(jìn)行多個(gè)信息獲取任務(wù),每個(gè)任務(wù)可以使用多個(gè)線程。
3、所見(jiàn)即所得-任務(wù)收集過(guò)程所見(jiàn)即所得,過(guò)程中經(jīng)歷的鏈接信息、收集信息、錯(cuò)誤信息等立即反映在軟件界面上。
4、數(shù)據(jù)保存-數(shù)據(jù)一邊收集一邊自動(dòng)保存在相關(guān)數(shù)據(jù)庫(kù)中,數(shù)據(jù)結(jié)構(gòu)可以自動(dòng)適應(yīng),軟件可以根據(jù)收集規(guī)則自動(dòng)制作數(shù)據(jù)庫(kù),其中的表格和字段也可以通過(guò)導(dǎo)向庫(kù)靈活地將數(shù)據(jù)保存在客戶(hù)現(xiàn)有的數(shù)據(jù)庫(kù)結(jié)構(gòu)中。
5、斷點(diǎn)連續(xù)采集-信息采集任務(wù)停止后,可以從斷點(diǎn)繼續(xù)采集,從此不用擔(dān)心你的采集任務(wù)意外中斷。
6、網(wǎng)站注冊(cè)-支持網(wǎng)站Cookie,支持網(wǎng)站可視化注冊(cè),注冊(cè)時(shí)需要驗(yàn)證代碼的網(wǎng)站也可以收集。
7.計(jì)劃任務(wù)-通過(guò)該功能,您的收集任務(wù)可以定期、定量或循環(huán)執(zhí)行。
8、采集范圍限制-可根據(jù)采集深度和網(wǎng)站標(biāo)志限制采集范圍。
9、文件下載-可以將收集的二進(jìn)制文件(圖像、音樂(lè)、軟件、文件等)下載到當(dāng)?shù)卮疟P(pán)或收集結(jié)果數(shù)據(jù)庫(kù)。
10、結(jié)果更換-可以根據(jù)規(guī)則將收集的結(jié)果更換為定義的內(nèi)容。
11、條件保存-可根據(jù)某些條件確定那些信息保存,那些信息過(guò)濾。
12.過(guò)濾重復(fù)內(nèi)容-軟件可以根據(jù)用戶(hù)的設(shè)定和實(shí)際情況自動(dòng)刪除重復(fù)內(nèi)容和重復(fù)網(wǎng)站。
13.特殊鏈接識(shí)別-使用該功能,可以識(shí)別使用JavaScript動(dòng)態(tài)生成的鏈接或其他更奇怪的鏈接。
14.數(shù)據(jù)發(fā)布-可以通過(guò)定制接口將收集的結(jié)果數(shù)據(jù)發(fā)布到任何內(nèi)容管理系統(tǒng)和指定數(shù)據(jù)庫(kù)。目前支持的目標(biāo)發(fā)布媒體包括數(shù)據(jù)庫(kù)、sqlserver、mysql、oracle、靜態(tài)htm文件。
15、預(yù)約編程接口-定義多個(gè)編程接口,用戶(hù)可以在事件中利用PHP、C#語(yǔ)言進(jìn)行編程,擴(kuò)大收集功能。
特色功能。
1.支持所有站點(diǎn)代碼:完美支持收集所有代碼格式的站點(diǎn),程序可以自動(dòng)識(shí)別站點(diǎn)代碼。
2、多種發(fā)布方式:支持當(dāng)前所有主流和非主流的CMS、BBS等網(wǎng)站程序,通過(guò)系統(tǒng)發(fā)布模塊可以實(shí)現(xiàn)收集器和網(wǎng)站程序之間的完美結(jié)合。
3、全自動(dòng):無(wú)人值守工作,配置程序后,程序根據(jù)您的設(shè)置自動(dòng)運(yùn)行,完全不需要人工干預(yù)。
4、當(dāng)?shù)鼐庉?當(dāng)?shù)乜梢暬庉嬍占臄?shù)據(jù)。
5、采集測(cè)試:這與其他類(lèi)似的收集軟件無(wú)法比擬。程序支持直接檢查收集結(jié)果并測(cè)試發(fā)布。
6、管理方便:使用網(wǎng)站+任務(wù)方式管理收集節(jié)點(diǎn),任務(wù)支持批量操作,更多的數(shù)據(jù)管理也很簡(jiǎn)單。
注意:安裝火車(chē)采集器,要求電腦安裝.NET4.0框架,下載地址:NET4.8下載|.NET Framework 4.8中文版安裝包