資源描述:
《火車頭采集教程火車頭采集器使用說明》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、火車頭采集教程火車頭采集器使用說明上圖中,用紅線圈住的LocoySpider.exe是主程序,我們雙擊打開。。。ps:這里說下,上圖中,有好多任務(wù)是我自己用的。。。新程序,并沒有那么多。。。我們會看到火車的界面,看起來非常復(fù)雜,是吧?呵呵,其實并沒有那么復(fù)雜,對于新手,有好多東西是用不到的。。。下邊會一一的講解。。。我們先補習(xí)一下,火車頭采集軟件的工作原理。。。因為我們?yōu)g覽到的網(wǎng)頁,最后都是通過html輸出的,那么意味著,我們可以查看到html的源碼,那么火車頭為什么會采集到內(nèi)容呢?我們看下網(wǎng)站的基本結(jié)構(gòu)。。。
2、htmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">-------這些藍色的東西,對于新手,我們不需要知道!網(wǎng)頁的標題-
3、---紅色的是網(wǎng)頁的標題。。。如下圖(1)
內(nèi)容??????????在這個和之間的,是網(wǎng)站的內(nèi)容部分。。如下圖(2)