Baiduspider - 百度蜘蛛:
百度是如何收錄到那么多網(wǎng)頁(yè)的呢?這個(gè)百度用以抓取互聯(lián)網(wǎng)上數(shù)以億計(jì)的網(wǎng)頁(yè)的程序,就叫做Baiduspider - 百度蜘蛛。
它是一個(gè)程序,夜以繼日得在互聯(lián)網(wǎng)上找尋新的URL,接著抓取URL上的內(nèi)容,返回到百度的網(wǎng)頁(yè)暫存數(shù)據(jù)庫(kù)。
百度用來(lái)抓取網(wǎng)頁(yè)內(nèi)容的程序,叫做Baiduspider,抓取其他內(nèi)容的蜘蛛,則是新的名字:
產(chǎn)品名稱 對(duì)應(yīng)user-agent
網(wǎng)頁(yè)搜索 Baiduspider
無(wú)線搜索 Baiduspider-mobile
圖片搜索 Baiduspider-image
視頻搜索 Baiduspider-video
新聞搜索 Baiduspider-news
百度搜藏 Baiduspider-favo
百度聯(lián)盟 Baiduspider-cpro
不少朋友會(huì)在自己的網(wǎng)站日志里看到這個(gè)蜘蛛Baiduspider-cpro,現(xiàn)在我們明白它是百度聯(lián)盟蜘蛛,用以百度聯(lián)盟程序匹配相應(yīng)的廣告。
閱讀本文的人還可以閱讀: