搜索引擎蜘蛛是搜索引擎的一個(gè)自動(dòng)程序。它的作用是訪問(wèn)互聯(lián)網(wǎng)上的網(wǎng)頁(yè)、圖片、視頻等內(nèi)容,建立索引數(shù)據(jù)庫(kù),使用戶能在搜索引擎中搜索到您網(wǎng)站的網(wǎng)頁(yè)、圖片、視頻等內(nèi)容。
一般用法為“ spider+URL”,后面的URL(網(wǎng)址)是搜索引擎的痕跡,如果要查看某搜索引擎是否來(lái)爬取過(guò)你們的網(wǎng)站,可查看服務(wù)器的日志里是否有該URL,同時(shí)還能查看來(lái)的時(shí)間、頻率等…
1、百度蜘蛛:可以根據(jù)服務(wù)器的負(fù)載能力調(diào)節(jié)訪問(wèn)密度,大大降低服務(wù)器的服務(wù)壓力。根據(jù)以往的經(jīng)驗(yàn)百度蜘蛛通常會(huì)過(guò)度重復(fù)地抓取同樣的頁(yè)面,導(dǎo)致其他頁(yè)面無(wú)法被抓取到而不能被收錄。這種情況可以采取 robots協(xié)議的方法來(lái)調(diào)節(jié)。
2、谷歌蜘蛛:谷歌蜘蛛屬于比較活躍的網(wǎng)站掃描工具,其間隔28天左右就派出“蜘蛛”檢索有更新或者有修改的網(wǎng)頁(yè)。與百度蜘蛛最大的不同點(diǎn)是谷歌蜘蛛的爬取深度要比百度蜘蛛多一些。
3、雅虎中國(guó)蜘蛛:如果某個(gè)網(wǎng)站在谷歌網(wǎng)站下沒(méi)有很好的收錄,在雅虎下也不會(huì)有很好的收錄和爬行。雅虎蜘蛛的數(shù)量龐大,但平均的效率不是很高,相應(yīng)的搜索結(jié)果質(zhì)量不高。
4、微軟必應(yīng)蜘蛛:必應(yīng)與雅虎有著深度的合作關(guān)系,所以基本運(yùn)行模式和雅虎蜘蛛差不多。
5、搜狗蜘蛛:搜狗蜘蛛的爬取速度比較快,抓取的數(shù)量比起速度來(lái)說(shuō)稍微少點(diǎn)。最大的特點(diǎn)是不抓取 robot. text文件。
6、搜搜蜘蛛:搜搜早期是運(yùn)用谷歌的搜索技術(shù),谷歌有收錄,搜搜肯定也會(huì)收錄。2011年搜搜已經(jīng)宣布采用自己的獨(dú)立搜索技術(shù),但搜搜蜘蛛的特性和谷歌蜘蛛的特點(diǎn)還是有著相似的地方。
8、有道蜘蛛:和其他搜索引擎蜘蛛一樣,凡是高權(quán)重網(wǎng)站的鏈接一般都能將其收錄。爬行原理也是通過(guò)鏈接之間的爬行。