1、網(wǎng)站和頁面權(quán)重。質(zhì)量高,資格老的網(wǎng)站被認(rèn)為權(quán)重比較高,這種網(wǎng)站上的頁面被爬行的深度也會(huì)比較高,所以會(huì)更多內(nèi)頁被收錄。
2、與首頁點(diǎn)擊距離。一般來說網(wǎng)站上權(quán)重最高的是首頁,大部分外部鏈接是指向首頁的,蜘蛛訪問最頻繁的也是首頁。離首頁點(diǎn)擊距離近,頁面權(quán)重越高,被蜘蛛爬行的機(jī)會(huì)也越大。
3、導(dǎo)入鏈接。無論是外部鏈接還是同一個(gè)網(wǎng)站的內(nèi)部鏈接,要被蜘蛛抓取,就必須有導(dǎo)入鏈接進(jìn)入頁面,否則蜘蛛根本沒有機(jī)會(huì)知道頁面的存在。高質(zhì)量的導(dǎo)入鏈接也經(jīng)常使頁面上導(dǎo)出鏈接被爬行深度增加。
4、頁面更新度。蜘蛛每次爬行都會(huì)把頁面數(shù)據(jù)儲(chǔ)存起來。如果第二次爬行發(fā)現(xiàn)頁面與第一次收錄的完全一樣,說明頁面沒有更新,蜘蛛也就沒有必要經(jīng)常抓取。如果頁面內(nèi)容經(jīng)常更新,蜘蛛就會(huì)更加頻繁地訪問這種頁面,頁面上出現(xiàn)的新連接,也自然會(huì)被蜘蛛更塊地跟蹤,抓取頁面。