搜索引擎蜘蛛的抓取規(guī)則,如下四點(diǎn)提供參考:
1、搜索引擎蜘蛛要能看到鏈接文字
這個(gè)是搜索引擎蜘蛛爬行時(shí)能夠檢索到的文字,如果文字或鏈接是通過(guò)JavaScript調(diào)用,蜘蛛是檢索不到的。頁(yè)面的文字內(nèi)容中主要內(nèi)容位置越靠前越有利,例如產(chǎn)品名稱放到頁(yè)面越靠前的位置,對(duì)該頁(yè)面產(chǎn)品關(guān)鍵詞的排名越有利。
2、搜索引擎蜘蛛能爬行未經(jīng) nofollow處理過(guò)的鏈接
這一項(xiàng)列出的是搜索引擎蜘蛛能夠檢索到鏈接,蜘蛛能夠通過(guò)這些鏈接訪問(wèn)網(wǎng)站其他頁(yè)面,越靠前的鏈接,被蜘蛛爬行的幾率就越大,被搜索引擎收錄的可能性越高。
3、搜索引擎蜘蛛能發(fā)現(xiàn)圖片鏈接并能閱讀到這些圖片所包含的含義
這里主要展示該頁(yè)面被搜索引擎蜘蛛和國(guó)際W3C標(biāo)準(zhǔn)化監(jiān)測(cè)器所檢索到的圖片,搜索引擎能夠根據(jù)圖片at="" 去判斷該圖片的類型,性質(zhì)和主題,對(duì)于判斷該圖片鏈接的頁(yè)面的主題有巨大幫助,能有效提高商品展示頁(yè)的搜索引擎排名根據(jù)W3C標(biāo)準(zhǔn),頁(yè)面上所有圖片都必須添加alt="" 圖片注釋,網(wǎng)站Logo使用網(wǎng)站名稱加簡(jiǎn)短描述,商品圖片使用商品名稱,網(wǎng)頁(yè)框架圖片留空。
4、搜索引擎蜘蛛能很好地識(shí)別HTML代碼
模擬搜索引擎蜘蛛爬行該頁(yè)面時(shí),獲得的“最簡(jiǎn)化代碼->是指過(guò)濾css, JavaScript后的代碼”,由此可以看出減少代碼空行,換行,空格等多余代碼空間非常重要。