百度抓取鏈接有四種方式
1、自動推送
JS代碼是百度站長平臺最新推出的輕量級鏈接提交組件,站長只需將自動推送的JS代碼放置在站點每一個頁面源代碼中,當頁面被訪問時,頁面鏈接會自動推送給百度,有利于新頁面更快被百度收錄。
2、Sitemap
可以定期將網(wǎng)站鏈接放到Sitemap中,然后Sitemap提交給百度。百度會周期性地抓取檢查站長提交的Sitemap,對其中的鏈接進行處理。
3、主動推送
是最為快速的提交方式,將站點當天新產(chǎn)出鏈接立即通過此方式推送給百度,可以保證新鏈接可以及時被百度收錄。
4、手動提交
如果你不想通過程序提交,你可以用這種方式手動提交鏈接到百度。
今天我們介紹自動推送,這種方式是我們最常用的,也是最方便的。
?
百度自動推送文章收錄怎么做
百度站長平臺提供鏈接索引,自動提交JS腳本已經(jīng)有一段時間了。任何平臺(瀏覽器、微信、微博)的頁面安裝代碼以后,頁面鏈接會很快被推到百度,從而提高站點新內(nèi)容發(fā)現(xiàn)的速度。
代碼:
<script>
(function(){
var canonicalURL, curProtocol;
//Get the <link> tag
var x=document.getElementsByTagName("link");
//Find the last canonical URL
if(x.length > 0){
for (i=0;i<x.length;i++){
if(x[i].rel.toLowerCase() == 'canonical' && x[i].href){
canonicalURL=x[i].href;
}
}
}
//Get protocol
? ?if (!canonicalURL){
? ? curProtocol = window.location.protocol.split(':')[0];
? ?}
? ?else{
? ? curProtocol = canonicalURL.split(':')[0];
? ?}
? ?//Get current URL if the canonical URL does not exist
? ?if (!canonicalURL) canonicalURL = window.location.href;
? ?//Assign script content. Replace current URL with the canonical URL
? ? !function(){var e=/([http|https]://[a-zA-Z0-9\_.]+.baidu.com)/gi,r=canonicalURL,t=document.referrer;if(!e.test(r)){var n=(String(curProtocol).toLowerCase() === 'https')?"https://sp0.baidu.com/9_Q4simg2RQJ8t7jm9iCKT-xh_/s.gif":"http://api.share.baidu.com/s.gif";t?(n+="?r="+encodeURIComponent(document.referrer),r&&(n+="&l="+r)):r&&(n+="?l="+r);var i=new Image;i.src=n}}(window);})();
</script>
?
百度自動推送文章收錄原理
1、它先是判斷了目前的協(xié)議類型是HTTPS還是其他類型(如,HTTP,F(xiàn)TP等)
2、然后下載了百度官方的一個JS文件
3、然后通過生成腳本塊將JS文件的內(nèi)容插入到當前頁中。
4、最后會運行這個腳本塊
?
這個js中的代碼實際上是靜態(tài)的,所以不必每次調(diào)用。另一方面,我們需要對r的值進行更改,將它更改為canonical URL的值。
這個腳本可以進一步查看頁面的canonical URL,我們知道canonical屬性表示該頁面有千種URL的花樣,請搜索引擎只認準href中給出的URL值,這樣搜索引擎將不會為同一頁面多次檢查推送頁面的內(nèi)容。
自動推送是一種非常實用的方法,上手快,操作簡單。但也存在一些小問題,本文僅為提高自動推送的效率和有效性提供了一條途徑。
閱讀本文的人還可以閱讀:
如何短期內(nèi)讓網(wǎng)站收錄翻倍或者翻數(shù)倍?(1)