SEO禪已經創建快二個月的時間,從谷歌的數據來看是非常符合預期的,但是百度還是沒有更新的動作,最近百度的蜘蛛抓取的頻率不太高,和幾個朋友交流了下,自驚雷3.0算法上線之后,基本上新站沒有三五個月想要收錄內頁是很難的,為什么拉長觀察期,原因其實大家都知道,就是為了防止垃圾站群,黑帽SEO利用快排工具,在短時間內把網站的“假權重”刷上去,導致百度搜索結果用戶體驗很差。
無蜘蛛訪問
對于新站來說,既然百度這樣規定了,我們也沒什么辦法,所以各位如果是新站,有蜘蛛來爬取,谷歌也有排名,那就不用太擔心,做你日常工作就行,但是如果百度蜘蛛也不來,谷歌也沒收錄,那就要看看是不是網站自己的原因,下面列幾個可能的原因。
域名剛注冊
新域名肯定比老域名在信用權重上要差,所以對于剛注冊幾天或者十幾天的域名來說,沒有搜索引擎蜘蛛來爬取是正常的,但是如果過了個把月,還是沒有蜘蛛來,那要看看是不是網站服務器把蜘蛛給屏蔽了,或者沒有導入鏈接,但是一般可能性不大,最有可能就是.txt規則設置錯誤,所以首先要檢查下文件是不是寫錯了,如果是搭建的網站,要看看設置->閱讀菜單有沒有勾選”建議搜索引擎不索引本站點“項,如果有勾選要取消掉。
網站打開太慢
谷歌的收錄規則就是有一條,如果網站打開的速度太慢,也會導致不收錄,正常來說,能在3秒之內進行頁面交互的,就算合格的站點,注意我這里說的是頁面交互,并不是算網站加載完成,什么區別?你看到瀏覽器圖標那個位置有個加載圖標一直在轉的就是在加載,不轉了就是加載完成,頁面交互是指網站(在Dev Tool里面查看)事件發生之后的時間。
服務器不穩定
如果服務器網絡不穩定,就有可能會因為網絡原因,導致百度爬蟲不去訪問網站,你想想,如果別人天天來吃閉門羹,哪只蜘蛛還會愿意再來,所以可以去看看服務器的 log文件看看有沒有搜索引擎蜘蛛來訪問過,最簡單的就是用Ping功能看看丟包率,如果丟包很厲害,那就換個服務器吧,最好把服務器放在國內再備案下,百度對備案的站點也會有一定的加權。
蜘蛛被屏蔽
對于新手站長確實會有這樣的問題,一邊向百度搜索引擎提交鏈接,地圖,一邊用.txt文件屏蔽蜘蛛來爬取收錄,我們可以使用站長平臺自帶的工具,去檢測.txt規則寫的有沒有問題,SEO禪前端時間把規則寫錯了,也導致收錄下降,但是發現的及時修正過來收錄就恢復了,可以看看錯誤的文件設置對SEO的影響這篇文章。
有蜘蛛訪問
如果在服務器看到有蜘蛛訪問,像下面這樣:
而且已經超過半年的情況,還是沒有被收錄要考慮是不是下面兩種原因:
網站結構太深
這里的結構一個是目錄結構,一個是代碼結構,首先檢查下網站代碼,看看HTML標簽是不是嵌套太多,導致網站代碼冗余,內容分布很散,還有就是目錄結構是不是層級太深,要知道新站最好就是保持在二層目錄結構,也就是說進行最多三次點擊就能進到文章頁,不然對于爬蟲分配的時間就可能抓取不過來。
對于SEO禪來說,百度的抓取時間和頻率是在不斷上升的,所以我并不擔心不被百度收錄,我只要繼續更新文章,做好內容就可以,有空優化下網站內鏈,優化下用戶體驗,再偶爾發幾個高質量的外鏈,被百度收錄只是早晚的事情。
缺乏原創內容
對于新站來說,有些站長會圖方便,直接去網絡上復制粘貼內容,而不是自己原創的,這種類型的網站長時間沒有收錄也是很正常的事情,畢竟百度那么多算法工程師也不是吃素的,哪里那么好忽悠,所以如果網站缺少原創導致沒有收錄,那各位還是調整下自己的方式,以質勝量來達到收錄的目的,不然有可能會被關進小黑屋的。
其它原因
對于新站不收錄的原因肯定不止上面提到的這幾點,每個網站都有自己的情況,具體問題需要具體分析,但是上面幾個是比較常見的,如果不是上面的情況,可以考慮請有經驗的站長幫忙看看,不要有病亂投醫,最怕的是網站三天兩天改這改那,這對收錄也是影響很大的。
百度不收錄解決辦法
上面已經分析了大致幾個百度不收錄的原因,可以試試下面的辦法來加快收錄: