有一些內容質量高的網頁,用戶可以正常訪問,但百度pider無法正常訪問和抓取,導致搜索結果覆蓋率不足,給百度搜索引擎和網站帶來損失。百度稱這種情況為“搶占例外”。
百度搜索引擎會考慮大量內容無法正常獲取的網站在用戶體驗上存在缺陷,降低對網站的評價。在抓取、索引和排序方面,百度搜索引擎將受到一定程度的負面影響,終影響到網站從百度獲得的流量。
以下描述了對站長異常抓取的一些常見原因:
服務器連接異常有兩種情況:(1)網站不穩定,百度spider在嘗試連接時暫時無法連接到您網站的服務器;(2)百度spider一直無法連接到您網站的服務器。
1、服務器連接異常的原因通常是您的網站服務器太大和過載。您的網站也可能運行不正常。請檢查網站的web服務器(如Apache、IIS)是否正常安裝和運行,并使用瀏覽器檢查主頁面是否可以正常訪問。您的網站和主機也可能會阻止Baiduspider的訪問。你需要檢查網站和主機的防火墻。
2、網絡運營商例外:網絡運營商分為電信和聯通兩類。百度spider無法通過電信或網通訪問您的網站。如果發生這種情況,您需要聯系網絡服務提供商,或購買空間與二線服務或CDN服務。
3、DNS異常:當Baiduspider無法解析您網站的IP地址時,將出現DNS異常。可能是您網站的IP地址有誤,或者域名服務商已經禁止了Baiduspider。請使用whois或host檢查您網站的IP地址是否正確和可解析。如果沒有,請聯系域名注冊商更新您的IP地址。
4、IP阻塞:IP阻塞是限制網絡的導出IP地址,禁止該IP段的用戶訪問內容。這里,它具體指的是百度piderip的屏蔽。此設置僅在您的網站不希望百度pider訪問時才需要。如果您希望百度pider訪問您的網站,請檢查百度spider IP是否錯誤地添加到相關設置中。你的網站所在的空間服務提供商也有可能禁止百度IP。此時,您需要聯系服務提供商以更改設置。
5、UA阻塞:UA是用戶代理。服務器通過UA識別訪客的身份。當一個網站訪問一個指定的UA并返回一個異常頁面(如403500)或跳轉到另一個頁面時,稱為UA阻塞。此設置僅在您不希望Baiduspider訪問您的網站時才需要。如果你想百度訪問你的網站,是否有百度在用戶代理相關設置并及時修改它。
百度蜘蛛抓取異常問題
6、死鏈:頁面無效,不能向用戶提供任何有價值信息的頁面為死鏈,包括協議死鏈和內容死鏈。
協議死鏈:頁面的TCP協議狀態/HTTP協議狀態清楚地表示出死鏈,如404、403、503狀態等。
內容死鏈:服務器返回的狀態是正常的,但內容已被更改為不存在的、已被刪除或需要權限的信息頁,與原始內容無關。
對于死鏈,我們建議網站使用協議死鏈,通過百度站長平臺死鏈工具提交給百度,這樣百度可以更快地找到死鏈,減少死鏈對用戶和搜索引擎的負面影響。
7、異常跳轉:跳轉是將網絡請求重定向到另一個位置。異常跳轉指以下情況:
1)當前頁面為無效頁面(內容已被刪除、死鏈等),直接跳轉到上一個目錄或首頁,百度建議站長刪除無效頁面的入口超鏈接
注:如果長期跳轉到其他域名,如在網站上更改域名,百度建議使用301跳轉協議進行設置。
8、其他網站異常原因:
1)對于百度推薦人的例外情況:網頁返回與百度推薦人正常內容不同的行為。
2)對于百度UA的例外情況:返回百度UA的網頁行為與頁面的原始內容不同。
3)JS跳轉異常:網頁加載了百度無法識別的JS跳轉代碼,用戶通過搜索結果進入網頁后跳轉。
4)壓力過大造成的意外阻塞:百度會根據網站規模、訪問量等信息,自動設置合理的壓力進行抓取。但在壓力控制異常等異常情況下,服務器會根據自身負載進行保護意外閉鎖。在這種情況下,請在返回碼中返回503(意思是“服務不可用”),以便百度spider在一段時間內再次嘗試獲取鏈接。如果該網站處于空閑狀態,則將成功獲取該網站。
培戀網原創版權,網站建設提供網站代運營、模板網站制作轉載請注明出處,本文地址:http://www.gdszrq.com/news/dontai/80604.html
隨著大數據時代和互聯網+時代的到來,網絡、計算機和信息技術……
1、 什么是錨文本?錨文本的定義 另一種表示錨定文本的方式也……
SEO優化網站首先看百度百科中域名泛解析的概念:所謂“泛域名……
隨著互聯網的發展,信息以指數級的速度大量涌入,整個互聯網……
看來如果排名上升,一切都會有的。事實遠非如此。試想一下,……
現在很多的企業開始做網絡推廣,在網站SEO優化的過程中會使用……