做了SEO那么就,若是還不懂得日志怎么分析的SEOer,你看到了這里,你就知道我會悄悄告訴你的,日志分析就跟中醫里面的把脈是一個到底,隨時還是要給自己的網站把把脈,不要忘了開一個藥方,給網站做一個診斷報表,對癥下藥的時刻到了,想要網站穩健的發展,更加符合SEO優化規則,網站的日志分析和診斷肯定是哪些不想做這些工作的SEO,在劫難逃的事情。
所謂的網站日志,并不會同你想象中的那么深奧...就是通過各個搜索引擎下的蜘蛛,通過域名爬去網站的軌跡和痕跡,就成為傳說中的“網站日志”這樣一說是不是更好理解了。
一、如何對網站日志進行分析和診斷?
1、總訪問次數
蜘蛛對網站的訪問次數可以間接反映網站的權重,為了有效提升蜘蛛訪問次數,需要在服務器性能、深層外鏈建設、層級結構、入口添加等方面進行分析優化
2、總停留時間
蜘蛛停留時間與網站結構、服務器響應時間、網站簡潔的代碼、網站內容更新等有很密切的關系
3、總抓取量
蜘蛛抓取量與網站結構、網站內容更新、服務器cookie設定等有密切的關系。蜘蛛抓取量與網站的收錄直接相關,抓取量越大意味著網站收錄可能越多
4、單次訪問抓取量
蜘蛛單次抓取的頁面數量多,說明網站有價值內容多,并且網站結構利于搜索引擎蜘蛛的抓取
5、單頁抓取停留時間
單頁抓取停留時間與頁面加載速度、頁面內容信息量、頁面代碼簡潔度等有密切關系,提高網頁加載速度,減少蜘蛛單頁停留時間,提升蜘蛛總抓取,進而增加網站收錄,提升網站整體流量
6、目錄抓取
蜘蛛主要抓取的目錄應該與網站的重點欄目一致,為了提升重點欄目的收錄、權重及
關鍵詞排名,需要從外鏈、內鏈等角度調整SEO策略;針對不需要收錄或者抓取的欄目,需要使用robots禁止抓取
7、頁面抓取
蜘蛛在網站停留時間有限,搭建良好的網站結構,為重點頁面建設入口,減少頁面的重復抓取率,將蜘蛛引入更多不同的頁面,有利于提升網站的收錄
8、狀態碼
清除頁面中的死鏈,有利于蜘蛛順利爬行頁面,提升搜索引擎友好度。
二、網站日志下載及設置注意事項!
1、首先我們的空間要支持網站日志下載,這一點是很重要的,在我們購買空間之前必須要先問好支不支持網站日志下載,因為有的服務商是不提供這項服務的,如果支持的話空間后臺一般都有日志WebLog日志下載這個功能把它下載到根目錄在用FTP傳到本地就可以,服務器的話可以設置將日志文件下載到指定路徑。
2、這里有個很重要的問題,網站日志強烈建議設置成每小時生成一次,小型的企業站和頁面內容較少的網站可以設置成一天,它默認是一天,如果內容多或者大型站設置成一天生成一次,那么一天只生成一個文件,這個文件會相當的大,我們有時電腦打開是會造成死機,設置的話找空間商協調設置即可。
三、網站日志的分析。
1、日志的后綴名是log的我們用記事本打開,選擇格式里的自動換行這樣看起來方便,同時用搜索功能搜索BaiduSpider和Googlebot這兩個蜘蛛。
例如:
百度蜘蛛 2012-03-13 00:47:10 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo+(+ baidu /search/spider ) 200 0 0 15256 197 265
谷歌機器人 2012-03-13 08:18:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1+(+ google /bot ) 200 0 0 985 200 31
拆分解釋:
2012-03-13 00:47:10 蜘蛛爬取的日期和時間點;W3SVC177 這個是機器碼這個是惟一的 我們不去管它;116.255.169.37 這個IP地址是服務器的IP地址;GET 代表事件,GET后面就是蜘蛛爬取的網站頁面,斜杠就代表首頁,80 是端口的意思,220.181.51.144 這個IP則是蜘蛛的IP,這里告訴大家一個鑒別真假百度蜘蛛的方法,我們電腦點擊開始運行輸入cmd打開命令提示符,輸入nslookup空格加蜘蛛IP點擊回車,一般真百度蜘蛛都有自己的服務器IP而假蜘蛛則沒有。
如果網站中出現了大量的假蜘蛛則說明有人冒充百度蜘蛛來采集你的內容,你就需要注意了,如果太猖獗那會很占用你的服務器資源,我們需要屏蔽他們的IP.
200 0 0這里是狀態碼 狀態碼的意思可以在百度里搜索下;197 265最后兩個數字則代表著訪問和下載的數據字節數。
2、我們分析的時候先看看狀態碼 200代表下載成功,304代表頁面未修改,500代表服務器超時,這些是一般的其他代碼可以百度一下,對于不同的問題我們要處理。
3、我們要看蜘蛛經常爬取哪些頁面,我們要記錄下來,分析他們為什么會經常被蜘蛛爬取,從而分析出蜘蛛所喜歡內容。
4、有時候我們的路徑不統一出現帶斜杠和不帶斜杠的問題,蜘蛛會自動識別為301跳轉到帶斜杠的頁面,這里我們就發現了搜索引擎是可以判斷我們的目錄的,所以我們要對我們的目錄進行統一。
5、我們分析日志分析時間長了,我們能夠看出蜘蛛的抓取規律,同一目錄下面的單個文件的抓取頻率間隔和不同目錄的抓取頻率間隔都可以看出來,這些抓取頻率間隔時間是蜘蛛根據網站權重和網站更新頻率來自動確定的。
6、蜘蛛對于我們的頁面的抓取是分等級的,是根據權重依次遞減的,一般順序為首頁、目錄頁、內頁。
7、不同IP的蜘蛛他們的抓取頻率也是不相同的
四、那么通過網站日志我們能知道什么?
1、我們發的外鏈是否起到效果 ?
2、我們買的空間是否能夠穩定 ?
3、蜘蛛對我們的那些頁面比較喜歡而對哪些不喜歡 ?
4、蜘蛛什么時候抓取我們的網站頻繁,我們需要什么時候更新內容 ?
而這些問題其實我們可以通過我們的服務器IIS日志可以簡單的分析出來,作為一個合格的SEO, 要真正會分析IIS日志才可以而不是簡單的去看看狀態碼,
培戀網原創版權,網站建設提供網站代運營、模板網站制作轉載請注明出處,本文地址:http://www.gdszrq.com/news/dontai/74101.html