網站(zhàn)日志(zhì)分析是網站(zhàn)SEO優化的重要組成部分。網站(zhàn)剛剛創建,我們想看看蜘蛛是否爬行(xíng);網站(zhàn)包含,我們需要知道(dào)蜘蛛的活動;網站(zhàn)包含減少(shǎo),我們想看看服務器(qì)是否有(yǒu)問題;網站(zhàn)是K,我們想看看服務器(qì)日志(zhì)中的服務器(qì)是否有(yǒu)問題。
因此,無論網站(zhàn)何時(shí)運行(xíng),網站(zhàn)日志(zhì)都應該始終關注網站(zhàn)服務器(qì)日志(zhì)的動态。如何分析網站(zhàn)日志(zhì)?我們需要知道(dào)哪些(xiē)數(shù)據?接下來(lái),最終的SEO顧問将與您討(tǎo)論網站(zhàn)日志(zhì)分析的主題。在分析網站(zhàn)日志(zhì)時(shí),我們應該關注以下數(shù)據:
網站(zhàn)日志(zhì)記錄了蜘蛛和(hé)訪客訪問網站(zhàn)的實際情況。這些(xiē)數(shù)據對網站(zhàn)具有(yǒu)重要意義。用戶行(xíng)為(wèi)和(hé)蜘蛛行(xíng)為(wèi)都有(yǒu)重要的參考數(shù)據。
從用戶的訪問行(xíng)為(wèi),我們可(kě)以知道(dào)用戶喜歡哪個(gè)頁面,他進入哪個(gè)入口,最後離開(kāi)哪個(gè)頁面;他訪問了多(duō)少(shǎo)頁面,他在網站(zhàn)上(shàng)停留了多(duō)長時(shí)間(jiān),這些(xiē)數(shù)據非常重要。在很(hěn)大(dà)程度上(shàng),它幫助我理(lǐ)解用戶的浏覽行(xíng)為(wèi)和(hé)思想。
從蜘蛛的角度來(lái)看,一般可(kě)以觀察到蜘蛛的出訪次數(shù)、蜘蛛停留時(shí)間(jiān)、蜘蛛抓取量和(hé)蜘蛛返回碼。我們可(kě)以計(jì)算(suàn)蜘蛛平均停留時(shí)間(jiān)、蜘蛛平均抓取量、蜘蛛唯一抓取量、蜘蛛重複抓取的頁數(shù);以及抓取時(shí)間(jiān)、抓取頁面和(hé)特定的頁面列類型。這對于網站(zhàn)了解網站(zhàn)的權重分布是非常重要的參考。
我們可(kě)以通(tōng)過觀察網站(zhàn)日志(zhì)來(lái)分析蜘蛛的行(xíng)為(wèi)。??
1。蜘蛛總抓取量和(hé)平均抓取量的增加和(hé)減少(shǎo)可(kě)以顯示網站(zhàn)的結構、蜘蛛對網頁的偏好程度以及蜘蛛總訪問量可(kě)以顯示網站(zhàn)的大(dà)小(xiǎo)。
2。平均網頁停留時(shí)間(jiān)表明(míng)蜘蛛爬行(xíng)一頁,減少(shǎo)網頁爬行(xíng)時(shí)間(jiān)無疑對網站(zhàn)有(yǒu)重大(dà)意義。
3。唯一可(kě)以用來(lái)分析網站(zhàn)是否允許蜘蛛爬行(xíng)無效頁面的數(shù)據量。如果出現這種情況,我們應該及時(shí)處理(lǐ),以避免蜘蛛的損失。網站(zhàn)上(shàng)也有(yǒu)重複爬行(xíng)的次數(shù)和(hé)蜘蛛的重複率。重複爬蟲不能增加收集的數(shù)據量,網站(zhàn)的總權重與排名和(hé)流量有(yǒu)着密切的關系。在這種情況下,我們應該引導蜘蛛去爬行(xíng)網站(zhàn)的其他頁面,減少(shǎo)蜘蛛重複的爬行(xíng)頁面。在這裏我們可(kě)以借用nofollower标簽來(lái)輔助。
4。蜘蛛捕捉時(shí)間(jiān)分析,通(tōng)過日志(zhì)分析,可(kě)以大(dà)緻了解蜘蛛何時(shí)訪問你(nǐ)的網站(zhàn),可(kě)以更好地幫助你(nǐ)掌握網站(zhàn)的更新時(shí)間(jiān)和(hé)規律。
5。結合網站(zhàn)流量趨勢圖,當網站(zhàn)流量大(dà)幅下降,網站(zhàn)流量異常時(shí),需要了解分析蜘蛛是否在同一時(shí)間(jiān)段內(nèi)異常爬行(xíng),如返回碼是否正常,服務器(qì)是否穩定等。
通(tōng)過以上(shàng)的描述,我認為(wèi)您應該對網站(zhàn)日志(zhì)的重要性有(yǒu)一個(gè)大(dà)緻的了解,并對網站(zhàn)日志(zhì)進行(xíng)分析。
我們如何才能簡單地開(kāi)始分析日志(zhì)?下面是一個(gè)簡單的日志(zhì)來(lái)說明(míng):
#軟件:MicrosoftInternet信息服務6.0
版本1
#日期:2011-03-0100:00:17
#字段:日期時(shí)間(jiān)s-sitenames-ipcs-methodcs-uri-stemcs-uri-querys-portcs-usernamec-ipcs(用戶代理(lǐ))sc-statussc-substatussc-win32-statussc-bytes
2011-03-0102:44:37W3SVC381211.154.135.217get/news/news.aspid=20080-203.208.60.169Mozilla/5.0+(兼容;+Googlebot/2.1;++http://www.google.com/bot.html)20000029057298
搜索引擎蜘蛛:
百度:百度蜘蛛谷歌(gē):谷歌(gē)機器(qì)人(rén)msn:msnbot
雅虎:slurpyodao:youdaobotsogou:sogou+get+spider
在上(shàng)面搜索蜘蛛的名字,你(nǐ)就能看到蜘蛛的蹤迹。重要的是如何閱讀下面的代碼。我們稱之為(wèi)HTTP狀态代碼。
日期表示訪問記錄的日期;
時(shí)間(jiān)訪問時(shí)間(jiān);
s-sitename代表您的虛拟主機。
S-IP訪客IP;
cs方法是指訪問方法,有(yǒu)兩種常見的方法,一種是get,即我們通(tōng)常打開(kāi)一個(gè)url訪問操作(zuò),另一種是post,提交表單操作(zuò)時(shí);
cs-uri-step是要訪問的文件。
cs-uri查詢是指訪問地址參數(shù),如asp文件?下面的字符串id=12等等,如果沒有(yǒu)參數(shù),使用來(lái)表示;
S端口訪問的端口
cs用戶名訪問者名稱
C-IP源IP
CS(用戶代理(lǐ))訪問源;
SC狀态狀态狀态,200表示成功,403表示無權限,404表示404表示打不到該頁面,500表示程序有(yǒu)錯;
sc-substatus 服務端傳送到客戶端的字節大(dà)小(xiǎo);
cs–win32-statu客戶端傳送到服務端的字節大(dà)小(xiǎo);
*請(qǐng)認真填寫需求信息,我們會(huì)在24小(xiǎo)時(shí)內(nèi)與您取得(de)聯系。