近,elischwartz,一個外國的SEO從業者,分享了他使用Splunk的經驗。以下是elischwarz(“我”)分享的經驗:
想必,每一位對SEO技術感興趣的站長都希望從更深層次上了解谷歌搜索引擎的網站結構和排名規則。從我多年學習SEO技術的經驗來看,深入分析網站訪問日志可以幫助我更好地了解搜索引擎是如何“瀏覽”網站的,在很多網站分析工具中,Splunk無疑是讓我放心和實用的一個。
注:Splunk是機器數據的引擎。可用于收集、索引和利用由所有應用程序、服務器和設備(物理、虛擬和云中)生成的快速移動的計算機數據。
監控網站URL是否被Google crawler捕獲(Baidu spider和Yahoo crawler也可以被監控)
當網站生成新頁面時,網站管理員關心的是頁面包含問題。如果將快照作為一個指示器,則可能是Google crawler抓取快照以確定它是否包含在內的幾天(甚至幾周)之后。如果你想快點,可以直接在搜索引擎中搜索相關頁面的標題。
有效的方法是檢查網站日志,以確定該網頁是否已被谷歌抓取。是時候用Splunk了。
具體步驟:
一、首先,選擇要查詢的時間段。時間越短,響應速度越快,所以查詢的時差應該盡量縮短。
二 、在查詢框中輸入以下查詢語句:
Index={thenameofyournindex}urlstub和googlebot
404頁是一件很煩人的事情。98%的訪問者在看到404頁時會直接關閉頁面。這樣,你的網站不僅幾乎失去了內容或產品的展示,用戶還在心里默默地給你一個不好的評價。你:你稍后會來我們的網站嗎?用戶:哈哈。
對于404頁,您可以選擇使用screeningfrom等工具查找修復。但如果無效頁面太多,則應分析事實日志。通過日志解析,可以找到大多數人訪問的404個頁面,并選擇修復頁面或跳轉。
設置Splunk以查找404頁:
一、首先,選擇搜索時差。我通常把它設為30天。你可以隨意設置。
二、在查詢框中輸入以下查詢語句:
Index={thenameofyourindex}狀態=404 | toplimit=50uri
這個限度可以由你自己決定。我更喜歡設置為50個網址。執行完查詢語句后,單擊statistics以查找列表中訪問者多的404頁。
與301跳轉不同,302跳轉屬于臨時重定向。然而,在許多鏈路值測試中,302可以通過測試,并且有排名。但因為幾年前,很多黑帽SEO通過這種技術獲得排名,現在很多搜索引擎都加大了對它的攻擊。因此,302跳轉只能用于那些只需要執行臨時跳轉的頁面。