搜索引擎會給每個頁面賦予一定的權重值,這個權重值會隨著頁面的更新和時間的推移而變化。如今,SEO自學網帶給你的是“TF-IDF算法”,SEOER應該在索引創建過程中充分利用加權方法。我希望這個搜索引擎優化技術培訓將幫助你。
1、 蜘蛛的爬行和爬行、索引創建中頁面的收集和索引是用戶搜索關鍵字時顯示頁面的基本步驟,其中索引創建包括頁面本身內容的權重因子。
索引項的權重在一定程度上反映了文檔中詞的相對重要性。在索引排序過程中,這個值通常用來計算得分,這是影響搜索引擎排序的重要因素之一。
索引項的權重值由檢索模式下的權重分量根據文檔統計結果計算得出。
TF-IDF是傳統檢索模式中常用的加權方法。
2、 TF-IDF算法①TF-IDF算法的定義
TF-IDF算法,根據一個文檔中索引項的數量或頻率以及整個文檔集中索引項的頻率,將二者結合起來(或二者的乘積)。
整個文檔集中索引項的頻率稱為正常文檔頻率,簡稱IDF。
TFIDF的核心思想是一個詞或短語在文檔中出現的頻率較高,在索引庫中的其他文檔中出現的頻率較低,因此認為該詞或短語具有良好的分類能力,可以用于分類。
簡而言之,一個詞或短語是一個索引詞。對于這篇文章,這個詞將被賦予更高的權重。
例如,“twnm seo”這個短語是由little classroom提出的。在本文中“twnm seo”屬于我的網站優化,這個短語的頻率很高。同時,之前沒有人提到過這個短語,所以對于這個文檔,“twnm seo”這個詞被賦予了非常高的正確值。
3、 理解和使用TF-IDF算法就足以讓SEOER理解上述知識。不需要知道使用哪個函數或公式來計算結果。
事實上,通過TF-IDF算法的學習,我們可以更好的理解一些SEO常識知識。
品牌詞一般是我們自己創造的,滿足了TF值大、IDF值大、頁面權重高、自然排名容易的需要。
無數的網站正在優化同一個詞,但主頁的位置是有限的。每個人都對TF滿意,但是IDF越小,優化單詞就越困難。
這就是為什么百度搜索結果被認為是關鍵詞優化的難點之一。
我們應該挖掘一些沒有百度索引的詞,但是這次需要保持一定的搜索量,這樣才能降低優化的難度,帶來更多真實的流量。
根據TF-IDF算法,很多人希望通過增加關鍵詞密度或頻率來增加TF值,從而獲得更好的排名。不過,這種方法可以做得很好,但超過一定程度,就不好了,但可能是由于搜索引擎的力量積累過多!
所謂2%-8%的關鍵詞密度只是一個一般范圍。很多排名好的頁面都在2%以下,當然也有超過8%的頁面。只要密度不太小,就不要太在意這個。
例如,它的密度已經是5%。如果你不故意把它堆到8%,甚至20%,它就會變得毫無意義。這是對TF high的誤解。
也就是說,我們可以從TF-IDF算法中得到的啟示是,我們不應該讓關鍵詞密度或頻率(TF)太低。但是,對于IDF,我們只能通過查找具有高IDF值的關鍵字來進行優化。如果我們優化的關鍵字的IDF值已經很低,我們就無法改變這種情況。IDF值越低,就越難在一定程度上證明該詞是的。
因此,在網站優化的過程中,除了做好頁面的優化外,還需要注意內外鏈的優化。
4、 TF-IDF算法公式①TF公式
TF(I,J):文檔I中關鍵字J的頻率。
N(I,J):關鍵字J出現在文檔I中的次數。