百度颶風算法上線后,將于9月底推出微風算法,重點打擊網頁標題行為。從搜索引擎算法的發展歷史來看,標題一直是重要的排名標準之一。對于許多從事新聞傳播和自媒體的人來說,一個好的頭銜甚至是成功的一半。對于同一篇文章,另一個標題可能是100000+。
僅僅因為標題的重要性,那些欺騙用戶點擊標題的行為也非常普遍。用戶體驗極其糟糕,從長遠來看,這將對搜索引擎的聲譽產生不良影響。
例如,如果我想搜索并下載一本電子書,搜索結果的標題中有“下載”,但頁面上只有簡短的介紹,我根本找不到下載地址。當連續幾次搜索結果相同時,我感到憤怒并想發誓。
但是為了避免被算法擊中和誤傷,我們需要仔細閱讀百度算法的描述,自我檢查并糾正標題。
百度對標題的定義:
標題是指網頁代碼中標題部分的內容
百度對標題角色的描述:
請參閱標題以大致了解頁面內容的內容。
有兩種情況:
一、標題是假的。指標題表達與實際頁面內容不一致,涉嫌欺騙用戶的行為。
二、故意堆疊關鍵詞。指重復和重疊的關鍵字。
什么是虛假的或過分的?以百度為例。(只能理解,不能量化)
百度舉了五個例子:
虛假官方網站,非官方網站表示為官方網站。標題描述中有一個txt下載,但頁面不提供下載服務。標題被描述為一個新穎的下載,但應用程序是下載的。標題表明百度云下載并支持在線瀏覽,但頁面既不能下載也不能在線瀏覽。標題中的一些陳述是錯誤的。比如,網頁的標題顯示江蘇省有一所大學排名,但網頁上只有一份大學名單,沒有排名相關內容。
結論如下:
不要假裝或出現在官方網站上。必須完成標題中的下載或在線觀看。標題中的陳述形式應與實際內容一致。(例如,當提到排名時,應該有一個序列號列表,當提到趨勢時,應該有一個趨勢圖。)
我認為核心的標準是用戶不能點擊標題來瀏覽內容,感覺被欺騙了。
猜測百度能實現很好的語義識別功能,有一些現成的比較數據庫。
例如,當標題出現在官方網站上時,百度很容易與該品牌官方網站的地址進行比較。
如果標題提到了小說下載,百度也很容易分析后綴為TXT、ePub、Mobi、CHM、UMD等文件是否可以下載,還可以分析文件大小和命名規則。
所有的例子基本上都可以通過分析實際頁面中的元素來總結:你的標題是否欺騙了用戶。
此外,百度還可能利用跳出率、頁面停留時間等數據輔助判斷(個人猜測),虛假標題內容的后果非常嚴重。