百度在谷歌推出panda算法和企鵝算法之后,也推出了自己的一套打擊垃圾信息頁面的算法,主要是針對一些利用和放大web2.0發展中的一些開源cms,bbs,blog等程序存在漏洞的作弊群發垃圾信息的一些建議和方法,其中主要分為五個大的方面:
1、與網站或論壇版塊主題不符的內容.
2、欺騙網站詐取分帳式廣告收益的內容.
3、欺騙搜索引擎用戶的內容.
4,惡意利用web2.0網站為自己做推廣、謀福利的內容.
5,有違法律法規的不良信息,如詐騙中獎聯系方式、虛假聯系電話、不良信息。
?????? ?對于網站內容來說,最常見的作弊方式就是搜索一個主題,被誘惑的標題吸引,進入卻發現完全不是我們想要的信息,或者內容也能夠相關,但是強行的插入大量的關鍵詞或廣告信息,或者沒有大量的信息,但是通過采集和工具式的偽原創得出的文章,完全不顧用戶的感受,這樣的內容頁面也是垃圾信息頁面,用來欺騙用戶真正需求,這里還對于視頻內容也做了舉例,這個例子就是利用視頻網站的漏洞,建立視頻文件發布,實際上看似是一個電影集,但是卻只是不到一分鐘的短片,目的當然是發外鏈,這樣的頁面也建議刪除掉。
??????? 對于垃圾信息頁面最致命的其實不是上面的那些認定,這些認定有時候不那么好做到,最致命的要屬于就是百度給網站主的一些建議,特別是針對論壇博客,建議刪除垃圾內容,提高注冊用戶門檻,限制機器注冊,重點對用戶發布內容和行為進行監控,減少垃圾內容的產生。
?????? 上述只是站長對百度打擊垃圾信息頁面算法的一些粗淺分析,和大家共勉。