說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
參加了搜索營銷大會,聽了seo幾位牛人的演講,個人而言還是很有一些感想的,尤其是對百度算法的分析尤其讓我小激動了一把。本來想把講師的PPT整過來的,可無奈于人家版權所有,拒絕分享給大家,只能偷偷的在電腦上拍下了一部分。經過整理,挑選了一個和大家分享一下!
其實,是說一下在GOMX大會上中讓我感興趣的一個百度算法,百度是如何判斷一個百度賬號是垃圾賬號的。嚴格說來這個算法應該說是針對口碑的更多一些,可是作為以百度為研究對象還經常會用到百度賬號的我們,怎么著我都有理由去好好研究一番這個算法。大概我們都欲將富奧這樣的情況:在某一次發百度知道的時候,問題或答案被刪掉之后,在以后無論我們發什么問題或者回答都會被刪掉,而且不管是我們投訴也好,申訴也罷總之賬號是不能用了。而且不管你的等級有多高,都是如此。那么這個原因是什么呢?(說到這里,我都覺得痛心疾首啊,這一張PPT我竟然沒有拍到~~~)
其實百度是有專門的算法來針對這些的。它的具體算法是這樣的:
一、同一賬號發布信息所對應的地點數量大于預定閥值;
二、同一賬號發布信息頻率大于預定閥值;
三、同一賬號發布信息所間隔的時間相等;
四、同一賬號發布的多個信息具有相同的內容;
五、發布信息的內容中包含指向低質量網頁的網址;
六、發布信息的內容中包含廣告特征的字符串。
(哎,幸虧我有一個好記性,對感興趣的內容幾乎過目不忘,沒有PPT,還能整理這樣全,爾等不必羨慕~哈哈)
我們可以具體的來分析一下,從這些算法中我們可以看出一些端倪,對我們做百度口碑推廣還是很有幫助的。算法中的點,我們姑且不計較那個預定閥值是多少,我們只需要記得不要把賬號在多個地點登陸對了,不是么?然后第二點,發布信息的頻率問題,我們似乎也不必在意預定閥值是多少,只要記得一個賬號發布信息的頻率不要過于頻繁對了。
接著是發布信息所間隔的時間問題,這個應該是針對軟件批量發布信息而出的算法,因為除了機器能夠發布信息間隔的時間相等,我們人為的應該是不可能做到的。但是還是可以借鑒一下,比如我們要用軟件發布信息,我們可以把時間設置成隨機,這樣避免了這一算法。然后看第四點,很明顯我們要杜絕用一個賬號打天下的事情發生,因為百度已經注意到這些單賬號英雄了!至于鏈接問題,沒什么說的,因為現在能帶鏈接的實在是少之又少!
一點,我覺得是值得研究和關注的。發布信息的內容中包含廣告特征的字符串,我們其實可以總結一下的,從平時那些被刪掉的內容中找出那些具有相同特征的詞,然后在后期進行避免。這是一個完善的過程,我們總會整理出一批有特征的字符串來的!
推薦閱讀
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732