現(xiàn)今,眾多SEO公司都提供SERP跟蹤服務(wù),何為SERP,百度百科的定義如下:
“SERP是Search Engine Results Page的首字母縮寫,即搜索引擎結(jié)果頁面。是搜索引擎對(duì)搜索請(qǐng)求反饋的結(jié)果,通常SERP包含搜索結(jié)果的左右兩側(cè),而不是單指哪一側(cè)。
SERP指搜索引擎(如Google或百度)對(duì)關(guān)鍵詞查詢的結(jié)果頁面。除了不同的搜索引擎,每個(gè)搜索引擎對(duì)于相同的關(guān)鍵詞查詢,可按結(jié)果的性質(zhì),返回不同的結(jié)果頁面,如圖片SERP、視頻SERP、新聞資訊SERP、博客SERP等。SERP上的站點(diǎn)排列順序,根據(jù)各個(gè)搜索引擎的不同算法計(jì)算并賦值。
搜索引擎優(yōu)(SEO)的主要目的之一是把企業(yè)(或組織)站點(diǎn)在SERP上的排名加以提升。”
而對(duì)于SERP的跟蹤,無非是通過搜索引擎提供的API或者程序的抓取來實(shí)現(xiàn),一般來說,如果通過API來實(shí)現(xiàn)的話,查詢量過多的話,是需要一定費(fèi)用的,而且有一些前提,一般是購買了搜索引擎提供商的競價(jià)服務(wù),并且有一定的門檻。
這樣來說的話,如何免費(fèi)的獲取SERP跟蹤信息成了大多數(shù)
seo外包服務(wù)商的研究課題,于是,普遍的方法出來了:使用蜘蛛程序去解析網(wǎng)頁獲取頁面排名結(jié)果。
對(duì)于頻繁抓取搜索引擎的排名數(shù)據(jù),這個(gè)毋庸置疑會(huì)受到其間歇性的屏蔽,導(dǎo)致抓取的排名數(shù)據(jù)不準(zhǔn)?如何解決?
個(gè)人提出以下幾個(gè)思路:
1,緩存處理。對(duì)于用戶已經(jīng)查詢過的關(guān)鍵詞及網(wǎng)址,存儲(chǔ)到臨時(shí)表中,不進(jìn)行實(shí)時(shí)查詢。
2,多臺(tái)服務(wù)器抓取。如果某臺(tái)服務(wù)器臨時(shí)抓取出錯(cuò),則換一臺(tái)服務(wù)器去嘗試抓取結(jié)果。
3,跨域的js進(jìn)行客戶端抓取。即cross-domain-scripting,這個(gè)應(yīng)該有一定的難度,至少還沒有發(fā)現(xiàn)有好的現(xiàn)成的解決方案。
4,做成c/s的的客戶端工具,從用戶網(wǎng)絡(luò)環(huán)境中獲取排名數(shù)據(jù),然后由用戶觸發(fā)保存到數(shù)據(jù)庫中。
至于技術(shù)上的實(shí)現(xiàn)問題,需要不斷的去嘗試及優(yōu)化獲取結(jié)果的性,終的目的是讓客戶平滑的看到SERP的排名信息。關(guān)于技術(shù)上的深入探討,歡迎繼續(xù)關(guān)注本人的后續(xù)文章。
”