說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
在開始前先簡單的給大家講解一點小知識:
域名和IP相當于站點的名字和,IP相當于現如今的,但是IP地址很難記,所以產生了域名。這里不是給大家普及歷史知識,只是現在大多數情況下都采用域名來訪問所以導致大家忽略了一個事實:終尋址的是號碼也是IP,不是域名!來看個域名解析的簡化過程圖.
通過這里大家應該明白一些了吧?域名只是方便我們記憶,而真正的尋址的應該是IP!大家都知道域名DNS服務器在全球有N個節點,我們新域名剛解析的時候常會碰到某些區域因為DNS數據同步慢而導致訪問不了的情況,而老域名換IP的時候也會碰到用戶訪問的還是老IP的想象。這你都知道?別急你還有不知道的!
然而我們的搜索引擎蜘蛛大多數分布式抓取,自身都建有DNS,一來解決抓取的時候的效率,不必每次都要解析IP后抓取,二來我們站點的主體表現形式都是域名,而不是IP,所以帶著我們的域名host頭去訪問我們的老IP還是會訪問的到,因此會導致我們開頭提到的一些奇葩怪象。說完基本概念,我們再來詳細分析一下這幾個怪象的具體成因!
一、網站改版了還收錄舊的URL地址
這個問題其實跟上面的基礎沒啥太大關系,但每天在百度站長社區問的人實在是太多了,也算是收錄的一大奇葩現象,所以在這里還是拿出來叨一下。
很多站長網站改版了啟用了新的URL結構,也在站長平臺進行了改版提交,但是還是出現收錄舊的URL,遇到這個問題首先我們還是從站點自身的問題找起:
1.是否已經去除所有舊地址入口?
這是個嚴肅的問題,很多朋友因為站點大、結構復雜、改版不徹底導致并沒有去除所有入口頁面,導致新內容產生的同時在一些角落里還是產生了老的入口,只要鏈接地址還是老的有可能被收錄。所以要改版要換URL必須徹頭徹尾的把所有鏈接替換為新的URL。為了加速生效新的鏈接除了站點自身鏈接外盡可能修改一下外部的鏈接,例如友情鏈接。
2.老的URL是否做了301到新的URL上?
老的URL是否真的是301到新的URL上面?我也遇到一些奇葩的朋友使用js之類的技術,看起來好像也是跳轉,也像那么回事,但其實根本不是一回事!
3. 關于百度方面
在做好1和2的基礎上,即使百度收錄了舊的鏈接,也不必擔心,因為百度對跳轉屬性的站點和鏈接識別和確認需要一定的時間,而且只要是穩定的跳轉,終都會轉換成新鏈接的流量,當然記得通過網站改版工具及時提交改版規則。
二、測試網址無緣無故被收錄了導致了正式網址不被收錄
這里我建議大家以后測試的時候盡量環境保證本地或者在特定測試環境下才能訪問,否則現在的各種瀏覽器可能會把地址透露出去,也有不小心把地址拿去搜索等渠道導致被搜索引擎收錄那么對你的站點上線影響還是蠻大的。
1.沒有關閉測試服務器
上面普及知識有提到過,大家換IP或者換URL地址的時候因為老的服務器沒有關閉,而搜索引擎緩存了IP,導致搜索引擎還是可以訪問到這些頁面;
2.沒有刪除IIS綁定
還有一些朋友換了IP地址,但是并沒有在老的IP上的網頁服務器上刪除網站綁定,導致搜索引擎帶HOST頭訪問該IP的時候能夠訪問到舊的內容;
一般情況下搜索引擎緩存的時候較長,或者因cdn等因素導致IP同步失敗的都會導致上述情況發生,更換ip以后,可以通過抓取診斷工具測試一下百度是否能夠正確抓取,如果解析到的ip有誤,可點擊抓取診斷詳情中的“報錯”,通知百度更新您站點的ip。
三、換IP后導致百度不收錄
上面提到搜索引擎會緩存IP,百度在換IP的時候也說過盡量保證老服務器一段時間內可以訪問,為什么要這樣?因為服務器真的需要時間去同步內容同步IP,而且直接斷了老的服務器很容易導致短時間突發404,因此會給站點造成不可預估的問題;
換IP后不收錄原因也是這樣,因為換了新服務器數據遷移后導致老服務器的內容并沒有更新,所以這個時候其實是百度根本抓取不到你的更新。因此需要通過上面的方式盡快告訴百度,您站點ip的變動,減少站點流量損失。
轉自:百度站長平臺
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732