說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
接著上文,一般在站內優化的過程中,sitemap的位置都是直接放在網站的根服務器下的。例如 http://www.example.com/sitemap.xml下的sitemap不可包含來自 http://subdomain.example.com 的 URL。但如果使用的是端口的路徑,也需要把端口的號作為路徑中的一部分,包含在所有的sitemap的各個URL路徑中,比如如果網站是http://www.example.com:100/,則sitemap列明的URL則都必須以具有100端口號的URL為開頭。
在一定的情況下,某些公司因為更新權限等策略的問題,也許給操作人員一定的目錄層級下的權限。比如說,如果我有權限變更http://example.com/path/的URL資訊,而這個時候的sitemap也位于http://example.com/path/sitemap.xml下。在其中被歸納為有效的URL應該類似于http://example.com/path/show?item=23,http://example.com/path/show?item=233&user=3453等,其中無效的舉例為:http://example.com/image/show?item=23(跨目錄),https://example.com/catalog/page1.html(https://通訊協議不標準)。
交叉提交
交叉提交的意義在什么地方,搜索了一下,對于為什么要這么做的技術文檔十分少,查閱到可信服的:當一個站點的二級域名數量達到一個相當大的值的時候,不可能為每一個站點去做sitemap提交的,驗證每一個站點的所有權,所以有意義用到交叉提交了。這一點和我猜想的差不多,是便于管理,而現在的百度站長平臺不是每一個驗證的站點都能做sitemap提交的,目前這個功能還不對所有的站點都開放。所以可以用有提交權限的站點做這件事情了,HOHO。
比如說手上有3個站點,一個主站,兩個二級域名,分別的域名和對應的sitemap文件名為:
www.mainhost.com,Sitemap 文件 sitemap-mainhost.xml
www.host1.com,Sitemap 文件sitemap-host1.xml
www.host2.com,Sitemap 文件sitemap-host2.xml
將所有的sitemap放在擁有提交權限的站點下,即:
http://www.mainhost.com/sitemap-mainhost.xml
http://www.mainhost.com/sitemap-host1.xml
http://www.mainhost.com/sitemap-host2.xml
然后通過修改www.host1.com和www.host2.com的robots.txt文檔,將其指向www.mainhost.com中的sitemap,可以間接證明擁有這2個站點的所有權。這個時候可以通過主站提交所有的sitemap了。
讓搜索引擎知道我們的sitemap
3種方式,前2種是我們現在常用的。種是大家耳熟能詳的站長工具的提交頁面提交sitemap,第二種是robot.txt中指定位置,為此,添加下列行:Sitemap: http://www.example.com/sitemap.xml。此指令不受 user-agent 行的影響,因此可放在文件中的任意位置,不過一般我們放在末尾,沒什么講究。
種用HTTP請求的方式,要和服務器的知識有些關聯,我也不會,所以不贅述,直接粘貼過來,有興趣的請自己研究。
通過 HTTP 請求提交 Sitemap
要使用 HTTP 請求提交 Sitemap(使用搜索引擎提供的網址替換 <searchengine_URL>),請將請求發送到下列網址:
<searchengine_URL>/ping?sitemap=sitemap_url
例如,如果 Sitemap 位于http://www.example.com/sitemap.gz,則網址將變為:
<searchengine_URL>/ping?sitemap=http://www.example.com/sitemap.gz
網址編碼 /ping?sitemap=: 之后的所有內容
<searchengine_URL>/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.gz
您可以使用 wget、curl 或其他您選擇的機制發出 HTTP 請求。請求成功的話會返回 HTTP 200 回應代碼;如果收到其他回應,則應重新提交請求。HTTP 200 回應代碼僅表示搜索引擎已收到您的 Sitemap,并不表示 Sitemap 本身或其中包含的網址有效。完成此操作的簡單方法是設置自動執行的任務,定期生成并提交 Sitemap。
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732