說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
隨著科技的進步和發展,互聯網在現代社會中,廣泛被人們認可和重視。網絡營銷也掀起了一次高潮。在所有網絡推廣方法中,搜索引擎是大家談論多的,于是我們的推廣之旅也將從這里開始。
確實,搜索引擎是網絡推廣中的一個非常強大的武器,如果我們想很靈活的掌控它,那么我們首先必須先了解它。
我們要了解它是如何工作、如何分類、如何查詢等一系列問題,而且搜索引擎像人一樣各不相同,所以對于如此特別重要的引擎來說,我們還需要了解它的個性。
1、兩個基本的詞匯:搜索引擎(SearchEngine)是通過運行一個軟件,該軟件在網絡上通過各種鏈接,自動獲得大量站點頁面的信息,并按照一定規則進行歸類整理,從而形成數據庫,以備查詢。這樣的站點(獲得信息==>整理建立數據庫==>提供查詢)我們稱之為“搜索引擎”。而所使用的軟件一般叫做“Spider”、“crawlers”等。分類目錄(Directory):通過“人工方式”將站點進行分類而建立數據庫,以提供查詢,這樣的站點叫著“分類目錄”。典型的搜索引擎如AltaVista、Excite、HotBot、Inktomi等,而重要的分類目錄是 Yahoo。
實際上無論“搜索引擎”還是“分類目錄”,目標都一樣:獲得網站資料,建立數據庫提供查詢。只不過使用的方法不同。
“搜索引擎”因為依靠軟件自動進行,因此,其數據庫的容量非常龐大,但是伴隨著查詢結果往往不夠;而“分類目錄”由于依靠人工分類,查詢得到的信息要準確些,但收集的內容非常有限。
我們平時把這兩類統稱為“搜索引擎”,在下面的討論中我們將以“自動”的搜索引擎為主,至于“人工”的如Yahoo,我將會在“中文Yahoo”中單獨討論。
2、主要的搜索引擎:
七個主要的搜索引擎及各自包括的頁面數:引擎AltaVistaNorthernLightInktomiExciteLycosInfoseekWebCrawler頁面數(百萬頁)1501251105550452(以上數據為1999年2月1日統計值)
3、搜索引擎的主要工作:
步是“Spider”軟件訪問一個站點,并通過其中的鏈接閱讀該站點的頁面,而且“Spider”會不時的自動回訪該站點以檢查變化情況;該 “Spider”獲得的站點信息形成一個巨大的網絡信息庫,如同整個網絡上已經訪問站點的備份,當然記錄的不是所有的內容;這也是我們所說的數據庫。第二步是查詢服務。這是通過查詢軟件實現的,當你輸入查詢內容,該軟件會在其數據庫中找到相關內容,然后按照“它的”規則進行排序。
4、搜索引擎在查詢時是如何排名的:
這個主要的是根據一個站點的內容與查詢詞的關聯程度,但是一個站點的內容搜索引擎又是如何確定的呢?
——標題(Title)、關鍵詞(Keywords)、描述(Description)、頁面開始部分的內容以及這些內容本身之間的關聯程度。而且現在絕大部分搜索引擎都支持MetaTag。
另一個主要因素是一個站點在整個網絡上的關聯程度,也是說一個站點在網絡中其他站點出現的次數(LinkPopularity)。
雖然不同的搜索引擎有各自的“游戲規則”,但是請記住“關聯程度”這個詞,包括站內和站外的(整個網絡)。
接下來我們來談一談搜索引擎的原理是什么?
搜索引擎的原理基本分做三步:
步:從互聯網上搜集信息
網絡蜘蛛Spider,是一個很形象的名字。把互聯網比喻成一個蜘蛛網,那么Spider是在網上爬來爬去的蜘蛛。網絡蜘蛛是通過網頁的鏈接地址來尋找網頁,從網站某一個頁面(通常是首頁)開始,讀取網頁的內容,找到在網頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個網頁,這樣一直循環下去,直到把這個網站所有的網頁都抓取完為止。
第二步:整理信息、建立索引數據庫
由分析索引系統程序對收集回來的網頁進行分析,提取相關網頁所在網址鏈接、編碼類型、頁面內容包含的關鍵詞、關鍵詞位置、生成時間、大小、與其它網頁的鏈接關系等信息,根據一定的相關度算法進行大量復雜計算,得到每一個網頁針對頁面內容中及超鏈中每一個關鍵詞的相關度(或重要性),然后用這些相關信息建立網頁索引數據庫。
第三步:在索引數據庫中搜索排序、接受查詢
當用戶輸入關鍵詞搜索后,由搜索系統程序從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁。因為所有相關網頁針對該關鍵詞的相關度早已算好,所以只需按照現成的相關度數值排序,相關度越高,排名越靠前。
,由頁面生成系統將搜索結果的鏈接地址、頁面內容摘要等內容,組織起來返回給用戶。網絡蜘蛛(spider)一般按照各搜索引擎的周期不同,可能是幾天、幾周或幾月,也可能對不同重要性的網頁有不同的更新頻率,要定期重新訪問所有網頁,更新網頁索引數據庫,以反映出網頁內容的更新情況,增加新的網頁信息,去除死鏈接,并根據網頁內容和鏈接關系的變化重新排序。這樣,網頁的具體內容和變化情況會以更新的形態,反映到用戶搜索查詢的結果中。
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732