說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預(yù)警
實時把握輿情動態(tài)精準(zhǔn)追溯信息源頭
pagerank算法 pagerank算法是什么
在做網(wǎng)站的過程當(dāng)中,相信許多人都遇到過pagerank算法,然而這種算法究竟是一種什么樣的說法,這種說法又該如何使用呢?接下來我們就一起來好好的了解一下吧。
pagerank算法——pagerank算法是什么
PageRank的創(chuàng)始人拉里佩奇(LarryPage)和謝爾蓋.布林(SergeyBrin),在1998年提出了該算法,并應(yīng)用在Google搜索引擎的檢索結(jié)果排序上,該技術(shù)也是Google早期的核心技術(shù)之一,是Google用來衡量一個網(wǎng)站好壞的標(biāo)準(zhǔn)。
PageRank是一種在搜索引擎中根據(jù)網(wǎng)頁之間相互的鏈接關(guān)系計算網(wǎng)頁排名的技術(shù)。Google用該技術(shù)來標(biāo)示網(wǎng)頁的等級或者重要性。PageRank的級別從1級到10級,PR值越高說明該網(wǎng)頁越受歡迎(即越重要)。
PageRank近似于一個用戶,是指其在Internet上隨機(jī)地點擊鏈接將會到達(dá)特定網(wǎng)頁的可能性,是一個概率。通常,能夠從更多地方到達(dá)的網(wǎng)頁更為重要,因此具有更高的PageRank。
查看某網(wǎng)頁的PageRank值可以安裝Google工具條并啟用PageRank特性,或者在firefox安裝SerchStatus插件,或者在http://pr。chinaz。com中查詢。
pagerank算法如何使用
下面將介紹網(wǎng)頁重要程度的定量計算,也就是計算PageRank的值。
1.PageRank簡單計算模型
假設(shè)一個有只有四個頁面組成的集合:A,B,C,D。如果所有的頁面都鏈接向A,那么A的PR值將是B,C,D的和:
繼續(xù)假設(shè)B也有鏈接到C,并且D也有鏈接到包括A的三個頁面。每次鏈接都相當(dāng)于對其所連接頁面重要性的一次投票,一個頁面不能投票兩次。所以B給每個頁面投半票。以同樣的邏輯,D投出的只有三分之一給了A,那么
換句話說,根據(jù)鏈接出的總數(shù),平分一個頁面的PR值:
其中PR(A)表示頁面A的PageRank值,L(B)表示頁面B鏈接出的總數(shù)。
PageRank簡化模型:
可以把互聯(lián)網(wǎng)上的各網(wǎng)頁之間的鏈接關(guān)系看成一個有向圖。假設(shè)沖浪者瀏覽的下一個網(wǎng)頁鏈接來自于當(dāng)前網(wǎng)頁。建立簡化模型:對于任意網(wǎng)頁Pi,它的PageRank值可表示為如下:
PRi:網(wǎng)頁i的PageRank值
PRj:網(wǎng)頁j的PageRank值
Lj為網(wǎng)頁j的對外鏈接數(shù)
Bi為所有鏈接到網(wǎng)頁i的網(wǎng)頁的集合
在實際的網(wǎng)絡(luò)超鏈接環(huán)境下沒有那么理想化,PageRank會面臨兩個問題:RankLeak和RankSink。
1.RankLeak:一個獨立的網(wǎng)頁如果沒有外出的鏈接就會產(chǎn)生等級泄露。
解決辦法:
(1)將無出度的節(jié)點遞歸地從圖中去掉,待其他節(jié)點計算完畢后再加上。
(2)對無出度的節(jié)點添加一條邊,指向那些指向它的頂點。
2.RankSink:整個網(wǎng)頁圖中的一組緊密鏈接成環(huán)的網(wǎng)頁如果沒有外出的鏈接就會產(chǎn)生RankSink
以上就是pagerank算法如何使用的所有內(nèi)容,對于一個網(wǎng)站來說了解和學(xué)會pagerank算法是一個非常重要的知識點,所以大家一定要重視,請各位還想了解更多與之有關(guān)的內(nèi)容,歡迎關(guān)注我們文軍營銷的官網(wǎng)。
推薦閱讀
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732