伊人成人久久精品综合,亚洲无a码一区二区三区四区,久久国产A√无码专区亚洲

關于我們

客戶地區(qū)分類案例行業(yè)分類

客戶案例

pagerank原理有哪些？

　通過對由超過 50,000 萬個變量和 20 億個詞匯組成的方程進行計算，PageRank 能夠對網(wǎng)頁的重要性做出客觀的評價。PageRank 并不計算直接鏈接的數(shù)量，而是將從網(wǎng)頁 A 指向網(wǎng)頁 B 的鏈接解釋為由網(wǎng)頁 A 對網(wǎng)頁 B 所投的一票。這樣，PageRank 會根據(jù)網(wǎng)頁 B 所收到的投票數(shù)量來評估該頁的重要性。
　　此外，PageRank 還會評估每個投票網(wǎng)頁的重要性，因為某些網(wǎng)頁的投票被認為具有較高的價值，這樣，它所鏈接的網(wǎng)頁就能獲得較高的價值。重要網(wǎng)頁獲得的 PageRank（網(wǎng)頁排名）較高，從而顯示在搜索結果的頂部。Google 技術使用網(wǎng)上反饋的綜合信息來確定某個網(wǎng)頁的重要性。搜索結果沒有人工干預或操縱，這也是為什么 Google 會成為一個廣受用戶信賴、不受付費排名影響且公正客觀的信息來源。
　　其實說白了就是民主表決。打個比方，假如我們要找李開復博士，有一百個人舉手說自己是李開復。那么誰是真的呢？也許有好幾個真的，但即使如此誰又是大家真正想找的呢？:-) 如果大家都說剛從 Google 離職的那個是真的，那么他就是真的。
　　在互聯(lián)網(wǎng)上，如果一個網(wǎng)頁被很多其它網(wǎng)頁所鏈接，說明它受到普遍的承認和信賴，那么它的排名就高。這就是 Page Rank 的核心思想。當然 Google 的 Page Rank 算法實際上要復雜得多。比如說，對來自不同網(wǎng)頁的鏈接對待不同，本身網(wǎng)頁排名高的鏈接更可靠，于是給這些鏈接予較大的權重。Page Rank 考慮了這個因素，可是現(xiàn)在問題又來了，計算搜索結果的網(wǎng)頁排名過程中需要用到網(wǎng)頁本身的排名，這不成了先有雞還是先有蛋的問題了嗎？
　　Google 的兩個創(chuàng)始人拉里•佩奇（Larry Page ）和謝爾蓋•布林 (Sergey Brin) 把這個問題變成了一個二維矩陣相乘的問題，并且用迭代的方法解決了這個問題。他們先假定所有網(wǎng)頁的排名是相同的，并且根據(jù)這個初始值，算出各個網(wǎng)頁的第一次迭代排名，然后再根據(jù)第一次迭代排名算出第二次的排名。他們兩人從理論上證明了不論初始值如何選取，這種算法都保證了網(wǎng)頁排名的估計值能收斂到他們的真實值。值得一提的事，這種算法是完全沒有任何人工干預的。
　　理論問題解決了，又遇到實際問題。因為互聯(lián)網(wǎng)上網(wǎng)頁的數(shù)量是巨大的，上面提到的二維矩陣從理論上講有網(wǎng)頁數(shù)目平方之多個元素。如果我們假定有十億個網(wǎng)頁，那么這個矩陣就有一百億億個元素。這樣大的矩陣相乘，計算量是非常大的。拉里和謝爾蓋兩人利用稀疏矩陣計算的技巧，大大的簡化了計算量，并實現(xiàn)了這個網(wǎng)頁排名算法。今天 Google 的工程師把這個算法移植到并行的計算機中，進一步縮短了計算時間，使網(wǎng)頁更新的周期比以前短了許多。
　　網(wǎng)頁排名的高明之處就是它把整個互聯(lián)網(wǎng)當作了一個有機的整體。它無意識中符合了系統(tǒng)論的觀點。相比之下，以前的信息檢索大多把每一個網(wǎng)頁當作獨立的個體對待，很多人當初只注意了網(wǎng)頁內(nèi)容和查詢語句的相關性，忽略了網(wǎng)頁之間的關系。
　　今天，Google 搜索引擎比最初復雜、完善了許多。但是網(wǎng)頁排名在 Google 所有算法中依然是至關重要的。在學術界, 這個算法被公認為是文獻檢索中最大的貢獻之一，并且被很多大學引入了信息檢索課程 (Information Retrieval) 的教程。

【返回】