用 2023 年 SEJ 的一些最佳商品來慶祝節日。
我們的節日回顧系列從 12 月 21 日持續到 1 月 5 日,每日解讀重大事件、基本面、可行的策略和思想領袖的觀點。
2023 年 SEO 行業發生了很多事情,我們的貢獻者撰寫了一些精彩的文章來跟上並反映這些變化。
回顧 2023 年的最佳讀物,讓您在邁入 2024 年時有很多思考的空間。
PageRank 曾經是搜尋的核心,也正是它讓 Google 成為今天的帝國。
即使您認為搜尋已經從 PageRank 發展而來,但不可否認的是,它在行業中已經成為一個普遍的概念已有一段時間了。
所有 SEO 專業人士都應該充分了解 PageRank 的過去和現在仍然是什麼。
在本文中,我們將介紹:
- 什麼是PageRank?
- PageRank 演變的故事。
- PageRank 如何徹底改變搜尋。
- PageRank 工具列對比網頁排名
- PageRank 的工作原理。
- PageRank 如何在頁面之間流動。
- PageRank 還在使用嗎?
讓我們深入了解一下。
什麼是PageRank?
PageRank 由 Google 創辦人 Larry Page 和 Sergey Brin 創建,是一種基於網路上所有超連結的綜合相對強度的演算法。
大多數人認為這個名字是基於拉里·佩奇的姓氏,而其他人則認為「Page」指的是網頁。 這兩種立場可能都是正確的,而且重疊可能是故意的。
當佩奇和布林在史丹佛大學時,他們寫了一篇論文,標題為: PageRank 引用排名:讓網路秩序井然。
該論文發表於 1999 年 1 月,展示了一種相對簡單的評估網頁強度的演算法。
該論文在美國成為專利(但在歐洲則不然,因為歐洲的數學公式不可申請專利)。
史丹佛大學擁有該專利,並將其轉讓給Google。 該專利目前預計將於 2027 年到期。
PageRank 演變的故事
1990 年代末在史丹佛大學期間,布林和佩奇都在尋找資訊檢索的方法。
當時,使用連結來確定每個頁面相對於另一個頁面的「重要性」是一種革命性的頁面排序方式。 這在計算上很困難,但絕對不是不可能的。
這個想法很快就誕生了谷歌,當時谷歌在搜尋領域還只是一個小公司。
在某些方面,機構對谷歌的做法抱持著如此多的信心,以至於該公司最初推出搜尋引擎時並沒有產生收入的能力。
雖然 Google(當時稱為「BackRub」)是搜尋引擎,但 PageRank 是它用來對搜尋引擎結果頁面 (SERP) 上的頁面進行排名的演算法。
Google之舞
PageRank 的挑戰之一是數學雖然簡單,但必須進行迭代處理。 該計算在每個頁面和每個互聯網連結上執行多次。 在世紀之交,這個數學計算需要幾天的時間來處理。
在此期間,Google SERP 上下波動。 這些變化通常是不穩定的,因為每個頁面都會計算新的 PageRank。
這被稱為“Google Dance”,眾所周知,每次 Google 開始每月更新時,它都會停止當天的 SEO。
(Google Dance 後來成為 Google 在其山景城總部為 SEO 專家舉辦的年度聚會的名稱。)
信任的種子
PageRank 的後來迭代引入了一組「信任種子」的想法來啟動演算法,而不是為互聯網上的每個頁面提供相同的初始值。
合理的衝浪者
該模型的另一次迭代引入了“合理的衝浪者”的想法。
該模型表明,頁面的 PageRank 可能不會與其連結到的頁面均勻共享,但可以根據使用者點擊每個連結的可能性來衡量每個連結的相對價值。
PageRank 的撤銷
谷歌的演算法最初被認為在內部“無法發送垃圾郵件”,因為頁面的重要性不僅取決於其內容,還取決於頁面上的連結產生的某種“投票系統”。
不過,谷歌的信心並沒有持續太久。
隨著反向連結產業的發展,PageRank 出現了問題。 因此穀歌將其從公眾視野中撤下,但仍繼續依賴它進行排名演算法。
PageRank 工具列於 2016 年退役,最終所有對 PageRank 的公共存取都減少了。 但到了這個時候,Majestic(一種 SEO 工具)已經能夠很好地將自己的計算與 PageRank 關聯起來。
多年來,Google 一直透過「Google 指南」文件以及 Matt Cutts 領導的垃圾郵件團隊的建議,鼓勵 SEO 專業人士避免操縱鏈接,直到 2017 年 1 月。
谷歌的演算法也在這段時間發生了變化。
該公司對 PageRank 的依賴程度較低,在收購 MetaWeb 及其專有的知識圖譜(2014 年稱為「Freebase」)後,Google 開始以不同的方式對世界資訊進行索引。
PageRank 工具列對比網頁排名
最初,谷歌對其演算法感到非常自豪,以至於它很樂意與任何想看到它的人公開分享其計算結果。
最引人注目的代表是 Firefox 等瀏覽器的工具列擴展,它為每個網頁顯示 0 到 10 之間的分數。
PageRank 實際上有更廣泛的分數範圍,但 0-10 為 SEO 專業人士和消費者提供了一種即時方法來評估網路上任何頁面的重要性。
PageRank 工具列讓演算法非常明顯,但這也帶來了複雜性。 特別是,這意味著連結顯然是「博弈」谷歌的最簡單方法。
連結越多(或更準確地說,連結越好),頁面在 Google SERP 中針對任何目標關鍵字的排名就越高。
這意味著形成了一個二級市場,以出售連結的 URL 的 PageRank 來買賣連結。
當雅虎發布了一個名為「雅虎搜尋資源管理器」的免費工具時,這個問題變得更加嚴重,該工具允許任何人開始查找任何給定頁面的連結。
後來,Moz 和 Majestic 這兩個工具在免費選項的基礎上建立了自己的網路索引並分別評估連結。
PageRank 如何徹底改變搜尋
其他搜尋引擎嚴重依賴單獨分析每個頁面的內容。 這些方法幾乎無法區分有影響力的頁面和簡單地用隨機(或操縱)文字編寫的頁面之間的差異。
這意味著其他搜尋引擎的檢索方法對於 SEO 專業人員來說非常容易操縱。
因此,Google 的 PageRank 演算法是革命性的。
結合相對簡單的「nGrams」概念來幫助建立相關性,Google 找到了一個成功的公式。
它的表現很快就超過了當時的主要競爭對手,例如 AltaVista 和 Inktomi(為 MSN 等提供支援)。
透過在頁面層級進行操作,Google 還發現了一種比Yahoo 和後來的DMOZ 採用的基於「目錄」的方法更具可擴展性的解決方案,儘管DMOZ(也稱為開放目錄專案)最初能夠為Google提供一個開源的解決方案。 自己的目錄
PageRank 的工作原理
PageRank 的公式有多種形式,但可以用幾句話來解釋。
最初,Internet 上的每個頁面都有一個估計的 PageRank 分數。 這可以是任何數字。 從歷史上看,PageRank 以 0 到 10 之間的分數向公眾呈現,但實際上,估計不需要在此範圍內開始。
然後將該頁面的 PageRank 除以該頁面上的連結數量,得到較小的分數。
然後將 PageRank 分發到連結的頁面,並且對 Internet 上的所有其他頁面執行相同的操作。
然後,對於演算法的下一個迭代,每個頁面的新 PageRank 估計值是連結到每個給定頁面的所有頁面分數的總和。
該公式還包含一個“阻尼因子”,它被描述為網路衝浪者完全停止瀏覽的機會。
在演算法的每次後續迭代開始之前,建議的新 PageRank 都會減少阻尼因子。
重複此方法,直到 PageRank 分數達到設定的平衡。 為了方便起見,所得數字通常會轉換為更容易識別的範圍 0 到 10。
用數學方式表示這一點的一種方法是:
在哪裡:
- PR = 演算法下一次迭代中的 PageRank。
- d = 阻尼係數。
- j = Internet 上的頁碼(如果每個頁面都有唯一的編號)。
- n=網路上的頁面總數。
- i = 演算法的迭代(最初設定為 0)。
此公式也可以用矩陣形式表示。
公式的問題與迭代
該公式存在一些挑戰。
如果一個頁面沒有連結到任何其他頁面,則公式將不平衡。
因此,在這種情況下,PageRank 將分佈在 Internet 上的所有頁面中。 這樣,即使沒有入站連結的頁面也可以到達 一些 PageRank,但它不會累積到足夠顯著的程度。
另一個較少記錄的挑戰是較新的頁面,儘管可能 月 比舊頁重要,它的 PageRank 較低。 這意味著隨著時間的推移,舊內容可能會擁有不成比例的高PageRank。
演算法中不考慮頁面處於活動狀態的時間。
PageRank 如何在頁面之間流動
如果一個頁面以 5 開頭並有 10 個鏈接,則它鏈接到的每個頁面都會被賦予 0.5 PageRank(減去阻尼係數)。
透過這種方式,PageRank 在迭代之間在互聯網上流動。
當新頁面到達網路時,它們一開始只有少量的 PageRank。 但隨著其他頁面開始連結到這些頁面,它們的 PageRank 會隨著時間的推移而增加。
PageRank 還在使用嗎?
儘管 PageRank 的公開訪問已於 2016 年被取消,但 Google 搜尋工程師仍然可以使用該分數。
Yandex 使用的因素的洩漏表明 PageRank 仍然是它可以使用的因素。
Google 工程師建議用一種需要更少計算處理能力的新方法來取代 PageRank 的原始形式。 儘管該公式對於 Google 如何對頁面進行排名不太重要,但對於每個網頁來說它仍然是一個常數。
無論 Google 可能選擇調用哪些其他演算法,PageRank 至今仍可能內建在這家搜尋巨頭的許多系統中。
Dixon 在此影片中更詳細地解釋了 PageRank 的工作原理:
進一步閱讀的專利和原始文件:
更多資源:
特色圖片:VectorMine/Shutterstock