Google Panda Update是為了打擊低品質的網頁內容而有的演算法更新,根據這篇”Ranking in Google Now That Panda Has Gone Global“內容所說,這個Panda已經正式影響了全球英文網頁了,那麼中文何時會開始受到影響呢?
WebProNews這篇文章說到,在美國已經有許多網站陸續發現排名降級,並且許多人認為Google似乎把一些不夠專業內容的網站都往下拉。
Google資深工程師Amit Singhal說到,他們的演算法已經可以很準確的判斷「內容品質的高低」。
這是Google品質指南所說的:
(1)避免使用隱藏式文字與連結。
(2)請勿使用擬呼 (Cloaking) 或暗中重新導向使用者的功能。
(3)請勿提交自動查詢給 Google。
(4)請勿在網頁加入無關的關鍵字。
(5)請勿建立擁有大量相同內容的多個網頁、子網域或網域。
(6)請勿建立會做出惡意行為的網頁,例如,網上釣魚詐騙,或是植入病毒、特洛伊木馬程式或其他惡意程式。
(7)避免使用專為搜尋引擎建立的「入口」(Doorway) 網頁,或其他如聯盟計劃 (Affiliate Program) 這種極少或完全沒有原創內容的「俗套」方法。
(8)如果您的網站是某個聯盟計劃的一部分,請確定您的網站具有實際的價值。提供獨特、切題的內容,讓使用者會先瀏覽您的網站。
以上的項目,Google演算法是否都可以正確的抓出來呢? 答案是肯定的。
SEOmoz的文章”Google Told You So“也提到,反正只要把握一項原則,那就是Made for users (為了使用者而做),也就是你的內容是為了使用者而產生,而非是為了搜尋引擎,那麼大概就比較不會犯下錯誤。
Made for users (為了使用者而做)就不會犯下錯誤嗎?
但是其實雖然也許你都是為了使用者而做,但是如果沒有特別注意的話,很可能也會誤踏禁區,我們的會員限定(需登入帳密)的文章”如何才能不要碰觸禁忌的紅線?“、”如何處理多網址指向相同網頁的問題?“也都提過,因此並不是「為了使用者而做」就不會犯下錯。
那麼,Google Panda Update已經開始影響全球英文網頁,什麼時候會開始針對中文呢? 中文跟英文的差異在哪裡呢?
如果是針對上述的八項問題,其實並沒有中英文的問題,或是不同語言的問題,演算法可以一併處理,但是為什麼要強調「Google Panda Update已經開始影響全球英文網頁」呢?
最可能的原因是,Google Panda Update除了判斷低品質的內容,還有防止誤判的機制,以及最近Google推出的Personal blocklist、Clickstream、Google+1等等。如果防止誤判的機制以及相關配套完成,就可能會全球啟動Google Panda Update。
相關細節,後續再另外更新 …
[2011/4/13補記]
根據SearchEngineLand的這篇”Google Rolls Out Its Panda Update Internationally And Begins Incorporating Searcher Blocking Data“,因為Google抓到的低品質網頁中的網頁,與Personal Blocklist竟然有84%的重疊,也就是被使用者擋掉的網頁,很大比例跟演算法算出來的低品質網頁還蠻符合的,因此這些被使用者阻擋的網頁資料,將會當成補強參考(而非直接採用),也就是”searcher blocking behavior may be used as confirmation” (使用者的阻擋資料會用來確認)。
當然使用者阻擋的網頁資料不會是某個人的阻擋資料,而必須是大比例的被阻擋。因此也不必費心去把所有你的競爭者全部阻擋起來,全部拖出去斬了! 這就有些好笑了,只需要去阻擋真的是低品質的網站即可。
另外一個問題是,這個Google Panda Update會不會錯殺無辜? 如果你的網站被錯殺了,怎麼辦呢? 這個是我們後續會陸續探討的主題。
[2011/4/13再補記]
這篇報導”Google 擴大部署過濾垃圾內容的搜尋邏輯“的內容說:
Google於今年2月大幅調整其搜尋引擎邏輯,新的搜尋邏輯除了可降低品質不佳的網站排序外,也會拉抬品質較佳的網站排序。Google本周宣布已將該機制拓展到全球的英語系市場,並計畫將該機制拓展到各種語言的Google搜尋服務。
Google於今年2月大幅調整其搜尋引擎邏輯,目的是為了過濾垃圾網站,以降低品質不佳的網站排序,並率先於美國市場部署。不過,Google本周宣布已將該機制拓展到全球的英語系市場。
Google新的搜尋邏輯除了可降低品質不佳的網站排序外,也會拉抬品質較佳的網站排序。資深研究員Amit Singhal表示,最初的設計並未納入使用者透過Chrome擴充程式所封鎖的垃圾網站,但現在已在搜尋邏輯中加入那些由使用者封鎖且值得信賴的資料,這些改變也讓Google深入垃圾網站的長尾,以取得高品質的搜尋結果,這是以往的機制無法辦到的。
Singhal說明,新機制的原始設計會影響該站11.8%的查詢量,而此次的改變規模較小,僅會影響2%的查詢量。Google的內部測試發現該邏輯在偵測網站品質上非常準確,但若有業者認為自己的高品質網站受到新搜尋邏輯的影響,建議業者可參考Google所提供的品質準則說明,全面檢視網站的各部份。
Google計畫將該機制拓展到各種語言的Google搜尋服務,期間也會持續測試及改善該系統。
雖然Google並未公開賦予新機制任何名稱,但有不少媒體認為這應是Google繼去年上線的咖啡因(caffeine)之後,代號熊貓(Panda)的搜尋架構更新;因為咖啡因著重於搜尋索引的改善,以加速搜尋範圍及速度,而熊貓則能進一步過濾垃圾網站。
—————————-
上面的紅色標示到底是在講什麼呢? “但現在已在搜尋邏輯中加入那些由使用者封鎖且值得信賴的資料” … 應該是”但現在已在搜尋邏輯中加入那些由使用者封鎖且不值得信賴的資料“才對吧。
並且Google對於該演算法更新也是稱之為Panda algorithm update (如下圖)
至於為何叫做Panda? 我們以前已經說過了,就不再重覆。
[2011/4/14後記]
這篇Winners & Losers As Panda Goes Global? eHow, Bing’s Ciao.co.uk & More告訴我們經過Panda Update之後的勝利者與失敗者。
這個統計的資料來源是Sistrix,他列出了勝利者與失敗者各30個網站。
當然失敗者就是一些文章工場,專門大量產生低品質文字內容的網站,而勝利者大多是一些知名的品牌網站。
但是知名的品牌網站就應該獲得更高的相關性嗎? 大量產生文字內容的網站就一定是低品質嗎? 目前尚未可以全面來瞭解,也許等全球英文網頁都確定可以有效打擊低品質的內容之後,就會開始擴大到其他的語系。
[2011/04/19後記]
從這篇文章”Demand Media Reaffirms Outlook for Fiscal Year 2011“提到,許多報導關於eHow.com因這次Google Panda Update而降低流量,Demand Media表示非常不滿,他們說:
Certain third parties that have published reports attempting to estimate the effect of recent search engine algorithm changes made by Google on traffic to the Company’s owned and operated websites have significantly overstated the negative impact of those changes on traffic to eHow.com, as compared to the Company’s directly measured internal data. Recent search engine algorithm changes have negatively impacted search driven traffic to some of our websites, including eHow.com, resulting in moderately lower year-to-date page view growth for the Company’s owned and operated Content & Media properties compared to page view growth rates before the algorithm changes. Nevertheless, the Company currently expects that its year-over-year page view growth across its owned and operated Content & Media properties in the second quarter of 2011 will be comparable to, or greater than, the year-over-year page view growth achieved in the second quarter of 2010.
他們自己分析內部資料,認為許多報導過度誇大了Panda Update對他們的負面效應,他們說雖然有受到影響,但是他們在2011年第二季的成長將會比2010年同期要好。
如果把這些大量製造內容的英文網站翻譯成中文
不知G能否判斷喔?
请问,是否可以转载这篇文章到我的blog,非商业用途,会标注文章来源。
Dear wu
“把這些大量製造內容的英文網站翻譯成中文”當然Google就沒輒了
Dear 倪秋
沒問題的,只要能夠註明出處URL,都歡迎轉載喔
自動引用通知: Google Panda Update是否算成功達成任務? « 搜尋引擎 « 台灣搜尋引擎優化與行銷研究院:SEO:SEM
自動引用通知: Google Panda Update你應該知道的事[總整理] « 網路誌::數位‧網路‧社群::網路行銷與電子商務網站