Google Caffeine 正式上線

Google的官方部落格公佈了”Our New Search Index Caffeine“,宣稱Google Caffeine提供更新更多的搜尋資料,至於為何要推出新的索引資料架構呢? Google解釋因為網際資料成長太快,使用者希望能夠尋找到最新的相關資料,因此勢必要做個修正,新舊的架構差異描述如下:

如上圖描述,Google的舊架構以layer堆疊起來,每個layer的更新頻率不同,有些更新得快,也有些更新較慢,因此在抓取到資料到讓使用者搜尋,中間就會有顯著的延宕時間。

而新的Caffeine,把資料段切得更小,因此在新增與更新的效率上就會提升很多,因此使用者可以搜尋到更新的資料,這點跟real-time search有些相似,只是Caffeine還是有進行index,而real-time search並沒有。不過這個Caffeine已經可以縮短index的時間來說,已經在功能上躍進一大步。

這句話描述出了Google Caffeine的可怕: If this were a pile of paper it would grow three miles taller every second. Caffeine takes up nearly 100 million gigabytes of storage in one database and adds new information at a rate of hundreds of thousands of gigabytes per day. You would need 625,000 of the largest iPods to store that much information; if these were stacked end-to-end they would go for more than 40 miles.

Caffeine所索引的資料,如果以頁的長度來看的話,以每秒3哩成長,並在一個資料庫內有一億G的儲存,並且每天以數十萬G的速度成長,你必須有六十二萬五千個iPad來儲存這麼大的資料,如果堆疊起來可以達40哩 … 只能說 …. 哇!

你是否已經感覺到Google Caffeine的搜尋結果呢? Google Caffeine的推出對於SEO會有何衝擊呢? 我們再持續為您更新相關訊息了。

額外參考資料: Google’s new search index Caffeine goes live

在〈Google Caffeine 正式上線〉中有 5 則留言

  1. NewsFeed 回覆

    Google新搜尋架構咖啡因完成,搜尋索引更即時 

    http://www.ithome.com.tw/itadm/article.php?c=61691

    由於咖啡因改善了索引網路內容的速度,因此當一個新的部落格或論譠文章出現時,使用者將可比過去更快速地透過Google找到相關內容的連結。

    Google周二(6/8)宣布已完成新一代的搜尋架構─咖啡因(Caffeine)的索引系統 ,咖啡因除了是Google有史以來所提供規模最大的網路內容收藏外,其所提供的新訊息也比舊版索引多上50%。

    咖啡因是Google打造的新一代搜尋引擎架構,主要目的包括加大搜尋規模,以及改善索引速度、精確性,與全面性等,於去年8月開始邀請開發人員進行測試。

    Google軟體工程師Carrie Grimes說明了咖啡因索引系統與前一代索引系統的相異之處,指出舊版是由許多階層所構成,某些階層更新的速度快於其他層,但主要的階層平均數周才更新一次,為了更新舊索引的階層,Google必須分析整個網路,因此在新資訊現身及Google將其索引間存有不小的時間差。

    咖啡因的索引更新則採用全然不同的方式,Google針對小部份網路進行分析,而非一次分析整個網路,而且一天24小時持續更新其全球搜尋索引,因此,只要Google一發現新的網頁,就會直接把它加進索引中,這代表使用者比以前更容易找到更新的資訊。

    Grimes表示,咖啡因每秒可平行處理數十萬的頁面,這些頁面若用紙張堆起來有3哩高,同時咖啡因佔據了Google資料庫約1億GB的儲存空間,而且以每天數十萬GB的速度增加,必須要有62.5萬台最大容量的iPod才能儲存等量的資料。

    由於咖啡因改善了索引網路內容的速度,因此當一個新的部落格或論譠文章出現時,使用者將可比過去更快速地透過Google找到相關內容的連結。

    Grimes指出,咖啡因是為未來所設計,因此它不僅資訊較新,同時也是一個供Google打造更快速且更全面搜尋引擎的健全基礎,以配合網路上日益增加的資訊量,並提供更具關聯性的搜尋結果,未來幾個月Google將會持續改善該架構功能。

    不過,隨著新索引系統的完成,Google移除了先前開放測試的網頁,指出該公司相信咖啡因已準備就緒,很快就會更廣泛地啟用該服務。(編譯/陳曉莉)

  2. NewsFeed 回覆

    Google咖啡因索引 搜尋再加速

    法新社華盛頓9日電) Google將推出稱為「咖啡因」(Caffeine)的新一代網頁索引系統,搜尋功能會更快、更全面。
    Google軟體工程師葛林姆斯(Carrie Grimes)指出,這個系統已完成,可「更新網路搜尋結果快一半」,並提供「我們供應過最多的網頁內容」。

    葛林姆斯昨天晚間在部落格表示:「無論是新的報導、部落格或論壇文章,你現在可以在文章公布後找到相關內容的連結,比過去所有可能的速度還要快。」

    她說,Google打造咖啡因系統,以便「跟上網路演進,以及符合用戶愈來愈高的期待」。

    「有了咖啡因,我們把網路分成小部份分析,持續更新全球搜尋索引,一旦發現新網頁或現存網頁的新資訊,可以直接將其加入索引。」(譯者:中央社林仟懿)

    http://news.msn.com.tw/news1737965.aspx

  3. 自動引用通知: Google Caffeine, Mayday Update 代表什麼意義? « Seo專欄文章 « 台灣搜尋行銷部落

  4. 自動引用通知: 2011年 Google 大預測 « Seo « 台灣搜尋引擎優化與行銷研究院:SEO:SEM

  5. 自動引用通知: Google Caffeine與Pagerank是否互相衝突? « Seo « 台灣搜尋引擎優化與行銷研究院:SEO:SEM

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *