Search needs a shake-up : 搜尋的未來應該如何呢?

八月 9, 2011

網路上有一篇文章"Search needs a shake-up“,談到目前主流搜尋引擎實在無法滿足搜尋的需求,文章中說到Google已經在正確的方向踏出了「小小的一步」,並且Bing跟Wolfram Alpha也都一樣,並沒有與Google有太大的不同,我們來看看作者到底是想說什麼吧 …


這篇文章的作者是Oren Etzioni,他是美國華盛頓大學Turing Center的主任,也是Decide.com的共同創辦人。第一個職務讓他的文章顯得非常有見地,但是第二個身份就讓他的文章略有廣告之嫌。

Turing Center的主要研究方向是"Investigating problems at the crossroads of natural language processing, data mining, Web search, and the Semantic Web." 研究自然語言處理、資料採礦、網路搜尋、語意網路。

修習資訊相關科系的人大概都知道Alan Turing這個人,他可以說是計算機科學之父,他的Turing machine可以說是最早具有智慧的機器,所以這個Turing Center顧名思義就是希望做出一個有智慧的搜尋機置

Oren Etzioni身為Turing Center的主任,當然在資訊科技界也應該具有一定的分量的,但是當你知道Oren Etzioni也是Decide.com的共同創辦人,這篇文章的力度就有些「掉漆」了 … 因為Decide.com也是在做搜尋的一家公司(如下圖),只不過他們是做商品搜尋。

Google的Matt Cutts也趁機提出來給大家酸他一翻,說Oren Etzioni那篇在Nature的文章竟然還需要USD$32才能看 … 讓一大堆人跳出來說Oren Etzioni根本是假學術之名在替自己的公司宣傳。

不過如果你對Oren Etzioni的文章有興趣的話,你可以免費取得:

http://turing.cs.washington.edu/papers/Nature_search_shake-up.pdf

我們就來看看Oren Etzioni說了什麼,到底說得是否正確吧!

文章說到Information Extraction(資訊擷取)方面,Google/Bing/Yahoo等等搜尋引擎都沒有做好,只有做到極小的部分。

我們在"Metaweb 被 Google 併購,語意搜尋會有何變化?“也說到Google買下了MetaWeb,而在"Bing 與 Wolfram Alpha 合作,提供精準搜尋“說到Bing與Wolfram Alpha的合作,並且Microsoft買下PowersetApple買下Siri … 這些現象都顯示各大公司對於搜尋這方面的重視,但是為何沒有太大的進展呢?

文章中只有肯定IBM Watson的成就,而IBM也正在研究是否Watson能否用在更廣泛的用途上,而不僅止於參加遊戲問答。

為什麼各大搜尋引擎無法在Information Extraction(資訊擷取)獲得更大的進展呢? 問題就出在網際網路上的資料是非結構性的,以及沒有應用自然語言處理技術。

所以其實Oren Etzioni的說法是有道理的,並且他舉出了兩個應用Reverb SearchRevminer

Reverb Search(如下圖)

Revminer(如下圖)

以上這兩個東西就是在進行Information Extraction(資訊擷取),而不是只是抓網頁資料進來索引,而我們之前提過的Common TagMicrodata就是希望把非結構的資料盡量變成結構性的資料,讓機器可以讀取,也就是把Web data變成Machine readable(機器可讀取)。

而我們在Decide.com輸入"camera"之後(如下圖),確實出現了選購產品的不錯參考資訊。

不過其實類似的服務原本也都已經有,例如Google Squared與台灣的FindPrice (如下圖)

(註: Google Squared 已經停止服務,原因: 未知)
Google Squared

FindPrice

所以Oren Etzioni雖然點出了未來搜尋應該走的方向,但是其實目前大家都還沒有真正做到,就算Oren Etzioni自己創立的公司也沒有比Google有更好的進度,問題就在於大多Web Data還沒有真正變成結構化之前,誰也沒有辦法精確的進行Information Extraction(資訊擷取)。

而當大家都採用結構化標準之後,所有的業者就能夠開始進行精確的資訊擷取,開始比的就變成自然語言處理與應用面的比賽了。

說了半天,搜尋的未來應該如何呢?

就是會從搜尋出來條目列表,進化到提供從條目列表中擷取出來的資訊,也就是往Answering Questions(回答問題)發展。

對於企業來說就必須讓自己的網頁內容更加結構化,才能符合未來的需求,但是什麼才是「結構化的網頁」呢? 我們以前許多文章都已經談過了,未來我們會再提供更多比較簡單的內容來跟各位解釋了,敬請期待囉。

2 留言

於 Search needs a shake-up : 搜尋的未來應該如何呢?.

敬請留言

你的回應對我們是很重要的. 你的電子郵件將不會被公開.

請等待 ...
*
Loading Facebook Comments ...