Google knowledge graph (知識結構圖) 是什麼?

Knowledge Graph (知識結構圖)是Google推出的新功能,根據Google在”Introducing the Knowledge Graph“的說法,為了讓使用者瞭解真實的世界以及其間的關係,所以有了這個知識結構圖 …

Knowledge Graph也有人翻譯成~ 「知識圖譜」或是「知識圖表」。

但是還是覺得「知識結構圖」或是「知識關係圖」比較能夠表示這裡Graph的真正意含。

因為「圖譜」已經在許多領域有既定的用法,指的是有系統性分類的圖集,而「圖表」則跟graph意義差更遠。

graph的意義是指: A graph in this context is a collection of “vertices” or “nodes” and a collection of edges that connect pairs of vertices. A graph may be undirected, meaning that there is no distinction between the two vertices associated with each edge, or its edges may be directed from one vertex to another … 意思就是由「節點」與連接節點的「邊」所組成,具有方向性或是沒有方向性的結構,稱之為graph。

「節點」就是vertices或是nodes,「邊」就是edges。 例如下圖就是一個沒有方向性的graph:

下圖就是一個具有方向性的graph:

為什麼Google要把knowledge跟graph加在一起? 知識具有graph的什麼特性呢?

知識(knowledge)是由訊息(information)而來的,訊息就好像是「節點」,而訊息跟訊息之間的「邊」就是關係,這個關係可能有方向性,也可能沒有方向性。透過「邊」的連接,就讓「節點」與「節點」產生了某些關係。

例如,我們來看看下面的影片介紹

上面的說明中,提到一個例子,我們想知道諾貝爾獎有多少女性得主?

我們就可以從「諾貝爾獎」這個節點出發,找到關係為「得獎者」的節點,並且這個「得獎者」的節點必須是具有「女性」屬性。

而這些資料其實原本就在Google的資料中心,只是沒有解構出「節點」、「邊」、與「屬性」,現在Google推出knowledge graph,表示已經完成了一部分的graph關係,並且可以解析使用者的query (查詢),瞭解使用者到底想問什麼。

例如你搜尋~ tallest building in the world (世界最高的建築),你就可以看到如下的內容,左邊是一般的搜尋結果,右邊是特別整理出來的knowledge panel (知識面板),這個右邊的面板並不是所有的問題查詢都會出現。

但是如果你想查詢~ greatest president in the world (世界最偉大的總統),對不起 … Google也不知道。

其實這些東西,很早WolframAlpha就已經提供了。

如下圖,如果你一樣搜尋tallest building in the world … WolframAlpha直接給你答案。

但是如果你問wolframalpha ~ greatest president in the world (世界最偉大的總統),他會告訴你不合邏輯,因為總統是以國家為單位,沒有一個人是世界的總統 … 哈,還蠻有道理的。

如果你問~ greatest president of United States (美國最偉大的總統),他會避重就輕,只回答你 美國的總統,因為他不知道誰是美國最偉大的總統。

所以許多訊息談到Google knowledge graph,都把這個東西說得太出神入化了,其實Google在這個時間點推出來,有點在提醒大家不要只是一直注意Facebook IPO的味道。

Google在”Introducing the Knowledge Graph: things, not strings“說到,一個完美的搜尋引擎是要真正瞭解你要什麼,並且給你真正想要的東西。意思就是我們Google是一個完美的搜尋引擎,不要只注意Facebook。

但是Google也還算誠實,他也說到”And we can now sometimes help answer your next question before you’ve asked it, because the facts we show are informed by what other people have searched for.” 我們『有時候』能夠在你還沒有提問之前,就知道你想問什麼,因為我們呈現給你的事實是其他人已經搜尋過的。

所以,Google能提供的是已經大家經常詢問的問題,或是已經有人整理過的,Google並沒有那麼厲害自己去推理出來各物件的關係,也許以後可能,但是現在只能做到一小部分。

這篇“Google Launches Knowledge Graph To Provide Answers, Not Just Links“也說到,Google knowledge graph是一個big change (大的改變) 沒有錯,但是還不至於讓使用者有振奮的感覺。

Google目前已經對於五億個物件(object)整理出來35億個事實(fact),並且大多屬於下列的類型: 演員、導演、電影、藝術品或是博物館、城市或是國家、島嶼、湖泊、燈塔、音樂專輯或是音樂團體、星球或是太空航空器、雲霄飛車或是摩天大樓、 運動團體 … 等等,也就是目前Google knowledge graph並不是所以問題都能夠回答。 其實Google knowledge graph的技術,我們在”搜尋引擎的語意趨勢,你準備好了嗎?“就談過了,他就是透過Semantic Web而產生的結果。

還有一個同樣的老問題,為什麼只有英文的內容才有呢? 除了因為中文的複雜度比較高之外,沒有足夠的可結構性資料來產生適當的物件(object)與事實(fact)也是一個問題,還有一個更重要的問題是~ Google是美國的公司。所以,要等到有中文內容的Google knowledge graph,大概還有得等了。

在〈Google knowledge graph (知識結構圖) 是什麼?〉中有 2 則留言

  1. 陸益思 回覆

    中文做不出來,不只是 Google 是美國公司,而是中文大部份 “單一個” 字是沒有意義的,它們必需經過斷詞,也就是把一個句子拆成多個 “詞” 而不是 “字”。

    搜尋時我們可以藉由 “字” 去找出文章,但是問語意時,這個就沒有辦法了。

  2. 自動引用通知: Knowledge Graph與Social Graph的對決 « Sem搜尋引擎行銷 « 台灣搜尋引擎優化與行銷研究院:SEO:SEM

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *