上篇文章談到Latent Semantic Analysis, 指出目前Latent Semantic尚未有大規模的影響, 但是影響已經逐步會顯示出來, 我們利用實際例子來看看到底可能有什麼影響?
有老外的文章舉了例子, 然後最後的結論是Google也沒有Latent Semantic的應用, 他的說法是:
在Google Search上, Results about 825,000,000 for car, Results about 99,600,000 for automobile, 因為automobile查詢中沒有包括car的資料, 所以Google沒有使用Latent Semantic技術
這個分析可以說根本不科學, 使用者使用CAR去查詢, 未必想連AUTOMOBILE也一起查, 同樣的以AUTOMOBILE去查詢, 也未必想以CAR也一起查詢
比較能夠說服的說法是: 如果使用者想查與CAR的所有相關資料, 是否有界面可以讓使用者來利用呢?
很遺憾的是目前的搜尋引擎Google,Bing, Yahoo等, 對於中文的隱性語意是比較弱的, 因為還沒有完整的關聯字庫與演算法, 所得到的結果沒有英文來得好
但是我們來看以下的例子:
我們用Google Wonder Wheel來看, 以「搜尋引擎優化」與「搜尋引擎最佳化」來看, 如下:
以上的「搜尋引擎優化」與「搜尋引擎最佳化」已經可以透過「SEO」這個詞來串起來, 當時”SEO關鍵解碼“出版時, Google Wonder Wheel還沒有中文資料, 才幾個月的時間, Google中文語意資料庫已經逐步備齊了
所以類似的情況下, 未來的SERP未必會以keyword為主要依據, 很可能根本沒有出現keyword也可能因具備Latent Semantic(隱性語意)而出現在SERP中
我們再來看看英文Google的例子, 使用Tilde(流水符號)來查詢Google, 以「~mp3」來查詢, 發現「music」也被當成keyword(如下圖)
所以你認為Latent Semantic(隱性語意)是否已經在Google開始運作了呢? 答案當然是肯定的, 只是一般使用者還沒有察覺出來, 而Bing/Yahoo的英文也已經俱備相關詞的查詢(如下圖)
Yahoo的MP3查詢
Bing的MP3查詢
這些搜尋引擎對於Latent Semantic的準備工作已經逐步就位, 就等適當時機推出更符合人性的使用者界面
如果你認為那麼我在網頁利用關鍵字充塞(Keyword stuffing)來把所有相關的keyword都包含起來, 不就可以應付Latent Semantic的趨勢了嗎? 相關詞只是隱性語意的一部分, 後面再來談這個問題了 …