以往許多網站都在擔心搜尋引擎是否能夠正常處理AJAX與Javascript的內容,現在Google的演算法已經可以正常的索引這些動態的內容了,可是還有一些但書需要注意,我們來探討一下這些細節 … SearchEngineLand透露Matt Cutts在Twitter上說到Google已經可以處理AJAX跟Javascript (如下圖)
其實之所以Google會想處理AJAX跟Javascript,完全是因為被Facebook逼出來的,因為許多Facebook的訊息都是透過這個方式,如果Google想抓這些訊息,就不得不想出辦法來。
Google想要抓這類動態訊息,其實是從2009/10/7的這篇文章開始~”A proposal for making AJAX crawlable“。
在這個問題探討中,認為可能的辦法是由搜尋引擎抓取時去執行所有的Javascript並索引所有的狀態,或是由伺服端在搜尋引擎抓取時去執行自己的Javascript。
如果採取第一種方式,Google在索引時會累翻,並且無法知道應該索引哪個狀態,變成需要索引各種狀態,因此這個並不是好方法。
第二個方式是由伺服端確認要索引哪個狀態,透過headless browser執行然後呈現給搜尋引擎。
所謂headless browser是指沒有介面的瀏覽軟體,他執行結果並不是要給人看的,而是由伺服端來執行Javascript,把結果丟給另外一個程式,這個跟Javascript是由client端執行,然後顯示結果給瀏覽者有些不同。
所以這個訊息說Google可以索引AJAX與Javascript內容嗎? 其實Matt Cutts是說: Google已經「有能力」去抓到「某些」動態留言內容。
Google有能力做到,但是他未必每個網站都會去抓,如果你的條件不符合他抓取,他仍舊不會抓,就算條件都符合,也要看有無抓取的必要。
而且Matt Cutts只說去抓到「某些」動態留言內容,這個「某些」其實就是Facebook這類大咖網站的動態內容啦。 總而言之,跟我們在2009年”SEO趨勢 : Javascript 會影響搜尋引擎抓取?“所說的一模一樣,搜尋引擎是否處理你的Javascript,完全看你的內容是否值得處理。
所以是否你的網站完全可以任意的使用AJAX跟Javascript呢? 其實不全然是這樣,如果你在意某些內容必須索引的話,還是儘可能的避免使用AJAX跟Javascript。