由 Alexa 統計數據觀察假流量與假搜尋

十一月 20, 2009


(圖一)

Alexa的統計資料是許多網路分析的重要參考, 我們在前文"PageRank, BrowseRank, AlexaRank“已經探討過, 因此許多網站莫不希望在Alexa的統計數據漂亮一些而開始動手腳, 但是卻可能是反效果 …

如上面的Alexa Time on Site (平均停留時間)統計資料, 有沒有看出奇怪之處? 為了避免爭議, 我們拿掉了domain name的資料, 所以並沒有指出是什麼網站的統計數據

正常的統計都是呈現自然的不規則曲線, 但是卻有兩條線有幾乎直線的狀況 … 為什麼會這樣呢?

要知道原因必須先瞭解Alexa的數據來源, 當使用者的瀏覽軟體安裝Alexa Toolbar後, 就成為Alexa的統計樣本, 你的網路瀏覽數據就進入Alexa的資料中心

因此當然Alexa的統計只算是抽樣, 然後由這些樣本中去推估某個網站的流量數據, 所以如果你把某個網站的Alexa數據單獨來看, 他是不準確的, 但是如果以幾個網站來比較, 相對比較的結果是可以信賴的

也就是說, 你以Alexa的PageViews pers User來看某個網站A, 如果其值是3, 你不能肯定的說網站A平均每位網友瀏覽了3頁, 但是如果另外一個網站B的PageViews pers User是5, 那麼你可以說網站B的平均每位網友瀏覽頁數高於網站A的平均每位網友瀏覽頁數, 當然未必百分之百準確, 但是準確度是目前最有公信力的

雖然也有人質疑Alexa的數據處理不夠精準 (Alexa Toolbar and the Problem of Experiment Design), 但是前面說過, 以單獨資料的失誤來說Alexa不準確, 也不夠科學

我們如果把Alexa的資料與Compete的資料拿來對照, 大概就能夠知道資料的準確度

如下圖二, 我們把ChinaTimes, UDN, TVBS的流量拿來比較


(圖二)

兩個不同資料來源的統計, 都是UDN > ChinaTimes > TVBS, 並且差距比例都類似, 且由於Alexa的資料量比Compete齊全, 所以Alexa的統計在每個時間點都有, 因此曲線的呈現比較有變化

所以基本上, 我們在假設Alexa的統計精準情況下, 來分析假流量與假搜尋

當網站的流量很少時, 人為的數據就很容易影響Alexa的PageViews per User, Bounce rate, Search Percentage的數字呈現

例如狀況A: 某網站的某日有50個自然的Visitors, 平均每個人只有瀏覽1頁, 如果這個網站造假了另外50個Visitors, 並且平均都瀏覽了10頁, 這時原本PageViews per User就從1跳到5.5

狀況B: 如果某網站的某日有5000個自然的Visitors, 平均每個人只有瀏覽1頁, 如果這個網站造假了另外50個Visitors, 並且平均都瀏覽了10頁, 這時PageViews per User還是在1左右

所以同樣做假一樣的量, 狀況A的數據就很容易被改變, 如果每天作假 …. PageViews per User的曲線就可以看出不自然的數據

又因為人為的數據大多透過電腦自動送出資料, 如果沒弄好就會出現如圖一的不自然直線

我們再來看下面的統計圖 (六個月內的統計資料), 同樣也拿掉domain name資料


(圖三)

從上圖的直線區域或近似直線區域, 可以看出疑似作假的假流量與假搜尋

我們再來看下面的統計圖 (一個月內的統計資料), 同樣也拿掉domain name資料


(圖四)

從上面一個月內的資料看, 也可以看出在一個月之內的可疑資料, 有些在六個月內的統計可以看出作假, 有些可以在一個月內的統計資料看出來 …

因此想要透過人為的方式來製造假流量與假搜尋是吃力不討好的事情, 還是好好經營網站內容才是正道 … 而且很難保證什麼時候搜尋引擎會開始處理假流量的問題

我們在"SEO關鍵解碼“提到影響搜尋引擎排名的三大原因: 關鍵字相關性, 網站信賴度, 網頁流量

「關鍵字相關性」又可以分成「內容相關」,「外部相關」,「QDF」等因素, 這點相信很多都還是以關鍵字密度與連結Anchor text來操作, 但是都忘記了「品質」的問題, 因此到最後則亂做一通

「網站信賴度」則與PageRank, 收錄量 … 等因素有關係, 其操作是比較不容易

所以最後最容易操作的就只有「網頁流量」, 許多出現在SERP前面的網站, 根據觀察結果, 有很多是透過製造假流量與假搜尋來完成, 所以很多人才會疑問: 「為什麼這些網頁完全看不出來排到前面的原因」, 有些是真的流量, 但是大半都是假流量

關鍵字相關性, 網站信賴度, 網頁流量這些因素, 透過人為操作確實可以欺騙過搜尋引擎, 但是很難逃過仔細的分析, 雖然獲得了漂亮的SERP, 但是卻損失了信譽 (或者至少應該做的自然一點)

以上只是初略的來研究Alexa的統計資料, 並且假設Alexa的統計數據是精準的, 如果有其他看法來解析造成直線的原因, 歡迎討論交流 …

敬請留言

你的回應對我們是很重要的. 你的電子郵件將不會被公開.

請等待 ...
*
Loading Facebook Comments ...