2014年7月4日 星期五

【筆記】GA使用sampleRate參數

前些日子,因為公司流量太大,在Google Analytics(GA)的統計部份,被Google要求要想一下方法調整一下,後來使用設定sampleRate參數的方式改善。

我們部門責內的子系統也要調整,當時負責人員不是我,就沒有仔細研究那參數真正代表的意思。

但夜路走多了,總會遇到鬼的。(什麼比喻啊!XD)

最近負責的一項工作,就是和它扯上關係,於是花了一點時間把它搞懂,整理成「我能認知」的樣子。 在這篇How sampling works in Google Analytics中一開始提到,在GA使用抽樣(sampling):

「意指從樣本(設好某一比例的使用者)獲得網站流量資料或趨勢報告。在統計分析上,使用有效的抽樣資料所獲得的分析結果,和分析所有資料所獲得的結果,兩者是相近的。

另外,當網站流量太大時,只對某一比例的使用者抽樣分析,是可以增加報表處理的速度。」

analytics.js欄位說明中,說明使用sampleRate這個欄位時,可以決定多少百分比的使用者會被選中做為樣本,而我想知道的是,被挑選為樣本後,GA是怎麼對待這個使用者的。

然後從How sampling works in Google Analytics繼續看下去到這一句:「Data collection sampling occurs consistently across unique visitor」,這一段,就我要的重點。

我理解的意思是:「一旦某一個使用者被GA選入為資料收集的樣本,該使用者的瀏覽(visit),包含日後的瀏覽行為,都會傳送給GA」。

這樣的方式看起來是符合我的預想的。

沒有留言: