文章目錄
1. 前言:解開數據差異的關鍵鑰匙
2. 基礎概念:什麼是 GA4 的「報表識別資訊」?
前言:解開數據差異的關鍵鑰匙
許多行銷人員與網站分析師在使用 Google Analytics 4 (GA4) 時,最頭痛的問題之一,莫過於報表上的數據與後台系統、廣告平台兜不攏。成交數少了、使用者數多了,這些數據差異,直接侵蝕了您對分析結果的信任,讓每一次的成效會議都充滿了不確定性。
問題的根源,可能指向一個設定是「報表識別資訊」。它深藏於 GA4 的管理設定中,決定了 GA4 如何辨識、縫合一位使用者在不同裝置、不同工作階段中的行為旅程。這項設定是數據準確性的基石,一旦設定錯誤,後續的所有分析都可能建立在不穩固的基礎上。
本篇文章將扮演您的數位分析顧問,深入淺出地解析「報表識別資訊」的設定如何導致數據的巨大差異,在下篇透過兩個截然不同、來自真實客戶的案例,提供清晰的解決方案。
基礎概念:什麼是 GA4 的「報表識別資訊」?
我們必須先理解 GA4 如何識別與追蹤使用者。「報表識別資訊」是一項策略性設定,它決定了 GA4 如何將使用者在手機、電腦、App 之間的零散互動,整合成一段連貫且有意義的顧客旅程。GA4 主要透過以下幾種「識別空間 (Identity Spaces)」來達成這個目標。
- User-ID: 這是最精準的識別方式。它並非由 GA4 自動產生,而是必須由網站自有的會員系統(例如 CRM 或資料庫中的會員編號)提供。當使用者登入網站時,網站將這個獨一無二且匿名的 ID 傳送給 GA4。User-ID 的最大優勢在於,它能夠準確地將同一位會員在不同裝置(手機、平板、電腦)上的行為歸屬於同一個人,提供最完整的跨裝置行為輪廓。
- 裝置ID (Device ID): 這是 GA4 基礎的識別方式。在網站上,它對應的是儲存在瀏覽器中的 Client ID (一段儲存在 Cookie 裡的隨機字串);在應用程式中,則是 App Instance ID。它的限制非常明顯:如果同一位使用者早上用公司電腦、晚上用個人手機瀏覽您的網站,Device ID 會將其視為兩位不同的使用者,導致使用者數量被高估,且無法分析跨裝置旅程。
| 選項名稱 | 運作方式與適用情境 |
|---|---|
| 混合(Blended) |
【最全面的視圖,但有模型推估】依序使用 User-ID → 裝置 ID → 模型。此為 GA4 預設選項,試圖透過所有可用的識別方法,提供最全面的使用者視圖。 適用於:擁有會員登入系統,且希望最大化跨裝置追蹤準確性的網站。 |
| 已列為觀察項目(Observed) |
【僅呈現可觀測數據,排除推估】依序使用 User-ID → 裝置 ID。運作方式與「混合」相似,但排除了機器學習的模型推估數據,只呈現可被系統直接觀測到的資料。 適用於:重視數據的直接可觀測性,不希望報表中包含演算法推估成分的分析場景。 |
| 依據裝置(Device-based) |
【最接近原始數據,用於診斷】僅使用裝置 ID(Cookie)來識別使用者,完全忽略所有其他識別方式。此方式會高估獨立使用者數量,但能有效避免因 User-ID 觸發的資料閾值(Thresholding)問題。 適用於:與 BigQuery 等原始數據進行核對,或在懷疑 User-ID 實施有誤時進行診斷。 |
請注意:GA4 在 2024 年 2 月 12 日進行了一項重大更新,將 Google 信號從報表識別資訊的計算中移除,旨在大幅減少「資料閾值」問題。
現在,我們已經掌握了基礎知識。在下篇,讓我們看看這些設定在真實世界的客戶場景中,如何造成巨大的數據差異。

