👋🏻 Ce document présente les différences entre GA4 et BigQuery en termes d'affichage des données dans l'interface utilisateur (UI) et les limitations de chaque solution.
Catégorie
GA4
BigQuery
Portée des données
📊 Données agrégées
📊 Données au niveau de l'événement
Méthode d'accès aux données
🖥️ Interface Google Analytics
🖥️ Console GCP ou autre application de reporting
Cardinalité élevée
⚠️ Limitation de 500 valeurs uniques par jour
✅ Aucune limite de cardinalité
Échantillonnage
📐 Échantillonnage possible dans les rapports d'exploration
✅ Accès à 100% des données
Le Thresholding
ℹ️ Seuils de données pour protéger l'identité des utilisateurs
🚫 Aucun seuil de données
Attribution basée sur les données
📊 Attribution basée sur des règles et sur les données
🚫 Pas directement accessible
Modélisation des conversions et comportementale
ℹ️ Utilise des données modélisées dans les rapports clés
🚫 Aucune modélisation incluse
Limitations
📊 150 rapports personnalisés, 200 explorations individuelles, 10 segments par exploration
📊 Limite d'exportation quotidienne de 1 million d'événements pour les propriétés standard

Portée des données

GA4

Données d'événements et d'utilisateurs agrégées, c'est-à-dire que les données sont regroupées par date, heure, dimension, etc.

BigQuery

Les données sont au niveau de l'événement, donc elles ne sont pas agrégées.

Méthode d'accès aux données

GA4

Données accessibles via l’interface GA4.

BigQuery

Console GCP ou toute application de reporting pouvant interroger les données BigQuery

Cardinalité élevée

⚠️ Les dimensions à grande cardinalité sont des dimensions avec plus de 500 valeurs uniques en une journée. Le dépassement de cette limite entraîne une condensation des données au-delà de la limite dans la ligne (other).Plus d’informations :

GA4

Une limitation de GA4 est sa limite de cardinalité pour les dimensions. GA4 ne peut générer des rapports que sur un nombre limité de valeurs uniques pour une dimension avant de regrouper les valeurs moins fréquentes dans une ligne (other). La limite de cardinalité pour les dimensions de GA4 est de 500 valeurs uniques par jour.

BigQuery

BigQuery est plus adapté pour traiter des données à haute cardinalité que GA4. Il n'y a pas de limite de cardinalité pour les dimensions. Ainsi, vous pouvez générer des rapports sur n'importe quel nombre de valeurs uniques pour une dimension, sans avoir à vous soucier de rencontrer (others).

Échantillonnage

ℹ️ Imaginez que vous voulez estimer combien de personnes vivent dans une ville de 100 000 habitants. Vous pourriez compter combien de personnes il y a dans une rue de 100 mètres de long et multiplier par 1000, ou compter combien de personnes il y a dans une rue de 50 mètres de long et multiplier par 2000 pour avoir une estimation précise du nombre total de personnes dans la ville.

GA4

Google Analytics utilise l'échantillonnage des données lorsque le nombre d'événements dépasse la limite de votre type de propriété (500 par utilisateur).  Cela vous permet d'explorer vos données en détail à l'aide d'un échantillon représentatif, qui est ensuite extrapolé pour fournir des informations précises.

  • Pas d’échantillonnage pour les rapports standards sauf les rapports de tunnel
  • Échantillonnage possible dans les rapports d’exploration quand le quota est dépassée

BigQuery

BigQuery permet d’accéder à 100 % des données.

Le Tresholding

ℹ️ Les seuils de données sont appliqués pour empêcher toute personne consultant un rapport ou une exploration de déterminer l'identité des utilisateurs individuels en se basant sur :
👉🏻 Les données démographiques
👉🏻 Les centres d'intérêt
👉🏻 D'autres signaux présents dans les données.
Les signaux Google sont des données des utilisateurs connectés à leur compte Google qui ont activé la personnalisation des annonces.

GA4

Type de données
Description
Données démographiques
Le rapport contient des données démographiques ou des publics définis à l'aide de données démographiques.
Données Google Signals
Les données peuvent être retenues lorsque les signaux Google sont activés, l'identité de rapport combinée ou observée est utilisée, et qu'il y a un faible nombre d'utilisateurs dans la plage de dates spécifiée.
Données sur les requêtes de recherche
Peuvent être retenues si un rapport ou une exploration inclut ces informations et qu'il n'y a pas suffisamment d'utilisateurs au total.

BigQuery

Le thresholding ne s'applique pas vraiment aux données de BigQuery. Il n'y a pas de données démographiques (âge, sexe, etc.) provenant des signaux Google qui sont envoyés à BigQuery.

Attribution basée sur les données

GA4

Dans GA4, il existe trois types de modèles d'attribution :

  1. Les modèles basés sur des règles pour les sources payantes et organiques : ces modèles attribuent un poids fixe à chaque canal en fonction de sa position dans le parcours de conversion.
  2. Le modèle basé sur des règles pour les canaux payants de Google : ce modèle attribue un poids fixe à chaque canal Google Ads en fonction de sa position dans le parcours de conversion.
  3. L'attribution basée sur les données : ce modèle attribue un poids à chaque canal en fonction de son impact réel sur la conversion.

BigQuery

GA4 utilise son propre modèle d'attribution au niveau de la session. Par conséquent, ces informations ne sont pas directement accessibles dans les données exportées vers BigQuery et ne peuvent pas être calculées avec la plus grande précision.

Modélisation des conversions et modélisation comportementale

☝🏻 Google utilise la modélisation pour estimer les conversions en ligne qui ne peuvent pas être observées directement. Cela permet de fournir des rapports plus précis, d'optimiser les campagnes publicitaires et d'améliorer les enchères automatisées.

GA4

GA4 utilise des données modélisées dans ses rapports clés pour attribuer les événements de conversion à travers les canaux.

⚠️ La modélisation comportementale dans la section d’explorations GA4 ne concerne que les tables de chemin, d'entonnoir et de forme libre.

BigQuery

Les modélisations ne sont pas incluses. Les données BigQuery contiennent des signaux sans cookies collectés par Google Analytics lorsque le mode de consentement est activé, et chaque session a un user_pseudo_id différent.

La modélisation peut entraîner des différences entre les rapports standard et les données granulaires dans BigQuery :

👉🏻 On pourrait constater moins d'utilisateurs actifs dans les rapports GA4 par rapport à BigQuery, car la modélisation tente de prédire plusieurs sessions à partir d'un même utilisateur qui a refusé les cookies.

Limitations

GA4

  • Rapports et analyses : jusqu'à 150 rapports personnalisés par propriété.
  • Explorations : jusqu'à 200 explorations individuelles par utilisateur et par propriété, et jusqu'à 500 explorations partagées par propriété peuvent être créées. Il est possible d'importer jusqu'à 10 segments par exploration.

BigQuery

Les propriétés standard ont une limite d'exportation quotidienne de 1 million d'événements par jour. Les propriétés Analytics 360 ont une exportation presque illimitée.

Un besoin, une question ?

Écrivez-nous à hello@starfox-analytics.com.
Notre équipe vous répondra au plus vite.

Sommaire
Post Tab Link
Post Tab Link

Suivez Starfox Analytics sur Linkedin pour ne rien rater.