👋🏻 Ce document présente les différences entre GA4 et BigQuery en termes d'affichage des données dans l'interface utilisateur (UI) et les limitations de chaque solution.
Portée des données
GA4
Données d'événements et d'utilisateurs agrégées, c'est-à-dire que les données sont regroupées par date, heure, dimension, etc.
BigQuery
Les données sont au niveau de l'événement, donc elles ne sont pas agrégées.
Méthode d'accès aux données
GA4
Données accessibles via l’interface GA4.
BigQuery
Console GCP ou toute application de reporting pouvant interroger les données BigQuery
Cardinalité élevée
⚠️ Les dimensions à grande cardinalité sont des dimensions avec plus de 500 valeurs uniques en une journée. Le dépassement de cette limite entraîne une condensation des données au-delà de la limite dans la ligne (other)
.Plus d’informations :
GA4
Une limitation de GA4 est sa limite de cardinalité pour les dimensions. GA4 ne peut générer des rapports que sur un nombre limité de valeurs uniques pour une dimension avant de regrouper les valeurs moins fréquentes dans une ligne (other)
. La limite de cardinalité pour les dimensions de GA4 est de 500 valeurs uniques par jour.
BigQuery
BigQuery est plus adapté pour traiter des données à haute cardinalité que GA4. Il n'y a pas de limite de cardinalité pour les dimensions. Ainsi, vous pouvez générer des rapports sur n'importe quel nombre de valeurs uniques pour une dimension, sans avoir à vous soucier de rencontrer (others)
.
Échantillonnage
ℹ️ Imaginez que vous voulez estimer combien de personnes vivent dans une ville de 100 000 habitants. Vous pourriez compter combien de personnes il y a dans une rue de 100 mètres de long et multiplier par 1000, ou compter combien de personnes il y a dans une rue de 50 mètres de long et multiplier par 2000 pour avoir une estimation précise du nombre total de personnes dans la ville.
GA4
Google Analytics utilise l'échantillonnage des données lorsque le nombre d'événements dépasse la limite de votre type de propriété (500 par utilisateur). Cela vous permet d'explorer vos données en détail à l'aide d'un échantillon représentatif, qui est ensuite extrapolé pour fournir des informations précises.
- Pas d’échantillonnage pour les rapports standards sauf les rapports de tunnel
- Échantillonnage possible dans les rapports d’exploration quand le quota est dépassée

BigQuery
BigQuery permet d’accéder à 100 % des données.
Le Tresholding
ℹ️ Les seuils de données sont appliqués pour empêcher toute personne consultant un rapport ou une exploration de déterminer l'identité des utilisateurs individuels en se basant sur :
👉🏻 Les données démographiques
👉🏻 Les centres d'intérêt
👉🏻 D'autres signaux présents dans les données.
Les signaux Google sont des données des utilisateurs connectés à leur compte Google qui ont activé la personnalisation des annonces.
GA4

BigQuery
Le thresholding ne s'applique pas vraiment aux données de BigQuery. Il n'y a pas de données démographiques (âge, sexe, etc.) provenant des signaux Google qui sont envoyés à BigQuery.
Attribution basée sur les données
GA4
Dans GA4, il existe trois types de modèles d'attribution :
- Les modèles basés sur des règles pour les sources payantes et organiques : ces modèles attribuent un poids fixe à chaque canal en fonction de sa position dans le parcours de conversion.
- Le modèle basé sur des règles pour les canaux payants de Google : ce modèle attribue un poids fixe à chaque canal Google Ads en fonction de sa position dans le parcours de conversion.
- L'attribution basée sur les données : ce modèle attribue un poids à chaque canal en fonction de son impact réel sur la conversion.
BigQuery
GA4 utilise son propre modèle d'attribution au niveau de la session. Par conséquent, ces informations ne sont pas directement accessibles dans les données exportées vers BigQuery et ne peuvent pas être calculées avec la plus grande précision.
Modélisation des conversions et modélisation comportementale
☝🏻 Google utilise la modélisation pour estimer les conversions en ligne qui ne peuvent pas être observées directement. Cela permet de fournir des rapports plus précis, d'optimiser les campagnes publicitaires et d'améliorer les enchères automatisées.
GA4
GA4 utilise des données modélisées dans ses rapports clés pour attribuer les événements de conversion à travers les canaux.
⚠️ La modélisation comportementale dans la section d’explorations GA4 ne concerne que les tables de chemin, d'entonnoir et de forme libre.
BigQuery
Les modélisations ne sont pas incluses. Les données BigQuery contiennent des signaux sans cookies collectés par Google Analytics lorsque le mode de consentement est activé, et chaque session a un user_pseudo_id
différent.
La modélisation peut entraîner des différences entre les rapports standard et les données granulaires dans BigQuery :
👉🏻 On pourrait constater moins d'utilisateurs actifs dans les rapports GA4 par rapport à BigQuery, car la modélisation tente de prédire plusieurs sessions à partir d'un même utilisateur qui a refusé les cookies.
Limitations
GA4
- Rapports et analyses : jusqu'à 150 rapports personnalisés par propriété.
- Explorations : jusqu'à 200 explorations individuelles par utilisateur et par propriété, et jusqu'à 500 explorations partagées par propriété peuvent être créées. Il est possible d'importer jusqu'à 10 segments par exploration.
BigQuery
Les propriétés standard ont une limite d'exportation quotidienne de 1 million d'événements par jour. Les propriétés Analytics 360 ont une exportation presque illimitée.

Un besoin, une question ?
Écrivez-nous à hello@starfox-analytics.com.
Notre équipe vous répondra au plus vite.