👋 Dans cet article, nous allons clarifier comment bien compter vos utilisateurs dans GA4 et BigQuery, en comparant deux approches clés :
-COUNT(DISTINCT) pour la précision absolue.
-HyperLogLog (HLL) pour la performance à grande échelle.
L’objectif ici est de vous aider à choisir intelligemment, selon vos cas d’usage, entre rigueur analytique et maîtrise budgétaire.
Contexte : pourquoi le comptage des utilisateurs est stratégique ?
Un bon décompte utilisateur, c’est bien plus qu’une ligne dans un dashboard.
C’est le fondement de vos KPIs business :
- Il influe sur vos taux de conversion, vos rapports de performance et vos décisions marketing.
- Une erreur de comptage ? Cela fausse votre coût d’acquisition client (CAC), vos calculs de ROAS, et peut vous faire investir… sur de mauvaises bases.
Problèmes fréquents avec GA4 seul
- Données incomplètes ou échantillonnées (surtout sur les gros volumes).
- Historique limité à 14 mois.
- Accès restreint à certains champs comme le contenu du panier ou des identifiants utilisateurs.
👉 L’export vers BigQuery devient indispensable pour accéder à l’intégralité des données brutes, éviter l’échantillonnage et réaliser des analyses avancées sur mesure.
Deux méthodes, deux philosophies
1. COUNT(DISTINCT)
Comptage exact basé sur un identifiant unique (ex : utilisateur_id
).
- Avantages : Précision totale, légalement requis (RGPD).
- Inconvénients : Très coûteux sur de gros volumes.
Exemple :
SELECT COUNT(DISTINCT user_pseudo_id)
FROM `project.dataset.events_*`
WHERE device.category != 'bot'
💡 Astuce SEO : Exclure les bots avecWHERE device.category != 'bot'
.
2. HyperLogLog (HLL)
Un algorithme probabiliste conçu pour estimer rapidement et à moindre coût le nombre d’éléments uniques (ex. : nombre d’utilisateurs, d’emails, de sessions…).
- Avantages : 99% de précision, coûts réduits de 60 à 90%, idéal pour traiter de très grands volumes de données, parfait pour les tendances, les analyses quotidiennes
- Inconvénients : ce n’est pas un comptage exact (les résultats sont très proches, mais pas rigoureusement justes) donc inutilisable pour les rapports qui nécessite des résultats rigoureusement justes comme les rapports légaux ou financiers.
Exemple :
SELECT HLL_COUNT.EXTRACT(HLL_COUNT.INIT(user_pseudo_id, 14))
FROM `project.dataset.events_*`
💡 Le deuxième paramètre (ici 14
) correspond à la précision souhaitée (entre 10 et 24). Plus il est élevé, plus l'estimation est précise (et coûteuse). Google utilise 14 par défaut.
⚖️ Comparatif : Quelle méthode pour quel usage ?
👉Vérifiez régulièrement les données avec COUNT pour valider les estimations HLL.
Applications Pratiques
Cas Concrets
"GA4 sous-estime mon trafic SEO !"
➡️ Vérifiez dans BigQuery avec COUNT(DISTINCT)
sur les sessions ou les utilisateurs.
C’est souvent là que vous réalisez que l’échantillonnage GA4 vous faisait perdre 10 à 20% de trafic.
"Mes campagnes Ads me semblent peu rentables…"
➡️ HLL permet de suivre des tendances à coût réduit.
Croisez-le avec un COUNT mensuel pour identifier des leviers sous-estimés.
Témoignage
Nous avons réalisé ces tests sur des données exportées de Google Analytics vers BigQuery, pour la période du 01 janvier 2025 au 12 mars 2025.
Les résultats comparatifs des trois méthodes avec l'interface GA4 sont disponibles dans le fichier suivant :
Google Sheets - Résultats de l'analyse
FAQ Intégrée
Q : "Pourquoi GA4 et BigQuery donnent des résultats différents ?"
→ R : GA4 échantillonne les données, tandis que BigQuery utilise les données brutes.
Q : "HyperLogLog est-il fiable pour des décisions stratégiques ?"
→ R : Oui à 99,9%, mais validez avec COUNT pour les rapports critiques.
Comparer COUNT(DISTINCT)
pour une précision totale mais coûteuse et HyperLogLog
pour des estimations rapides et économiques. Utilisez COUNT
pour des audits critiques et HLL
pour des tendances à grande échelle.
☝ Convictions
« Le décompte des utilisateurs n’est pas une science exacte… mais une science de compromis intelligents. »
- ☑️ Ne sacralisez pas la précision : 99% = assez pour agir.
- ☑️ GA4 + BigQuery = mariage forcé : L’un sans l’autre est aveugle ou paralysé.
- ☑️ HLL est un super-pouvoir : Apprenez à l’exploiter, ou payez le prix

Un besoin, une question ?
Écrivez-nous à hello@starfox-analytics.com.
Notre équipe vous répondra au plus vite.