🔥 What’s New ?
👉 Meta a annoncé fin mai l'utilisation des données publiques de tous les utilisateurs européens majeurs pour entraîner ses systèmes d'intelligence
Meta a annoncé l'utilisation des données européennes pour entraîner son IA, et c'est parti depuis fin mai 2025 ! Cette décision fait suite à une première tentative en 2024, suspendue à cause des pressions des autorités de protection des données, mais relancée après des discussions, notamment pour éviter que des données personnelles ne soient mémorisées dans les modèles d’IA.
Concrètement, Meta récupère maintenant toutes les publications publiques de ses utilisateurs sur Facebook et Instagram (textes, photos, commentaires) ainsi que les interactions avec leurs outils d'IA comme Meta AI. Et ça concerne aussi bien les anciens posts que tout ce qui sera publié à l'avenir.
La bonne nouvelle c’est qu’on peut dire non ! Meta a mis en place des formulaires d'opposition qu'on peut remplir dès maintenant, sans avoir à se justifier. Il faut juste penser à le faire pour chaque compte si vous en avez plusieurs.
Ce qu’il faut noter c’est qu'après les discussions avec les autorités européennes, Meta a dû :
- Renforcer ses filtres pour éviter que des données personnelles se retrouvent mémorisées dans leurs modèles d'IA
- WhatsApp n'est pas concerné par cette collecte de données
Les autorités de protection des données, dont la CNIL, gardent un œil sur tout ça et continuent de négocier avec Meta.
ℹ️ Pour plus d’infos : CNIL
💡 Concrètement, ça change quoi pour nous et nos clients ?
La réalité terrain : Meta promet des pubs plus performantes grâce à l'IA, mais on n'a encore aucun chiffre concret sur l'impact réel. Les utilisateurs peuvent s'opposer via un formulaire planqué dans les paramètres, mais soyons honnêtes : combien le feront vraiment ? Et seules les futures données sont protégées après opposition.
Notre approche : On teste les nouveaux outils IA de Meta sans tomber dans le piège de la dépendance totale. L'automatisation, c'est bien, mais ça ne remplace pas une stratégie réfléchie et des campagnes diversifiées sur plusieurs canaux.
Le vrai enjeu : Cette évolution révèle surtout la concentration croissante du pouvoir entre les mains des grandes plateformes. Notre job, c'est d'en tirer parti tout en gardant notre indépendance stratégique et en respectant les vraies attentes de nos audiences en matière de données personnelles.
L'IA transforme le game, mais les fondamentaux restent pour piloter des campagnes : connaissance client, créativité et mesure de performance.
👉 Copilot dans Power BI
La mise à jour de Power BI de mai 2025 introduit plusieurs innovations majeures, dont une fonctionnalité Copilot autonome permettant aux utilisateurs de poser des questions sur n'importe quelle donnée accessible via la commande "Ask Anything!" (en preview).

ℹ️ Pour plus de détails : Learn-microsoft
💡 Nous assistons clairement à un changement de paradigme qui transforme fondamentalement la façon de concevoir la prise de décision en entreprise à travers un “changement de mentalité” où chaque collaborateur devient acteur de l'intelligence collective.
Pour nous, ce changement redéfinit les rôles : les métiers évoluent vers plus d'autonomie analytique, tandis que les équipes techniques se repositionnent comme facilitateurs et architectes de cette accessibilité universelle aux insights.
👉 Les stratégies d'identification hybrides et les plateformes CDP en pleine expansion
La décision de Google concernant les cookies tiers a des implications majeures pour la réconciliation des données. Les entreprises adoptent désormais une approche combinant plusieurs types d'identifiants : cookies first et third party,identifiants logués (email, téléphone), identifiants alternatifs (First-ID, Utiq, ID5) et solutions de stockage local.
Cette diversification des méthodes d'identification permet d'assurer une continuité dans la réconciliation des données, tout en préparant l'avenir avec des alternatives plus robustes.
Quant aux plateformes CDP(Customer Data Platform), leur évolution n’est plus un secret, leur rôle est d’orchestrer l'ensemble des identifiants disponibles et permettre une réconciliation efficace des données first-party avec les données comportementales. L'enrichissement des bases CRM avec des insights comportementaux précis permet aux marques de développer une connaissance client plus complète et activable.
ℹ️ Pour d’autres informations rendez-vous sur : Open-global
💡 Les solutions de Data Collaboration intégrées aux CDP facilitent désormais le partage sécurisé de données entre partenaires commerciaux, enrichissant ainsi les profils clients sans compromettre la confidentialité. Une tendance qui devrait s'accélérer dans les mois à venir.
👉 La RGPD continue d'évoluer, et des amendes sont tombées
Le mois de mai a été particulièrement riche en actualités réglementaires. La Commission européenne a présenté le 21 mai son quatrième "paquet omnibus" incluant une nouvelle exemption à la mise en place d'un registre des activités de traitement (article 30 du RGPD). Cette annonce a suscité des débats animés parmi les professionnels de la protection des données, certains y voyant un assouplissement bienvenu, d'autres une potentielle régression.
L'article 30 du RGPD oblige actuellement les organisations à tenir un registre de leurs activités de traitement de données. Une exemption existe déjà pour les entreprises de moins de 250 employés, sauf pour certains traitements à haut risque.
⇒ La nouvelle proposition étend cette exemption aux entreprises de moins de 750 employés.
Dans le même temps, la CNIL reste vigilante : elle a sanctionné le 15 mai la société Caloga d'une amende de 80 000 euros pour plusieurs manquements au RGPD. Parmi les pratiques épinglées : des formulaires trompeurs ne permettant pas de recueillir un consentement valide, des difficultés pour retirer son consentement, et une conservation excessive des données.
À noter cette précision importante : l'ouverture d'un email ne constitue pas une preuve d'activité suffisante pour prolonger la conservation des données !
ℹ️ Pour en savoir plus, rendez-vous sur :
Sourcingspeak
CNIL
👉 Chez Starfox Analytics, nous accompagnons nos clients dans leur mise en conformité avec les règles de protection des données à travers des audits complets et des recommandations personnalisées. Notre expertise vous permet d'identifier les risques, d'optimiser vos processus et d'assurer une conformité durable avec la réglementation en vigueur.
👉 Google Cloud a annoncé le 21 mai 2025 le lancement de sa nouvelle génération de modèles d'IA générative
Google a lancé Gemini 2.5 Pro en mai 2025, une IA “révolutionnaire” qui redéfinit l'intelligence artificielle avec des capacités très avancées de mémoire et de raisonnement. Il y a eu aussi le lancement d’autres modèles sur Vertex AI qu’on a pu voir en démos et le résultat est vraiment bluffant.
Google a sorti trois modèles médias qui changent la donne :
Imagen 4 pour créer des images ultra-réalistes à partir de simple texte : on parle de qualité vraiment pro, avec un rendu de texte parfait et une compréhension fine des instructions.
Veo 3 qui génère des vidéos avec du son, de la parole et de la musique intégrés. Des entreprises comme Kraft Heinz ont réduit leurs processus créatifs de 8 semaines à 8 heures !
Lyria 2 pour la création musicale, qui vient compléter le tout.
Des entreprises comme Klarna, Jellyfish ou Envato l'utilisent déjà et témoignent de gains de temps et de coûts impressionnants. On parle de 50% de réduction en moyenne.
On vous conseille de regarder les keynotes de Google Cloud pour voir ce que ça donne concrètement.
ℹ️ Le lien de la keynote.L’article récapitulant toutes les mises à jour des modèles : Cloud Google
👉Snowflake : innovations majeures au Summit 2025
Le Snowflake Summit 2025, qui s'est tenu début juin, a été l'occasion d'annoncer plusieurs innovations majeures.
Snowflake Intelligence (bientôt en preview publique) offre une expérience agentique permettant aux utilisateurs métier de converser avec leurs données en langage naturel, sans écrire de code.
Snowflake Openflow a été introduit comme un service d'ingestion de données multimodal géré, conçu pour simplifier le mouvement et l'intégration des données, alimenté par Apache NiFi. Cette solution vise à éliminer les silos de données et le travail manuel dans l'ingestion de données.
Les entrepôts Standard Warehouse - Generation 2 (Gen2) offrent désormais des performances 2,1 fois plus rapides pour les charges de travail analytiques de base, avec des améliorations notables pour les opérations Delete, Update et Merge. Cette évolution répond aux besoins croissants de performance des entreprises manipulant des volumes de données toujours plus importants.

ℹ️ Pour plus d’infos : Snowflake
👉 DBT Fusion : un nouveau moteur pour améliorer la performance de vos modèles
DBT Labs a annoncé le 28 mai un nouveau moteur Fusion, conçu pour révolutionner l'expérience des développeurs à l'ère de l'IA. dbt Fusion est un moteur de nouvelle génération écrit en Rust qui accélère drastiquement les performances de dbt avec des temps de parsing jusqu'à 30x plus rapides que dbt Core. Il comprend nativement le SQL et peut émuler votre entrepôt de données localement, permettant de valider votre code en temps réel sans interroger votre warehouse, ce qui réduit les coûts et améliore l'expérience développeur. Grâce à sa conscience de l'état des données, Fusion exécute uniquement les modèles qui ont vraiment besoin d'être reconstruits (quand il y a de nouvelles données en amont), permettant d'économiser environ 10% sur les factures d'entrepôt de données.
ℹ️ Pour plus d’infos : Docs-getdbt
🤝 Le partenaire du mois
Comme évoqué plus haut, les stratégies d'identification hybrides prennent une importance croissante dans les organisations. Notre partenaire First-ID est justement un acteur majeur dans ce domaine.
👉 First-ID : La technologie française qui change la donne dans l'identification publicitaire
Pendant que Google fait du yo-yo avec ses cookies tiers, la France développe ses propres solutions. First-ID propose une technologie d'identification persistante qui fonctionne sans cookies ni emails, avec une couverture de 80% du web français actif.
La réalité terrain : Les éditeurs perdent aujourd'hui 68% de leurs revenus publicitaires dans les intermédiaires. First-ID promet de reprendre le contrôle, mais attention à ne pas tomber dans le piège de la solution miracle unique.
Les chiffres qui comptent :
- Redirection serveur ultra-rapide : < 50 millisecondes
- Couverture du marché : 80% des utilisateurs web français actifs
- Impact sur les revenus : potentiel de récupération de 68% des inventaires éditeurs
👉 Concrètement, ça change quoi pour les acteurs du digital ?
- Pour les éditeurs : Fini la dépendance totale aux ad exchanges. First-ID permet de créer des identifiants directement intégrés dans vos analytics, sans passer par les intermédiaires qui grignotent vos marges.
- Pour les annonceurs : Exit la dépendance aux GAFAM pour vos données d'audience. Vous accédez à des segments qualifiés tout en gardant la main sur votre stratégie data.
Pour les régies : Vous proposez enfin des KPI équivalents aux walled gardens, avec la transparence en plus.
👉 Comment ça fonctionne techniquement ?
Le système First-ID, c'est comme un péage autoroutier intelligent :
- Point d'entrée : Un utilisateur arrive sur votre site
- Identification éclair : En quelques millisecondes, l'identifiant se crée ou se récupère
- Intégration directe : Les données partent directement dans vos outils sans détour
Activation immédiate : Vous pouvez personnaliser en temps réel
La vraie innovation : Chaque identifiant correspond à un utilisateur actif quotidiennement. On ne parle pas de reach fantôme, mais d'audience réellement engagée.
👉 Le contexte réglementaire français qui pousse ces solutions
Avec 87 sanctions CNIL en 2024 (contre 42 en 2023) et des amendes qui atteignent 55,2 millions d'euros, la pression réglementaire s'intensifie. Les entreprises ne peuvent plus se contenter de bricoler leurs bannières cookies.
Le point important : La CNIL sanctionne désormais les "dark patterns" et exige une égalité d'accès entre accepter et refuser les cookies. Les solutions comme First-ID arrivent à point nommé pour contourner ces contraintes.
👉 La concurrence internationale existe déjà
- Trade Desk UID2 : Plus de 200 partenaires, mais dépendant des emails hashés
- Google Topics API : 469 sujets prédéfinis, mais CPM 30% inférieurs au cookié
- LiveRamp : 245 millions de profils US, matching à 90%+ mais limité géographiquement
L'avantage First-ID : Une solution pensée pour le marché français avec ses spécificités réglementaires et comportementales.

💡 👉 Notre approche chez Starfox Analytics
On teste ces nouvelles technologies sans tomber dans l'effet de mode. First-ID fait partie des solutions prometteuses pour nos clients.
Le conseil pratique : Allouez 5-10% de vos budgets pour tester les solutions d'ID alternatives. Mais gardez 85% sur des stratégies first-party data éprouvées.
Le vrai enjeu : Cette évolution révèle surtout l'urgence de reprendre le contrôle de ses données. Notre job, c'est d'accompagner cette transition sans casser les performances actuelles.
Pour aller plus loin : Les fondamentaux restent les mêmes : connaissance client, créativité et mesure de performance.
💡 L’astuce du mois
Notre rubrique "L'astuce du mois" partage des conseils pratiques utilisés quotidiennement chez Starfox Analytics. Ces astuces couvrent divers outils de Web Analyse pour optimiser votre travail. N'hésitez pas à les tester et à les partager avec vos collègues.
👉 Le TIMESTAMP dans BigQuery
BigQuery stocke automatiquement toutes les valeurs TIMESTAMP en UTC en interne, sans possibilité de modifier ce comportement par défaut et cela pose des problèmes :
1. Perte des timezones
Sans timezone spécifiée, BigQuery utilise UTC par défaut masquant la timezone d'origine.
2. Analyses multi-régions complexes
Le filtrage et regroupement par timezone locale sont difficiles surtout pour les entreprises internationales.
3. Changements d'heure
Les passages été/hiver compliquent les conversions.
Et pour détourner ces problèmes, nous proposons trois solutions possibles :
Conversion à l'affichage
Utilisez `FORMAT_TIMESTAMP`
pour afficher les données dans une timezone spécifique.
Stockage
Stockez en UTC et convertissez uniquement lors de l'affichage.
Fonctions
Utilisez `DATE(), TIME(), DATETIME()
` avec les timezones souhaitées.
📖 Sharing Is Caring
Notre rubrique "Sharing is Caring" présente mensuellement un article approfondi sur un sujet d'actualité en Web Analyse. Nos experts utilisent leur savoir-faire et les ressources en ligne pour explorer ces thématiques en détail.
Ce mois-ci, découvrez l'article de Daniel qui explique comment calculer le nombre de vos utilisateurs sur GA4
❤️ Meilleures ressources et articles du moment
- Un blog qui permet de suivre toutes les releases notes de Snowflake
- Le guide de l’année pour comprendre les métriques de l’analyse client
- Un poste Linkedin qui décrit un outil de Stape.io qui évalue comment un site se positionne en terme de tracking
- Peu de gens le connaissent, un étude prospective menée par un groupe de chercheurs s'est penchée sur l'évolution de l'IA à l'horizon 2027
😜 Miscellaneous
👉 Builder.ai : L'IA qui n'en était pas une
Builder.ai, la startup "IA" qui promettait de créer des apps facilement grâce à son assistant virtuel Natasha, vient de faire faillite après avoir été démasquée : ils utilisaient en réalité 700 développeurs en Inde pour faire le travail qu'ils vendaient comme étant automatisé par l'IA !
Fondée en 2016 par Sachin Dev Duggal, cette boîte londonienne avait réussi à lever des fonds auprès de gros noms comme Microsoft et atteint une valorisation de 1,5 milliard de dollars en se présentant comme une plateforme "no-code alimentée par l'IA".
Le réveil a été brutal : derrière le marketing tapageur sur l'intelligence artificielle se cachait un simple centre de développement offshore classique, et la startup a déposé le bilan la semaine dernière après que la supercherie ait été découverte.
ℹ️ https://www.indiatoday.in/technology/news/story/builderai-used-700-engineers-in-india-for-coding-work-it-marketed-as-ai-powered-after-hype-now-goes-bust-2734963-2025-06-03
🤩 Inside Starfox
🎉 Grande nouvelle ! Notre podcast "Inside Starfox" est enfin là ! Retrouvez tous nos contenus préférés : veilles, articles et cas pratiques… dans un format audio génèré par NotebookLM super pratique sur Spotify. Parfait pour rester à la pointe pendant vos trajets ou votre pause café ! 🎧


Un besoin, une question ?
Écrivez-nous à hello@starfox-analytics.com.
Notre équipe vous répondra au plus vite.