La donnée est le nerf de la guerre et de la publicité qui tend à devenir l’un des business les plus lucratifs. Qui dit monétisation dit bataille. Récupérer, analyser, segmenter et créer une expérience sont les promesses de la data. Mais quelles sont les limites à la récolte et la sauvegarde ainsi que les usages de cette donnée publicitaire ? Dans quel environnement pouvons-nous le faire de manière non intrusive, légale, efficace et en respectant l’environnement qui nous entoure ?

Big data : quels impacts sur l’environnement ?

Les données personnelles collectées représentent un impact climatique majeur sur notre société et l’environnement dans lequel elle évolue. Dans une ère ou la production et la consommation des données sont en passe d’exploser à l’échelle mondiale, les data centers (centre où est stocké l’ensemble des données), représentent un véritable fléau pour l’environnement.

En effet, les avancées technologiques et l’essor de tous les nouveaux devices (tablettes, smartphones), ainsi que les plateformes cloud, permettant à un individu de sauvegarder ses données (photos, musiques, documents etc.) ont provoqué une explosion du volume de données générées par l’être humain. Selon une étude de l’IDC, ce volume de donnée devrait être multiplié par 5 entre 2018 et 2025 pour atteindre un total colossal de 175 milliards de téraoctets.

D’ici 2030, les data centers pourraient engloutir plus de 10% de la production mondiale d’électricité contre 3% atteint en 2019. Toujours selon une étude menée par l’IDC, les data centers représentent aujourd’hui 17% de l’empreinte carbone de la technologie à eux seuls. Dans une interview du New York Time, Peter Gross explique que :

 « Un seul data center peut consommer plus d’énergie qu’une ville américaine de taille moyenne ».

Mais comment ces data centers peuvent-ils consommer autant ?

La réponse est très simple. Ces derniers sont situés dans la majorité des cas dans d’immenses hangars à serveurs. Leur fonctionnement continu, sans aucune interruption est le premier point noir quant à leur consommation d’énergie. Par ailleurs, les températures engendrées par leur activité sont très élevées. Afin de garantir leur bon fonctionnement il est nécessaire que ces derniers soient conservés à température ambiante.

Comment faire alors pour éviter la surchauffe et leur permettre de « travailler dans de bonnes conditions ?

Une fois encore, la réponse est simple : mettre en place des systèmes de refroidissement. Voici le deuxième gros point noir. Ces mécanismes de refroidissement consomment autant d’énergie que les serveurs eux-mêmes. En 2008, 56 milliards de Kilowatts étaient nécessaires à leur fonctionnement. Les estimations indiquent que d’ici la fin de l’année 2020, ce chiffre devrait atteindre un record de 104 milliards de kilowatts consommés.

Et une fois que les serveurs ne sont plus fonctionnels, que se passe-t-il ?

Voilà le troisième et dernier gros point noir majeur (parmi beaucoup d’autres encore que je ne n’évoquerais pas) : le recyclage et la réutilisation des appareil en fin de cycle de vie. Pour le moment, aucune solution n’a été trouvée pour recycler intégralement un serveur. Évidement certaines pièces sont réutilisées, mais ce n’est qu’une minorité.

Des innovations restent alors à trouver. Explosion de la data au service des marques, oui, mais à quel point ?

Le cycle de vie de la donnée

cycle de vie de la donnée

Aujourd’hui, les données représentent une partie des actifs indispensables à une entreprise pour le bon fonctionnement de son business. D’après le Dr Galdon Clavell, experte en éthique et données, le cercle de vie de la donnée passe par différentes phases :

  • Collecte
  • Traitement, analyse & partage
  • Stockage
  • Suppression

Ce cycle de vie des données décrit où les données se trouvent et la façon dont elles circulent au sein d’une organisation. Chacune de ces étapes peut représenter une limite à son utilité.

La collecte des données

La collecte des données est nécessaire, nous l’avons vu, pour pouvoir l’analyser ensuite et optimiser les business plans des entreprises. Cependant collecter la donnée pour la collecter ne sert strictement à rien. Il est nécessaire de connaître précisément le type de donnée dont on a besoin et pourquoi, sinon le risque est de se trouver avec une masse de données trop importante, couteuse et sans savoir quoi en faire, ni pouvoir l’analyser.

Par ailleurs, collecter la donnée induit le respect de la vie privée. Pour pouvoir collecter les données, une entreprise doit donc préalablement bénéficier de l’accord des individus et garantir la confidentialité de leurs données personnelles (nous y reviendrons sur la partie RGPD). Cela représente d’ailleurs un avantage concurrentiel majeur pour toutes les entreprises.

Le traitement et l’analyse de la donnée

Le traitement et l’analyse de la donnée, représente pour les professionnels de la data et pour leurs entreprises une mine d’or. Cependant, l’accès et le partage de cette donnée récoltée ne doit pas être permis à chacun des individus d’une entreprise. L’accès doit être limité aux seules personnes qui ont besoin de connaitre l’information, ce qui signifie que ces personnes peuvent justifier par une raison professionnelle l’accès à ces données. De plus, les données recueillies ne doivent être utilisée qu’à des fins initialement prévues et pour lesquelles les individus ont donné leur consentement.

Un accès trop large aux données engendre en général des fuites ou fraudes de données. Selon le WFA, World Federation of Advertisers, la fraude publicitaire concerne 10 à 30% des investissements publicitaires mondiaux. Cette fraude pourrait atteindre la barre des 50% avec 50 milliards de dollars en jeu.

La conservation des données

La conservation des données doit également être réglementée. En effet, les données ne peuvent pas être conservées pour une durée indéfinie, mais seulement pour la durée nécessaire à l’opération pour laquelle elle a été recueillie. Comme évoqué ci-dessus, la donnée ne doit avoir pour finalité que ce pourquoi elle a été récoltée. Ainsi une donnée est supposée n’avoir qu’un seul but, puis, être détruite ensuite. Par ailleurs, la durée de vie de la donnée n’est pas éternelle. Ce que la donnée nous dit aujourd’hui ne sera probablement plus juste demain. Cela est une raison de plus à la limitation de la conservation des données. Par ailleurs sauvegarder des données dont il n’y a plus d’usage contribue à la pollution environnementale que l’on évoquait dans la partie précédente.

La suppression de la donnée

Enfin, la suppression des données doit se faire de manière sécurisée. Quand les données n’ont plus d’utilité il est important de penser à les supprimer. Cependant, il faut veiller à supprimer tous les documents dans lesquelles les données sont présentes (exemple : vieux classeurs Excel que l’on ouvre très peu). C’est souvent le type de document que nous pouvons oublier au sein d’une entreprise, mais dont raffolent les hackers.

Les typologies de data

Il existe différentes typologies de données, toutes utiles, voire même indispensables en termes de marketing.

Les données first party

Regroupent l’ensemble des données générées par le propre domaine du site visité et collectées par l’annonceur sur son audience et dont il est propriétaire. 56% des annonceurs et agences médias recherchent en priorité ce type de données, car elles donnent accès à une connaissance de « premier ordre » sur les consommateurs ou prospects d’une marque. Elles offrent également davantage de sécurité et de contrôle. Cependant, nous sommes aujourd’hui dans un monde « cookies-less », et les données first part devraient à terme disparaitre, de la même façon que les third part n’existeront plus d’ici à 2022. Courant 2021, nous devrions avoir plus de visibilité sur le sort qui sera réservé à ce type de données.

Les données second party

Ces données correspondent à des données first part qu’une entreprise récupère auprès de ses partenaires. Elles permettent d’enrichir les données dont l’entreprise est déjà propriétaire.

Les données third party

Représentent les données de ciblages publicitaires qui sont fournies à l’annonceur par une société tierce (data provider, régies pub, adexchange …). La provenance de ces données peut être multiple et il y a souvent plusieurs intermédiaires au cours de la transaction.

Cependant, ce type de donnée à fait l’objet d’une réforme au mois d’aout 2020. En mars dernier, Google annonçait qu’une réforme allait avoir lieu concernant ces données et s’est engagé à rendre impossible leur collecte d’ici à deux ans. Firefox et Explorer avaient de leur côté déjà fait cette annonce. Les annonceurs vont alors devoir trouver un autre moyen de s’approprier les habitudes de leurs consommateurs.

Les données third part englobent entre-autre les cookies que nous acceptons dès que nous nous rendons sur un site internet.

Cette réforme vient alors impacter toutes les entreprises qui collectaient des données à caractère personnel. Les organisations ont maintenant un accès très restreint aux informations concernant leurs visiteurs ce qui a un impact direct sur leur business rendant plus compliqué :

  • La précision sur la mesure d’audience
  • La personnalisation de la relation client
  • L’analyse et les A/B test
  • Le volume de données disponibles

La suppression de ces cookies a pour but de tendre vers un web plus « éthique » en renforçant la vie privée et la sécurité des données utilisateurs.

Quelle(s) solution(s) pour pallier leur disparition ?

Au cours d’interviews de Michel Juville, retransmises en podcast, dans the Programmatic Society, la question du ciblage des données personnelles est arrivée sur le tapis, notamment à savoir quelles réponses pouvaient être apportées pour pallier leur disparition.

Selon Margarita Zlatkova, employée de Weborama :

« Pour les annonceurs et éditeurs, c’est du côté des solutions tech qu’il faut chercher, avec l’anonymisation et le fait de faire en sorte que la personne ne soit plus identifiable ».

Cela ne constituerait donc plus, selon elle, une donnée personnelle. Reste cependant la question de comment retrouver ensuite cette personne sur le marché ?

Irène Grenet de chez France Télévisions Publicité, évoque la

« sensibilité des consommateurs qui n’a jamais été aussi forte. Quand on parle de data il faut parler de confiance, sinon il n’y a pas d’efficacité de la data. Il y a un questionnement juridique compliance. Quelle est la portée du consentement en matière d’utilisation des données ? »

Cependant, c’est Louis Prunel de chez BeOp, qui évoque une solution encore inexploitée : la gestion de la voie retour.

« Certains systèmes poussent des messages mais ne proposent pas d’interaction de l’autre côté. Il n’y a rien de standardiser pour récupérer de la donnée. Et pourtant c’est génial car ça permet de récupérer des insights directs auprès de l’utilisateur. La question est donc de savoir comment aborder cette gestion de l’interactivité et de la voie retour. (Voie qui aboutit à voix, ça permet d’écouter la voix de l’utilisateur, de collecter de la donnée, qui sera rattachée à un profil dans le vide ou connu s’il y a un consentement) ».

Ou en sommes nous aujourd’hui ?

Aucune solution n’a encore vu le jour pour pallier ce problème. Les cookies tiers sont encore en vigueur jusqu’à 2022. Cela laisse un an et demi pour trouver un autre moyen d’avoir accès aux informations personnelles des consommateurs.

Google a déjà prévu de mettre en place le « Privacy Sandbox » qui serait une alternative aux cookies tiers pour diffuser la publicité ciblée selon les centres d’intérêts des consommateurs, le tout, sans nuire à la vie privée des internautes. Il faudra néanmoins vérifier que Google se soumette lui-même aux restrictions qu’il vient d’imposer à la planète.

Ces différentes data peuvent être collectées de deux façons. On distingue alors : :

  • Les données déclaratives, qui sont collectées par le processus dit « déclaratif », c’est-à-dire qu’elles sont récoltées une fois que l’individu a donné son consentement.
  • Les données comportementales, qui regroupent l’ensemble des informations qui traduisent le comportement d’un internaute. Cela passe par la réaction de l’internaute lorsqu’il reçoit une newsletter (newsletter ouverte, nombre de clics, pages consultées ensuite etc.), à son parcours sur un site internet. Ces données peuvent-être identifiées, seulement si l’internaute s’est logé au site internet de la marque.

Pour résumer

typologie de données

Le RGPD : évolution de la réglementation des données en matière de publicité et limites du règlement

Selon le dictionnaire Juridique, le RGPD ou Réglementation Général sur la Protection des Données, « constitue le règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données ».

Le RGPD repose sur 3 valeurs

  • Transparence
  • Confiance
  • Responsabilité

Selon la CNIL, (Commission Nationale de l’Informatique et des Liberté), « il harmonise les règles en Europe en offrant un cadre juridique unique aux professionnels. Il permet de développer leurs activités numériques au sein de l’UE en se fondant sur la confiance des utilisateurs ».

La CNIL définie la notion de donnée personnelle comme « toute information se rapportant à une personne physique identifiée ou identifiable ». Une personne peut être identifiée directement (nom, prénom) ou indirectement (identifiant) et cette même identification peut se faire à partir d’une seule donnée ou par un croisement de données.

Le RGPD concerne l’ensemble des organismes, publics ou privés, dès lors qu’ils traitent des données personnelles d’un individu. La donnée personnelle doit cependant appartenir à un individu établi sur le territoire européen ou dont l’activité est liée à une personne résident en Europe. Les sous-traitants sont également concernés par cette réglementation.

Le non-respect du RGPD peut entrainer une sanction allant jusqu’à 20 millions d’euros ou, dans le cadre d’une entreprise, jusqu’à 4% de son chiffre d’affaires annuel.

La personnalisation publicitaire réside dans le principe de collecte de données personnelles.

  • En visitant un site internet, un internaute n’entre pas en relation avec une seule entreprise mais avec plusieurs, qui ont maintenant accès à ses données. Souvent, l’internaute ne sait pas quelles sont les données collectées à son égard. La collecte est donc bien trop souvent considérée comme invisible alors que l’un des trois principes du RGPD repose sur la transparence des données collectées et sur leur traitement.
  • Le stockage des données personnelles représente également un risque. Le RGPD tente de limiter ce risque en imposant une durée maximale de conservation des données ou bien en permettant un contrôle renforcé sur l’utilisation qui en est faite.
  • Le RGPD impose également le principe de consentement utilisateur pour suivre son parcours online. Or la démultiplication de bannières d’acceptation biaise le consentement utilisateur, qui, fatigué par ces dernières, accepte davantage par reflexe que par réel consentement.

Le RGPD intervient donc pour encadrer les différents stades que peut connaitre la donnée, en vue d’une meilleure compréhension pour les utilisateurs de ce qui est fait de leurs données personnelles. L’objectif : qu’ils puissent exercer un choix éclairé, en toute transparence de façon à garder un œil sur leurs données.

Michel Juville dans The Programmatic Society a interrogé Margarita Zlatkova sur les évolutions liées à la réglementation des données. Selon elle, la nouvelle réglementation doit mener à :

« une réinvention de la communication des marques et des consommateurs, avec notamment le pack de confiance sur la collecte de leur donnée. Les consommateurs sont opposés dans l’utilisation massive de leur donnée, mais s’il y a un retour correct ils ne sont pas opposés. La data n’intervient pas juste dans le ciblage publicitaire, elle est là dans tout le process, depuis la compréhension du consommateur jusqu’à la vente ».