Data préparation, ou comment démocratiser la BI ?

Du marketing classique à la Business Intelligence

Il va sans dire qu’aujourd’hui, notre monde évolue très vite…le marketing aussi. La discipline qui prend ses racines dans une vision très « product centric », évolue et les méthodes classiques (comme les 4P) ne fonctionnent plus. Après avoir affûté sa vision et être passé « consumer centric », le marketing considère désormais l’individu en tant qu’humain et prend conscience de ses valeurs sociétales, environnementales.


Nos entreprises se sont repositionnées pour partager ces valeurs avec leurs clients. Alors que le marketing pivotait doucement d’un archétype de masse à un modèle personnalisé, on entendit au loin un grand « boom ». Il s’agissait bien sûr de l’arrivée de la donnée. Utilisée rapidement et massivement par les plus grandes organisations, une nouvelle vision émerge. On assiste progressivement à un bouleversement des activités, métiers, business modèles et organisations internes.

Au début, seules les grandes entreprises développent ce qu’on appelle aujourd’hui la Business Intelligence. Les plus petites entreprises restent dans les schémas plus classiques. Toutefois l’écart qui s’est autrefois creusé, se resserre. Les solutions BI vont de bons trains dans de plus en plus d’organisations. En cause, le fort potentiel de valeur ajoutée qui fait office d’appât pour les sociétés grandissantes sur leurs marchés.

Avec quel outil BI exploiter les données internes et externes ? Comment avoir une vision augmentée et prendre les bonnes décisions ? Pourquoi homogénéiser la stratégie d’entreprise ? Comment désiloter les métiers et être plus agile ? Quels indicateurs pour augmenter et monitorer la performance ?  

Beaucoup de questions, auxquelles répondent beaucoup de solutions (comme le prouve ce landscape). La Business Intelligence qui promet une belle rentabilité, en demande un juste prix. Désormais l’enjeu est de taille pour les entreprises. Il s’agît non pas d’investir dans un (ou plusieurs) nouveau(x) outil(s), mais bien de s’en servir efficacement, dans un environnement ou il faut qualifier la donnée, l’intégrer dans des outils pas toujours adaptés et mettre en place les nouveaux process dans le quotidien des collaborateurs, parfois réticents.

Un questionnement de fond apparaît : comment être proactif dans cette intégration complexe ? La réponse se trouve dans la Data Préparation. Il s’agît d’une nouvelle entité du SI décisionnel qui qualifie les besoins et autonomise les utilisateurs métiers. L’objectif ? Confier le travail de la donnée aux personnes qui en connaissent la valeur.

Il se trouve que Synaltic Group, (acteur de référence dans le domaine) propose plusieurs éléments de réponse dans son livre blanc « La data préparation, un enjeu pour la nouvelle BI ». Il est téléchargeable ici.

Une lecture très intéressante. Elle référence 3 axes d’analyses pour bien comprendre les enjeux et opérer une intégration de la Business Intelligence dans les meilleures conditions :

  • Comprendre les limites de la BI dans un monde agile
  • Adapter la BI aux besoins du marché
  • Démocratiser la transformation des données
La Data Préparation, un enjeu pour les entreprises.

Comprendre les limites de la BI dans un monde agile

« Dans son état actuel, la BI ne permet qu’à un nombre restreint de personnes de pratiquer la transformation de la donnée »

Lire « La data préparation, un enjeu pour la nouvelle BI » par Synaltic Group.

Voilà la prise de position de Synaltic sur le sujet. L’inconvénient de la BI classique se trouve dans la mise en place et la gestion des data warehouse, un chantier pour le moins complexe.

En effet, on remarque deux conséquences à la complexité de ces chantiers :

  • Le temps de développement de l’activité BI, qui augmente proportionnellement avec le nombre d’indicateurs à suivre pour l’entreprise.
  • Le temps de formation des utilisateurs métiers. Il se trouve que la Business Intelligence est beaucoup plus rigide qu’il n’y parait. Il faut donc trouver le bon moyen d’intégrer de nouvelles fonctionnalités.

On trouve aussi une conséquence, transverse à la mise en place de datawarehouse : l’enrichissement en données. Cette tâche n’est pas simple pour les utilisateurs finaux, qui passe la plupart du temps par des ingénieurs informatiques, des concepteurs de flux ETL (permettent d’alimenter les serveurs) et des gestionnaires de bases de données. Avec la data préparation, l’entreprise peut passer d’un cycle de traitement data de 12 à 3 semaines, avec des analyses de meilleures qualités.

Adaptation aux besoins du marché : de la BI à la Data Préparation

Fort heureusement, le boom du digital et de l’IoT démocratise la BI et celle-ci s’adapte aux besoins du marché. Par ailleurs il s’étend aujourd’hui au-delà du simple écosystème interne de l’entreprise mais prend en compte son macro-environnement (clients, partenaires, concurrents).

Avec l’ajout de nombreuses variables dans des entreprises non expertes, une nouvelle Business Intelligence naît et propose des outils plus simples d’utilisations. On ne parle plus de data warehouse mais de logiciels qui viennent en complément de ceux utilisés actuellement par les clients B2B. Ainsi, l’entreprise peut proposer des interfaces plus simples qui ne nécessitent pas l’intervention d’informaticiens, ni de formation aux processus ETL (Extract, Transform and Load). Pour être plus précis, les données modifiées prennent la forme d’un script qui automatise l’enrichissement et le nettoyage des données.

Le confort est donc la clé de voûte de cette nouvelle BI, qui une fois automatisée est naturellement plus flexible que son ancêtre : on peut facilement manipuler la data, ce de manière collaborative avec une gouvernance établie par l’entreprise.

Un autre point fort à noter, la visualisation de la data. Elle est faite dans un langage simple, que toutes les équipes peuvent comprendre. L’objectif de cette visualisation simplifiée se trouve dans la possibilité d’échange entre utilisateurs métiers. Plus de jargon commerciaux, marketing ou autres, l’ensemble des collaborateurs se comprennent. Par ailleurs on peut deviner que cette hausse de la compréhension en interne favorisera très naturellement la rapidité et l’agilité des processus BI.

Plongeons au cœur du sujet : comment préparer le flux de donnée ?

Démocratiser la transformation des données

La Data préparation permet au moyen d’un outil unique, de traiter les jeux de données en suivant différentes étapes :

La Data préparation éxplpliquée par Synaltic Group.

Regardons ensemble les recommandations de Synaltic Group.

  • Phase I : Importer

 Il s’agît ici de bien identifier les besoins de l’entreprise puisque chaque solution BI ne proposera pas les mêmes propriétés fonctionnelles. Il faut donc savoir d’où est-ce que l’on souhaite extraire les données : depuis des fichiers locaux ? Un cloud ? Une application externe ? requêtes provenant de bases de données ?

  • Phase II : Découvrir 

Dans la phase découverte, on retrouve la plupart du temps un affichage au format tableur, facilement lisible par tous. Cette vision de synthèse permet un premier aperçu des jeux de données avec le format et le type de chaque donnée. Certaines solutions disposent même de graphiques à barres qui mettent en avant la qualité du flux.

La découverte du jeu de donnée est une étape importante puisqu’elle précède la manipulation de celui-ci. Plus on connait le flux, plus on est en capacité de produire des rapports précis, rapidement.

  • Phase III : Organiser 

Il s’agît d’une étape phare de la data préparation, qui facilitera grandement le nettoyage du flux (l’étape suivante de ce process). Il faut ici se poser des questions de logique pour organiser la donnée au mieux. Une fois le fichier lisible, cohérent, un modèle dimensionnel de l’entreprise apparaît. On y voit mieux la valeur ajoutée de la data préparation. En effet, « la finalité du data warehouse est désormais accessible à une personne non experte en informatique ».

Quelques questions que l’on peut se poser : Le contenu est-il plausible ? Les colonnes sont-elles bien intitulées ? Sont-elles organisées dans un ordre logique ?

  • Phase IV : Nettoyer 

Il faut savoir qu’un jeu de donnée mal nettoyé peut avoir des impacts considérables sur l’activité de l’entreprise. Pour ne pas polluer ce travail, il faut faire confiance aux compétences métiers des collaborateurs qui s’assureront que chaque cellule contient un résultat plausible, adéquat avec l’intitulé de la colonne à laquelle il appartient. En effet il est possible que des résultats soient faussés à cause de mauvaises manipulations, une vérification s’impose. La nouvelle BI s’équipant d’outils collaboratifs, ce travail de nettoyage est simplifié par l’accessibilité du fichier et la possibilité d’échange que cela génère.

Une fois ce nettoyage rigoureusement opéré, le jeu de donnée est clair et on constate un gain de temps sans précédent sur la construction des tableaux.

  • Phase V : Enrichir 

C’est une étape indispensable lorsqu’une entreprise travaille avec plusieurs jeux de données. Toutefois une société qui n’en regarde qu’un seul pourra se passer de l’enrichissement. Cette étape consiste à mettre en corrélation plusieurs colonnes des tableurs pour en tirer de enseignements (addition, soustraction, pondération, moyenne etc…). La combinaison de plusieurs sources de données permet de prendre encore plus de hauteur sur l’écosystème de l’entreprise et augmente sa compréhension : une véritable valeur ajoutée.

  • Phase VI : Valider 

Sur cette phase de validation, on peut à nouveau profiter de la dimension collaborative des solutions du marché. Il s’agît donc de travailler en équipe autour d’un GO final. Il peut être bon de confronter ces résultats à d’autres experts de l’entreprise pour avoir un avis extérieur. Bien entendu, il s’agît ici de travailler dans une démarche proactive et de noter toute erreur pour éviter d’en refaire les frais lors de l’élaboration de nouveaux tableaux.

  • Phase VII : Publier 

On parle ici de l’exportation des résultats analytiques brut, qu’il conviendra de mettre sous forme de tableaux, lisibles par tous. Ces rapports mettent en lumière une dimension très stratégique, aussi il faudra bien cibler les destinataires de ces études. Naturellement, cette étape s’accompagne de la préparation d’un pitch dédié.

A noter que la plus-value de la data préparation ne se trouve pas dans ces étapes (qui n’innovent pas réellement), mais bien dans l’outil utilisé qui enregistrera les modifications apportées comme des scripts. Ces mêmes scripts qui permettent d’une part la montée en compétence rapide des équipes, et d’autre part l’amélioration continu des rapports produits.  L’idée est donc de mettre en donnée le processus interne de l’entreprise lorsqu’elle modifie, nettoie, enrichie et produit les données. L’objectif est ici d’enregistrer le script et de l’appliquer à d’autres jeux de données, faisant ainsi gagner un temps précieux à l’ensemble des équipes du projet BI.

Pour aller plus loin dans la Data préparation

Pour aller plus loin, le livre blanc de Synaltic Groupe (téléchargeable ici) présente un Benchmark très complet qui cerne et comprend de nombreux besoins, et propose des solutions dédiées.

« La data préparation, un enjeu pour la nouvelle BI » s’avère être une lecture très intéressante, qui nous indique de la Business Intelligence s’ouvre à tous. Opportunité ou menace en interne ? A chacun d’identifier ses besoins et d’en faire comprendre les enjeux aux collaborateurs.