Disposer d'un référentiel unique de données est le rêve de toute entreprise et de tout informaticien. Mais la réalité est souvent bien différente. C'est ce qu'expliquait Raphaël Bénoliel, directeur de la division EIM (Enterprise Information Management) chez Business & Decision, lors de la Matinale du MDM qu'organisait cette SSII le 2 juin dernier : « Le système d'information d'une entreprise est émietté entre les multiples d'applications dont elle dispose : ERP, CRM, datawarehouse... Ce sont des silos qui ont du mal à répondre aux besoins des métiers, qui ont du mal à s'étendre. C'est particulièrement vrai lorsque l'entreprise veut déployer une stratégie Internet agressive. Il faut donc rendre les systèmes plus agiles, adopter une approche plus transversale, regrouper les données dans un point central. Par ailleurs, de nouvelles contraintes poussent également à ce genre d'approche, en particulier des dispositions réglementaires qui insistent sur la traçabilité des données. »
La centralisation des données n'est pas une opération neutre. Elle suppose une participation très large des différents acteurs de l'entreprise pour bien établir leurs caractéristiques mais aussi les faire évoluer dans le temps. La gouvernance des données est donc essentielle : cette notion, difficile à définir, suppose une prise de décision collective et coordonnée.
Quel sont les types de données concernés par le MDM ? Les premières catégories citées sont les produits et les clients. Encore que pour cette deuxième catégorie, plutôt volatile, tout le monde ne soit pas d'accord. Mais les données de référence peuvent être bien plus variées. Antoine Chauvet, responsable practice MDM chez Business & Decision, cite deux autres types de référentiels : le c'ur de métier de l'entreprise (par exemple les brevets pour une entreprise pharmaceutique, la flotte de véhicules pour un loueur) et les données de support, par exemple pour la RH, les finances, l'organisation.
La définition des données ou les subtilités de la sémantique
Joël Richardeau, directeur practice Green chez Business & Decision, constate que la définition d'une master data (donnée maître) n'est pas chose aisée. « Les notions ne sont pas toujours claires. Il peut y avoir plusieurs définitions du chiffre d'affaires dans une entreprise selon les services. Autre exemple : quelle est la différence entre "forfait", "package" et "bundle" lorsque ces différents mots sont utilisés par différents services ? Il est donc important de travailler en mode collaboratif, de constituer un groupe de personnes pour donner un sens commun aux données de l'entreprise.
La puissance de modélisation des solutions de MDM est donc essentielle. C'est le point que met en avant l'éditeur spécialisé Orchestra Networks. Les possibilités de modélisation de sa solution EBX.Platform sont extrêmement riches et peuvent prendre en compte tous les aspects des données d'un métier sans limitation de structure ou de technologie, ce qui permet d'effectuer rapidement des prototypes donnant à voir aux utilisateurs des modèles concrets que l'on peut immédiatement corriger et adapter. L'outil permet aussi de définir des branches pour anticiper sur l'avenir. Il comporte aussi un moteur d'héritage, qui permet d'adapter des données globales (par exemple un catalogue mondial) à des situations locales par simple surcharge.
Les différents types d'architectures
Une application de MDM peut se présenter sous des formes variées. On distingue 3 types principaux d'architecture :
1. L'application MDM centralisée ou externalisée, située en amont de toutes les applications de l'entreprise, constitue le point d'entrée des données qui sont ensuite propagées à l'ensemble des consommateurs. « La mise en place d'une telle structure ambitieuse peut être longue et complexe », prévient Bruno Labidoire, directeur technique Europe du Sud d'Informatica. « Attention à l'effet tunnel et à l'impact sur les applications..
2. Le MDM est assuré sous la forme d'un hub situé au carrefour de toutes les applications. Il reçoit les informations des applications, les structure, les complète, les nettoie, puis les redistribue. Informatica distingue deux types de MDM « centraux » : le hub d'identité, qui contient des pointeurs vers les applications sans copie des données, et le mode « coexistence » avec réplication des données dans le MDM.
3. Un MDM en aval de toutes les applications est également possible. Il sert à dépolluer les flux mais ne repropage pas les données. Il permet de gagner en qualité sur les applications stratégiques comme le CRM ou la BI. Aussi nommé référentiel analytique, ce type de MDM de reprise des données améliore la qualité des données sans améliorer les processus. Il peut être considéré comme une première étape de mise en place d'un MDM.
En pratique, les projets MDM sont très variés. Et les architectures effectivement mises en place sont souvent hybrides. En particulier, certains systèmes (comme l'IBM i, ex-AS/400) doivent conserver leurs données en interne et il y aura obligatoirement réplication, même pour une architecture centralisée. La mise en ?uvre d'une MDM ne se fait pas nécessairement sous la forme d'un hub unique. Orchestra Networks vient, par exemple, de lancer D3 (Distributed Data Delivery), nouveau module d'EBX.Platform, destiné à la mise en place d'une architecture MDM distribuée, donnant plus de souplesse et de sécurité à des ensembles hétérogènes et répartis sur plusieurs sites distants.
Commencer avec des projets ciblés et de taille modeste
Selon le type d'architecture envisagé et le périmètre du projet, l'impact sur les applications est plus ou moins important. La mise en place d'un référentiel analytique n'a que peu d'impact sur les applications. Les autres architectures entraînent des modifications, la plus perturbante étant le MDM amont.
Il existe une grande variété de projets MDM mais ce n'est en aucun cas un gros projet d'infrastructure qui remet en cause le fonctionnement de l'entreprise. Les entreprises qui ont tiré profit du MDM ont toutes commencé par un petit projet ciblé. Ce que confirme Antoine Chauvet : « Il faut trouver le plus petit ensemble qui peut apporter quelque chose au métier, au niveau du nombre de classes, de processus, de systèmes d'information. Un projet avec cinq classes, un processus, un système est un projet réaliste. »
La stratégie de mise en ?uvre d'un MDM passe par plusieurs étapes : analyse et détermination du périmètre, migration des données, déduplication, maintenance de la cohérence du référentiel. Le système s'étend progressivement par une mise en commun graduelle et une extension du périmètre. Le projet initial peut se mener en 3 à 6 mois.
Après avoir consolidé et standardisé toutes les données, l'entreprise dispose des moyens d'industrialiser et d'étendre son référentiel de données pour de multiples usages. Ainsi Boulanger, distributeur de produits électroniques domestiques, s'appuie-t-il sur son MDM, réalisé avec le produit MDM Server for PIM d'IBM, aussi bien pour son catalogue papier que pour son site Web, ses campagnes d'e-mailing, ou encore les étiquettes très documentées qu'il associe à ses produits.
Des solutions variées éditées par des spécialistes ou de grands acteurs
Très naturellement, les grands fournisseurs de progiciels d'entreprise se sont toujours préoccupé de gérer les référentiels de données : Oracle et SAP proposent donc des solutions MDM. C'est aussi le cas des spécialistes de la BI et de la gestion de données d'entreprise comme SAP BusinessObjects, Information Builders, IBM/Cognos, DataFlux ou Informatica. Sans oublier les spécialistes du middleware comme Tibco. On rencontre aussi des éditeurs spécialisés ou atypiques, comme Talend, spécialiste de la gestion de donnée en mode Open Source, Microsoft, qui a ajouté un module de MDM issu d'un rachat dans SQL Server, ou Orchestra Networks, spécialiste du MDM. Mais de nombreux acteurs spécialisés ont été rachetés par d'autres éditeurs : Siperian par Informatica, Initiate Systems par IBM, Amalto par Talend.
René Beretz