Sélectionnez votre langue

La Gestion des Données de Référence (GDR)

Il existe essentiellement cinq types de données dans les organisations :


- Non structurées - Ces données se trouvent dans les courriels, les livres blancs, les articles de magazine, les portails intranet de l'entreprise, les spécifications de produit, les documents de marketing et les fichiers PDF.

- Transactionnelles - Ces données sont liées aux ventes, aux commandes, aux factures, aux entrées, aux réclamations, à la paye, etc .

- Métadonnées - Ce sont celles qui concernent les données de l'entrepôt de données. Elles peuvent résider dans le référentiel ou sous diverses autres formes telles que des documents XML, des définitions de rapports, des descriptions de colonnes dans un fichier journal.

- Hiérarchique - Les données hiérarchiques indiquent les relations entre les autres données. Elles peuvent être stockées séparément en tant que descriptions de relations du monde réel, telles que les structures organisationnelles des entreprises ou les lignes de produits.

Pour extraire la valeur de ces données en réalisant des analyses pertinentes, la GDR est un préalable incontournable.


Les données de base décrivent les propriétés orientées métier des objets de données qui sont utilisés dans les différentes applications à travers l'organisation ainsi que leurs métadonnées associées, attributs, définitions, rôles, connexion et taxonomies.

Les données de base sont la clé de l’activité et se répartissent généralement en quatre catégories :

  • Les personnes,
  • Les choses,
  • Les lieux,
  • Et les concepts.

En outre, elles sont regroupées selon des domaines, ou types d'entités. Par exemple, au sein des personnes, il y a les clients, les employés et le personnel extérieur à l’entreprise.

Parmi les choses, on trouve les produits, les magasins, les marchandises et les actifs.

Au sein des concepts, on trouve des éléments tels que les contrats, la garantie et les licences.

Enfin, au sein des lieux, il y a les bureaux, les sites de production, de stockage et les divisions géographiques.

Certains de ces domaines peuvent être subdivisés. Les clients peuvent être encore segmentés en fonction de leur priorité, leur notation crédit. Le produit peut être segmenté davantage par catégorie, secteur et industrie.

Lorsque plusieurs systèmes informatiques composent le système d’information, on constate des définitions différentes du même objet, créant des données incohérentes et donc des analyses imprécises.


Pour éviter cela, la GDR est une combinaison d'applications et de technologies qui consolident, nettoient, augmentent les données de l'organisation et les synchronisent avec toutes les applications, les processus d'affaires et les outils analytiques.

En termes de qualité des données, elle permet l'intégration des données et d’avoir la version unique de la vérité. Si les données ne représentent pas fidèlement la réalité, alors elles sont inexploitables.

La GDR n'est pas seulement un problème technologique.


Dans de nombreux cas, des changements fondamentaux au processus de l’activité de l’organisation seront nécessaires pour maintenir des données de base propres, et certains des problèmes de GDR les plus difficiles sont plus politiques que techniques.

Mais cet investissement dans la GDR apporte des améliorations significatives en termes d’efficacité opérationnelle, de précision des rapports et de prise de décisions stratégiques.

« Le MDM est la dernière tentative pour résoudre le vieux problème des versions incohérentes des données critiques au centre d'une organisation » , a déclaré Andrew White, vice-président de la recherche au sommet Gartner 2011.

 

Un plan de projet GDR est associé aux exigences, aux priorités, à la disponibilité des ressources, au calendrier et à la taille du problème.


Selon Roger Wolter, Microsoft Inc, la plupart des projets de GDR comprennent au moins les phases suivantes :

  1. Identifier les sources de données de base.
  2. Déterminer les consommateurs des données de base.
  3. Collectez et analysez les métadonnées de vos données de base.
  4. Nommez des gestionnaires de données.
  5. Mettez en œuvre un programme de gouvernance des données et un conseil de gouvernance des données.
  6. Développer le modèle de données de référence.
  7. Choisir un ensemble d'outils.
  8. Concevoir l'infrastructure.
  9. Générer et tester les données de base.
  10. Modifier les systèmes de production et de consommation.
  11. Mettre en œuvre les processus de maintenance.