Skip to main content

Qu'est-ce que l'intégration des données?

L'intégration des données est la fusion de plusieurs sources de données en une seule source de données.Cette pratique est souvent très longue et impliquée, car les différentes sources de données sont probablement incompatibles les unes avec les autres.Des choses aussi simples que différents noms de colonnes sur une feuille de calcul sont suffisantes pour exiger la reformatage de la date.Ce processus est le plus courant dans les situations où deux groupes ont commencé sans connexion, mais sont placés ensemble après avoir travaillé indépendamment.L'intégration des données est devenue un sujet plus important en raison de la prévalence des sources de données gratuites et des bases de données en ligne.

La partie de données de l'intégration des données peut être presque n'importe quoi tant qu'elles sont stockées dans un système informatique.Le contenu réel des données est rarement aussi important que la manière dont les données sont stockées.La plupart du temps, les données sont conservées dans des bases de données, des systèmes d'information organisés.Ces systèmes contiennent des entrées et des champs uniques qui permettent aux utilisateurs de trouver rapidement des informations.

Le plus grand obstacle à tout processus d'intégration de données est les données elle-même.Dans de nombreux cas, lorsque les données ont été configurées pour la première fois, il n'y avait aucune intention de fusionner jamais l'ensemble de données avec un autre.Cela signifie que même si deux ensembles de données peuvent se référer à la même chose, ils sont totalement incompatibles.

Presque tout rend les bases de données incompatibles.Quelque chose d'aussi simple qu'une différence de présentation, comme l'ordre sur le terrain ou la largeur de la colonne, peut être suffisant pour éviter une fusion facile.Lorsque les données sont significativement différentes, comme une base de données qui contient plus ou moins d'informations, la fusion est beaucoup plus difficile.

Les deux situations qui appellent à l'intégration des données plus que toute autre sont dans l'entreprise et les domaines de recherche.Dans le monde des affaires, la fusion des départements ou des entreprises nécessite de combiner les informations précédemment séparées en une seule structure.Cette forme d'intégration est généralement très difficile à moins que les groupes d'origine n'utilisaient un logiciel similaire et avaient des objectifs d'information similaires.

Lorsque l'intégration des données est effectuée à des fins de recherche, elle devient généralement beaucoup plus fluide.Lorsqu'un chercheur donne accès à ses informations à une autre, les deux parties examinent généralement le même processus.Cela signifie qu'ils utiliseront des méthodes similaires pour cataloguer et stocker leurs données.

Dans le passé, l'intégration des données était un domaine relativement mineur des études de données, mais cela a changé depuis le début du 21e siècle.Les bases de données en ligne gratuites devenant plus populaires et précises, les entreprises se précipitent pour obtenir leurs informations dans un format partagable.Cela leur permet à la fois de publier leurs informations sous une forme publique et d'intégrer des versions privées d'interfaces publiques bien connues dans leurs systèmes.