Skip to main content

Wat is gegevensintegratie?

Gegevensintegratie is het samenvoegen van meerdere gegevensbronnen in een enkele gegevensbron.Deze praktijk is vaak erg tijdrovend en betrokken, omdat de verschillende gegevensbronnen waarschijnlijk onverenigbaar met elkaar zijn.Dingen zo eenvoudig als verschillende kolomnamen op een spreadsheet zijn voldoende om dat opnieuw te formatteren.Dit proces komt het meest voor in situaties waarin twee groepen zonder verbinding zijn begonnen, maar samen worden geplaatst nadat ze onafhankelijk hebben gewerkt.Gegevensintegratie is een belangrijker onderwerp geworden vanwege de prevalentie van gratis gegevensbronnen en online databases.

Het gegevensonderdeel van gegevensintegratie kan bijna alles zijn, zolang het in een computersysteem wordt opgeslagen.De werkelijke inhoud van de gegevens is zelden zo belangrijk als de manier waarop de gegevens worden opgeslagen.Meestal worden de gegevens bewaard in databases, georganiseerde informatiesystemen.Deze systemen bevatten unieke vermeldingen en velden waarmee gebruikers snel informatie kunnen vinden.

De grootste hindernis voor elk gegevensintegratieproces is de gegevens zelf.In veel gevallen, toen de gegevens voor het eerst werden opgezet, was het niet de bedoeling om de gegevensset ooit samen te voegen met een andere.Dit betekent dat hoewel twee datasets naar hetzelfde kunnen verwijzen, ze volledig onverenigbaar zijn.

Bijna alles zal databases onverenigbaar maken.Iets eenvoudigs als een verschil in presentatie, zoals veldvolgorde of kolombreedte, kan voldoende zijn om een gemakkelijke fusie te voorkomen.Wanneer de gegevens aanzienlijk verschillen, zoals één database die min of meer informatie bevat, is het samenvoegen veel moeilijker.

De twee situaties die meer vragen om gegevensintegratie te vragen dan welke andere dan ook in het bedrijfsleven en de onderzoeksvelden.In de zakenwereld moeten fusieafdelingen of bedrijven de eerder afzonderlijke informatie combineren in één structuur.Deze vorm van integratie is over het algemeen erg moeilijk, tenzij de oorspronkelijke groepen vergelijkbare software gebruikten en vergelijkbare informatiedoelen hadden.

Wanneer gegevensintegratie wordt uitgevoerd voor onderzoeksdoeleinden, gaat het over het algemeen veel soepeler.Wanneer de ene onderzoeker toegang geeft tot zijn informatie aan de andere, onderzoeken de twee partijen over het algemeen hetzelfde proces.Dit betekent dat ze vergelijkbare methoden zullen gebruiken als catalogus en hun gegevens opslaan.

In het verleden was gegevensintegratie een relatief klein gebied van gegevensstudies, maar dit is veranderd sinds het begin van de 21e eeuw.Omdat gratis online databases populairder en nauwkeuriger worden, kloppen bedrijven om hun informatie in een deelbaar formaat te krijgen.Dit stelt hen in staat om zowel hun informatie in een openbare vorm vrij te geven als privéversies van bekende openbare interfaces in hun systemen te integreren.