Skip to main content

Vad är dataintegration?

Dataintegration är sammanslagningen av flera datakällor till en enda datakälla.Denna praxis är ofta mycket tidskrävande och involverad, eftersom de olika datakällorna troligen är oförenliga med varandra.Saker så enkla som olika kolumnnamn i ett kalkylblad är tillräckligt för att kräva datum omformatering.Denna process är vanligast i situationer där två grupper började utan anslutning, men placeras tillsammans efter att de har arbetat självständigt.Dataintegration har blivit ett viktigare ämne på grund av förekomsten av gratis datakällor och onlinedatabaser.

Datadelen av dataintegration kan vara nästan vad som helst så länge den lagras i ett datorsystem.Det faktiska innehållet i uppgifterna är sällan lika viktigt som hur data lagras.För det mesta hålls uppgifterna i databaser, organiserade informationssystem.Dessa system innehåller unika poster och fält som gör det möjligt för användare att hitta information snabbt.

Det största hinderet för alla dataintegrationsprocesser är själva uppgifterna.I många fall, när uppgifterna först inrättades, fanns det ingen avsikt att någonsin slå samman datasättet med ett annat.Detta innebär att även om två datasätt kan hänvisa till samma sak, är de helt oförenliga.

Nästan allt kommer att göra databaser oförenliga.Något så enkelt som en skillnad i presentation, till exempel fältordning eller kolumnbredd, kan vara tillräckligt för att förhindra en enkel sammanslagning.När uppgifterna är betydligt olika, till exempel en databas som innehåller mer eller mindre information, är sammanslagningen mycket svårare.

De två situationerna som kräver dataintegration mer än någon annan är inom verksamheten och forskningsområdena.I näringslivet kräver sammanslagningsavdelningar eller företag att kombinera den tidigare separata informationen till en enda struktur.Denna form av integration är i allmänhet mycket svår om inte de ursprungliga grupperna använde liknande programvara och hade liknande informationsmål.

När dataintegration utförs för forskningsändamål går det i allmänhet mycket jämnare.När en forskare ger tillgång till sin information till en annan undersöker de två parterna i allmänhet samma process.Detta innebär att de kommer att använda liknande metoder för att katalogisera och lagra sina data.

Tidigare var dataintegration ett relativt mindre område av datastudier, men detta har förändrats sedan den tidiga delen av 2000 -talet.Med gratis onlinedatabaser som blir mer populära och exakta, kryper företag för att få sin information i ett delbart format.Detta gör att de både kan släppa sin information i en offentlig form och integrera privata versioner av välkända offentliga gränssnitt i sina system.