Skip to main content

Hva er dataintegrasjon?

Dataintegrasjon er sammenslåing av flere datakilder til en enkelt datakilde.Denne praksisen er ofte veldig tidkrevende og involvert, ettersom de forskjellige datakildene sannsynligvis er uforenlige med hverandre.Ting så enkelt som forskjellige kolonnenavn på et regneark er nok til å kreve datoformating.Denne prosessen er mest vanlig i situasjoner der to grupper startet uten forbindelse, men er plassert sammen etter at de har jobbet uavhengig.Dataintegrasjon har blitt et viktigere tema på grunn av utbredelsen av gratis datakilder og online databaser.

Data -delen av dataintegrasjon kan være nesten hva som helst så lenge den er lagret i et datasystem.Det faktiske innholdet i dataene er sjelden like viktig som måten dataene lagres på.Det meste av tiden oppbevares dataene i databaser, organiserte informasjonssystemer.Disse systemene inneholder unike oppføringer og felt som lar brukere finne informasjon raskt.

Det største hinderet for enhver dataintegrasjonsprosess er selve dataene.I mange tilfeller, når dataene først ble satt opp, var det ingen intensjoner om å slå sammen datasettet med en annen.Dette betyr at selv om to datasett kan referere til det samme, er de helt uforenlige.

Nesten hva som helst vil gjøre databaser uforenlige.Noe så enkelt som en forskjell i presentasjon, for eksempel feltordre eller kolonnebredde, kan være nok til å forhindre en enkel fusjon.Når dataene er betydelig annerledes, for eksempel en database som inneholder mer eller mindre informasjon, er sammenslåingen mye vanskeligere.

De to situasjonene som krever dataintegrasjon mer enn noen annen er i virksomheten og forskningsfeltene.I næringslivet krever sammenslåing av avdelinger eller selskaper å kombinere den tidligere separate informasjonen til en enkelt struktur.Denne formen for integrasjon er generelt veldig vanskelig med mindre de originale gruppene brukte lignende programvare og hadde lignende informasjonsmål.

Når dataintegrasjon utføres for forskningsformål, blir det generelt mye jevnere.Når en forsker gir tilgang til informasjonen sin til en annen, ser de to partiene generelt på den samme prosessen.Dette betyr at de vil bruke lignende metoder for å katalogisere og lagre dataene sine.

I det siste var dataintegrasjon et relativt lite område av datastudier, men dette har endret seg siden den tidlige delen av det 21. århundre.Med gratis online databaser blir mer populære og nøyaktige, rusler selskaper for å få informasjonen i et delbart format.Dette lar dem både gi ut informasjonen sin i en offentlig form og integrere private versjoner av kjente offentlige grensesnitt i systemene sine.