Skip to main content

Hvad er ETL?

Tænk på det som husrensning for dine data.ETL står for ekstrakt, transformation og belastning.ETL er software, der gør det muligt for virksomheder at konsolidere deres forskellige data, mens de flytter dem fra sted til sted, og det betyder ikke rigtig noget, at data er i forskellige former eller formater.Dataene kan komme fra enhver kilde.ETL er kraftig nok til at håndtere sådanne dataforskelle.

For eksempel kan en finansiel institution have oplysninger om en kunde i flere afdelinger, og hver afdeling kan have, at kunders oplysninger, der er anført på en anden måde.Medlemskabsafdelingen viser muligvis kunden ved navn, mens regnskabsafdelingen muligvis viser kunden efter nummer.ETL kan bundte alle disse data og konsolidere dem til en ensartet præsentation, f.eks. Til lagring i en database eller datavarehus.

En anden måde, som virksomheder bruger ETL på, er at flytte information til en anden applikation permanent.For eksempel kan ordbehandlingsdata oversættes til tal og bogstaver, som er lettere at spore i et regneark eller databaseprogram.Dette er især nyttigt til sikkerhedskopiering af oplysninger, når virksomhederne helt overgår til ny software.

En vigtig funktion af ETL er rensningsdata.ETL -konsolideringsprotokollerne inkluderer også eliminering af duplikat- eller fragmentariske data, så det, der passerer fra E -delen af processen til L -delen, er lettere at assimilere og/eller gemme.Sådanne rensningsoperationer kan også omfatte eliminering af visse slags data fra processen.Hvis du ikke ønsker at medtage visse oplysninger, kan du tilpasse din ETL til at eliminere den slags information fra din transformation.

T -delen af ligningen er selvfølgelig den mest kraftfulde.ETL kan transformere ikke kun data fra forskellige afdelinger, men også data fra forskellige kilder.For eksempel kunne data i et e -mail -program såsom Microsoft Outlook transformeres lige sammen med data fra en SAP -fremstillingsapplikation, hvor resultatet er data om en fælles tråd til sidst.Microsoft laver selvfølgelig en ETL -pakke, ligesom Oracle og IBM.