Skip to main content

Co to jest ETL?

Pomyśl o tym jak o house -kleining dla swoich danych.ETL oznacza ekstrakt, transformację i obciążenie.ETL to oprogramowanie, które umożliwia firmom konsolidację ich różnych danych podczas przenoszenia ich z miejsca na miejsce, i tak naprawdę nie ma znaczenia, że dane są w różnych formatach lub formatach.Dane mogą pochodzić z dowolnego źródła.ETL jest wystarczająco potężny, aby poradzić sobie z różnicami takich danych.

Na przykład instytucja finansowa może mieć informacje o kliencie w kilku działach, a każdy dział może mieć informacje o klientach wymienionych w inny sposób.Dział członkowski może wymienić klienta po nazwie, podczas gdy dział księgowości może wymienić klienta według numeru.ETL może pakować wszystkie te dane i skonsolidować je w jednolitą prezentację, na przykład do przechowywania w bazie danych lub hurtowni danych.

Innym sposobem, w jaki firmy korzystają z ETL, jest trwałe przeniesienie informacji do innej aplikacji.Na przykład dane dotyczące przetwarzania słów mogą być przetłumaczone na liczby i litery, które są łatwiejsze do śledzenia w arkuszu kalkulacyjnym lub programie bazy danych.Jest to szczególnie przydatne w tworzeniu kopii zapasowych informacji, ponieważ firmy całkowicie przechodzą na nowe oprogramowanie.

Jedną ważną funkcją ETL jest oczyszczenie danych.Protokoły konsolidacji ETL obejmują również eliminację duplikatów lub fragmentarycznych danych, tak że to, co przechodzi z części E Proces do części L, jest łatwiejsze do asymilacji i/lub przechowywania.Takie operacje oczyszczania mogą również obejmować wyeliminowanie niektórych rodzajów danych z procesu.Jeśli nie chcesz zawierać określonych informacji, możesz dostosować ETL do wyeliminowania tego rodzaju informacji z transformacji.

Część równania jest oczywiście najpotężniejsza.ETL może przekształcić nie tylko dane z różnych działów, ale także dane z różnych źródeł.Na przykład dane w programie e -mail, takim jak Microsoft Outlook, mogą zostać przekształcone w prawo wraz z danymi z aplikacji produkcyjnej SAP, przy czym wyniki są w końcu dane wspólnego wątku.Microsoft oczywiście tworzy pakiet ETL, podobnie jak Oracle i IBM.