Skip to main content

ETLとは何ですか?

dataデータのためのハウスクリーニングと考えてください。ETLは、抽出、変換、負荷の略です。ETLは、企業が場所から場所へと移動しながら異なるデータを統合できるようにするソフトウェアであり、そのデータが異なる形式または形式であることは実際には重要ではありません。データは任意のソースから届くことができます。ETLはそのようなデータの格差を処理するのに十分強力です。たとえば、金融機関はいくつかの部門の顧客に関する情報を持っている可能性があり、各部門は顧客情報を別の方法でリストしている可能性があります。会員部門は名前で顧客をリストする場合がありますが、会計部門は顧客を番号ごとにリストする場合があります。ETLは、このすべてのデータをバンドルし、データベースやデータウェアハウスに保存するなど、均一なプレゼンテーションに統合できます。たとえば、単語処理データは数字と文字に変換される場合があり、スプレッドシートまたはデータベースプログラムで簡単に追跡できます。これは、企業が新しいソフトウェアに完全に移行するにつれて情報をバックアップするのに特に役立ちます。ETL統合プロトコルには、重複または断片的なデータの排除も含まれているため、プロセスのE部分からL部分に渡るものは、同化および/または保存する方が簡単です。このようなクレンジング操作には、プロセスから特定の種類のデータを排除することも含まれます。特定の情報を含めたくない場合は、ETLをカスタマイズして変換からそのような情報を排除できます。ETLは、異なる部門からのデータだけでなく、異なるソースからのデータも完全に変換できます。たとえば、Microsoft Outlookなどの電子メールプログラム内のデータは、SAP製造アプリケーションからのデータとともに正しく変換でき、結果は最終的に共通のスレッドのデータになります。もちろん、MicrosoftはOracleやIBMと同様にETLパッケージを作成します。