Skip to main content

ETL là gì?

Hãy nghĩ về nó như là người Housecleaning cho dữ liệu của bạn.ETL là viết tắt của chiết xuất, biến đổi và tải.ETL là phần mềm cho phép các doanh nghiệp củng cố dữ liệu khác nhau của họ trong khi di chuyển nó từ nơi này sang nơi khác và không thực sự quan trọng là dữ liệu ở các dạng hoặc định dạng khác nhau.Dữ liệu có thể đến từ bất kỳ nguồn nào.ETL đủ mạnh để xử lý sự chênh lệch dữ liệu đó. Ví dụ, một tổ chức tài chính có thể có thông tin về khách hàng trong một số bộ phận và mỗi bộ phận có thể có thông tin khách hàng được liệt kê theo một cách khác nhau.Bộ phận thành viên có thể liệt kê khách hàng theo tên, trong khi bộ phận kế toán có thể liệt kê khách hàng theo số.ETL có thể gói tất cả dữ liệu này và củng cố nó thành một bản trình bày thống nhất, chẳng hạn như lưu trữ trong cơ sở dữ liệu hoặc kho dữ liệu. Một cách khác mà các công ty sử dụng ETL là chuyển thông tin sang một ứng dụng khác vĩnh viễn.Chẳng hạn, dữ liệu xử lý từ có thể được dịch thành các số và chữ cái, dễ theo dõi trong bảng tính hoặc chương trình cơ sở dữ liệu.Điều này đặc biệt hữu ích trong việc sao lưu thông tin khi các công ty chuyển sang phần mềm mới hoàn toàn. Một chức năng quan trọng của ETL là dữ liệu làm sạch.Các giao thức hợp nhất ETL cũng bao gồm việc loại bỏ dữ liệu trùng lặp hoặc phân mảnh, để những gì chuyển từ phần E của quá trình sang phần L dễ đồng hóa và/hoặc lưu trữ.Các hoạt động làm sạch như vậy cũng có thể bao gồm loại bỏ một số loại dữ liệu khỏi quy trình.Nếu bạn không muốn bao gồm một số thông tin nhất định, bạn có thể tùy chỉnh ETL của mình để loại bỏ loại thông tin đó khỏi chuyển đổi của bạn. Tất nhiên, phần t của phương trình, tất nhiên, là mạnh nhất.ETL có thể chuyển đổi không chỉ dữ liệu từ các bộ phận khác nhau mà còn dữ liệu từ các nguồn khác nhau hoàn toàn.Ví dụ: dữ liệu trong một chương trình email như Microsoft Outlook có thể được chuyển đổi ngay cùng với dữ liệu từ một ứng dụng sản xuất SAP, với kết quả là dữ liệu của một luồng chung cuối cùng.Microsoft, tất nhiên, tạo ra một gói ETL, cũng như Oracle và IBM.