Skip to main content

ETL คืออะไร?

คิดว่ามันเป็น housecleaning สำหรับข้อมูลของคุณETL ย่อมาจากสารสกัดแปลงและโหลดETL เป็นซอฟต์แวร์ที่ช่วยให้ธุรกิจสามารถรวบรวมข้อมูลที่แตกต่างกันในขณะที่ย้ายจากที่หนึ่งไปยังอีกที่หนึ่งและไม่สำคัญว่าข้อมูลนั้นอยู่ในรูปแบบหรือรูปแบบที่แตกต่างกันข้อมูลสามารถมาจากแหล่งใด ๆETL มีประสิทธิภาพเพียงพอที่จะจัดการกับความไม่เท่าเทียมกันของข้อมูล

ตัวอย่างเช่นสถาบันการเงินอาจมีข้อมูลเกี่ยวกับลูกค้าในหลายแผนกและแต่ละแผนกอาจมีข้อมูลลูกค้าที่ระบุไว้ในวิธีที่แตกต่างกันแผนกสมาชิกอาจแสดงรายชื่อลูกค้าตามชื่อในขณะที่แผนกบัญชีอาจแสดงรายการลูกค้าตามหมายเลขETL สามารถรวมข้อมูลทั้งหมดนี้และรวมไว้ในงานนำเสนอที่เหมือนกันเช่นการจัดเก็บในฐานข้อมูลหรือคลังข้อมูล

อีกวิธีหนึ่งที่ บริษัท ใช้ ETL คือการย้ายข้อมูลไปยังแอปพลิเคชันอื่นอย่างถาวรตัวอย่างเช่นข้อมูลการประมวลผลคำอาจแปลเป็นตัวเลขและตัวอักษรซึ่งง่ายต่อการติดตามในโปรแกรมสเปรดชีตหรือฐานข้อมูลสิ่งนี้มีประโยชน์อย่างยิ่งในการสำรองข้อมูลเมื่อ บริษัท เปลี่ยนไปใช้ซอฟต์แวร์ใหม่โดยสิ้นเชิง

ฟังก์ชั่นสำคัญอย่างหนึ่งของ ETL คือการทำความสะอาดข้อมูลโปรโตคอลการรวม ETL ยังรวมถึงการกำจัดข้อมูลที่ซ้ำกันหรือเป็นส่วนหนึ่งเพื่อให้สิ่งที่ส่งผ่านจากส่วน E ของกระบวนการไปยังส่วน L นั้นง่ายต่อการดูดซึมและ/หรือจัดเก็บการดำเนินการทำความสะอาดดังกล่าวอาจรวมถึงการกำจัดข้อมูลบางประเภทออกจากกระบวนการหากคุณไม่ต้องการรวมข้อมูลบางอย่างคุณสามารถปรับแต่ง ETL ของคุณเพื่อกำจัดข้อมูลประเภทนั้นออกจากการเปลี่ยนแปลงของคุณ

ส่วน T ของสมการแน่นอนว่ามีประสิทธิภาพมากที่สุดETL สามารถแปลงไม่เพียง แต่ข้อมูลจากแผนกต่าง ๆ แต่ยังรวมถึงข้อมูลจากแหล่งต่าง ๆ โดยสิ้นเชิงตัวอย่างเช่นข้อมูลในโปรแกรมอีเมลเช่น Microsoft Outlook สามารถแปลงได้ถูกต้องพร้อมกับข้อมูลจากแอปพลิเคชันการผลิต SAP โดยผลลัพธ์เป็นข้อมูลของเธรดทั่วไปในตอนท้ายแน่นอนว่า Microsoft สร้างแพ็คเกจ ETL เช่นเดียวกับ Oracle และ IBM