Skip to main content

Data Stream Mining คืออะไร?

การขุดข้อมูลกระแสข้อมูลเป็นกลยุทธ์ที่เกี่ยวข้องกับการระบุและแยกข้อมูลจากสตรีมข้อมูลที่ใช้งานอยู่ด้วยวิธีการนี้ความคิดคือการดึงข้อมูลโดยไม่ต้องสร้างการหยุดชะงักใด ๆ ในสตรีมเองทำให้ผู้อื่นสามารถใช้ประโยชน์จากข้อมูลได้แม้ในขณะที่การสกัดกำลังเกิดขึ้นความพยายามในการขุดข้อมูลแบบสตรีมข้อมูลประเภทนี้สามารถเกี่ยวข้องกับข้อมูลทุกประเภทตั้งแต่การส่งสัญญาณเสียงไปจนถึงวิดีโอผ่านอินเทอร์เน็ตและแม้กระทั่งงานวันต่อวันเช่นการถอนเงินจากบัญชีธนาคารโดยใช้เครื่องรับเงินอัตโนมัติหรือถือการสนทนาทางโทรศัพท์

หนึ่งในคุณสมบัติของการขุดข้อมูลสตรีมคือความสามารถในการฉายอย่างถูกต้องหรือทำนายวิธีการค้นหาข้อมูลที่ต้องการและเครื่องมือค้นพบความรู้ประเภทใดที่จะช่วยในการค้นหาและการดึงข้อมูลที่ต้องการตัวอย่างเช่นเมื่อลูกค้าเริ่มการทำธุรกรรมโดยใช้เครื่องเทลเลอร์อัตโนมัติการเขียนโปรแกรมสำหรับเครื่องจะเริ่มการค้นหาข้อมูลบัญชีที่เกี่ยวข้องค้นหาข้อมูลและกำหนดว่าจำนวนการทำธุรกรรมจะลดยอดคงเหลือบัญชีต่ำกว่าจำนวนเงินที่อนุญาตหรือไม่ขึ้นอยู่กับวิธีการจัดโครงสร้างบัญชีจากตรงนั้นการเขียนโปรแกรมสามารถส่งคืนข้อมูลที่เกี่ยวข้องให้กับผู้ใช้เช่นบันทึกการทำธุรกรรมที่ร้องขอให้สำเร็จและให้ยอดเงินบัญชีที่เหลืออยู่หลังจากเครดิตหรือเดบิตที่เกี่ยวข้องกับการทำธุรกรรม

อีกตัวอย่างหนึ่งของการขุดข้อมูลสตรีมคือการค้นหาเว็บขั้นพื้นฐานโดยใช้เบราว์เซอร์ด้วยแอปพลิเคชันนี้ผู้ใช้จะป้อนค่าการค้นหาลงในฟิลด์และซอฟต์แวร์ที่ขับเคลื่อนเบราว์เซอร์พยายามที่จะตีความค่าเหล่านั้นและส่งคืนข้อมูลที่มีความเกี่ยวข้องกับเกณฑ์การค้นหาขึ้นอยู่กับวิธีการกำหนดค่าเบราว์เซอร์ซึ่งอาจรวมถึงคุณสมบัติที่พยายามคาดการณ์ความตั้งใจของการค้นหาที่ดำเนินการและเสนอคำหรือวลีเพิ่มเติมที่อาจช่วยปรับแต่งการค้นหามากขึ้นตามความชอบของผู้ใช้เมื่อผู้ใช้ตัดสินในวลีการค้นหาเบราว์เซอร์จะส่งกลับผลลัพธ์ตามลำดับการจัดอันดับโดยใช้อัลกอริทึมที่เกี่ยวข้องกับการกำหนดค่าของเบราว์เซอร์เอง

หนึ่งในประโยชน์หลักของการขุดข้อมูลสตรีมคือความสามารถในการเข้าถึงและค้นหาข้อมูลโดยไม่ต้องห้ามผู้อื่นใช้ประโยชน์จากข้อมูลเดียวกันเนื่องจากสตรีมข้อมูลมีการอัปเดตอย่างต่อเนื่องผลลัพธ์ของการสกัดอาจเปลี่ยนแปลงเป็นครั้งคราวตัวอย่างเช่นการดำเนินการค้นหาเว็บโดยใช้วลีการค้นหาที่เฉพาะเจาะจงอาจให้ผลลัพธ์หนึ่งชุดในวันนี้ แต่ให้ผลลัพธ์ที่แตกต่างกันเล็กน้อยในวันพรุ่งนี้โดยพิจารณาจากข้อมูลใหม่ที่ป้อนข้อมูลสตรีมและวิธีการที่เครื่องมือค้นหาจัดอันดับข้อมูลนั้น