การขุดข้อมูลใช้ปริมาณพลังงานในการคำนวณค่อนข้างมากในชุดข้อมูลขนาดใหญ่เพื่อกำหนดความสม่ำเสมอและการเชื่อมต่อระหว่างจุดข้อมูล อัลกอริทึมที่ใช้เทคนิคจากสถิติการเรียนรู้ของเครื่องและการจดจำรูปแบบถูกใช้เพื่อค้นหาฐานข้อมูลขนาดใหญ่โดยอัตโนมัติ การขุดข้อมูลยังเป็นที่รู้จักกันในนาม Knowledge-Discovery ในฐานข้อมูล (KDD)
เช่นเดียวกับคำว่า ปัญญาประดิษฐ์การ ขุดข้อมูลเป็นคำศัพท์ที่สามารถนำไปใช้กับกิจกรรมที่หลากหลาย ในโลกธุรกิจการทำ data data นั้นถูกใช้บ่อยที่สุดเพื่อกำหนดทิศทางของแนวโน้มและทำนายอนาคต มันถูกใช้เพื่อสร้างแบบจำลองและระบบสนับสนุนการตัดสินใจที่ให้ข้อมูลกับคนที่พวกเขาสามารถใช้ได้ การขุดข้อมูลมีบทบาทสำคัญในการต่อสู้กับการก่อการร้าย มันควรจะถูกใช้เพื่อกำหนดผู้นำของการโจมตี 9/11
Data miners เป็นนักสถิติที่ใช้เทคนิคที่มีชื่อเช่น โมเดลใกล้เพื่อนบ้าน , การจัดกลุ่ม k-mean , วิธี holdout , การตรวจสอบความถูกต้องข้าม k-fold , วิธีการ ออกจากที่หนึ่ง และอื่น ๆ เทคนิคการถดถอยใช้เพื่อลบรูปแบบที่ไม่เกี่ยวข้องออกจากข้อมูลที่เป็นประโยชน์เท่านั้น คำศัพท์ แบบเบย์ มีให้เห็นบ่อยครั้งในสนามซึ่งหมายถึงกลุ่มของเทคนิคการอนุมานที่ทำนายโอกาสของเหตุการณ์ในอนาคตโดยการรวมความน่าจะเป็นก่อนหน้านี้และความน่าจะเป็นก่อนหน้า การกรองสแปมนั้นเป็นรูปแบบหนึ่งของการทำเหมืองข้อมูลซึ่งจะนำข้อความที่เกี่ยวข้องมาสู่พื้นผิวโดยอัตโนมัติจากทะเลที่วุ่นวายจากความพยายามฟิชชิ่งและสนามไวอากร้า
ต้นไม้การตัดสินใจใช้เพื่อกรองภูเขาของข้อมูล ในแผนผังการตัดสินใจข้อมูลทั้งหมดจะผ่านโหนดทางเข้าโดยที่ตัวกรองนั้นจะแยกข้อมูลออกเป็นลำธารตามลักษณะของมัน ตัวอย่างเช่นข้อมูลเกี่ยวกับพฤติกรรมผู้บริโภคมีแนวโน้มที่จะถูกกรองตามปัจจัยทางประชากร การทำเหมืองข้อมูลไม่ได้เกี่ยวกับกราฟแฟนซีและเทคนิคการสร้างภาพข้อมูลเป็นหลัก แต่ใช้เพื่อแสดงสิ่งที่พบ เป็นที่ทราบกันดีว่าเราสามารถซึมซับข้อมูลทางสถิติได้มากกว่าภาพด้วยวาจาและรูปแบบของงานนำเสนอนี้สามารถโน้มน้าวใจและทรงพลังได้หากใช้ในบริบทที่เหมาะสม
ในขณะที่อารยธรรมของเรามีข้อมูลอิ่มตัวมากขึ้นและมีการกระจายเซ็นเซอร์ไปสู่สภาพแวดล้อมในท้องถิ่นของเราเราจะค้นพบสิ่งที่อาจพลาดไปเมื่อผ่านไปครั้งแรกโดยไม่ตั้งใจ การขุดข้อมูลจะช่วยให้เราแก้ไขข้อผิดพลาดเหล่านี้และค้นพบข้อมูลเชิงลึกใหม่ ๆ จากข้อมูลที่ผ่านมาซึ่งทำให้เรามีพื้นที่เก็บข้อมูลมากขึ้น


