Skip to main content

Apa itu penambangan data?

Penambangan data menggunakan jumlah daya komputasi yang relatif besar yang beroperasi pada set data yang besar untuk menentukan keteraturan dan koneksi antara titik data.Algoritma yang menggunakan teknik dari statistik, pembelajaran mesin dan pengenalan pola digunakan untuk mencari basis data besar secara otomatis.Penambangan data juga dikenal sebagai penemuan pengetahuan dalam database (KDD).

Seperti istilah kecerdasan buatan , penambangan data adalah istilah payung yang dapat diterapkan pada sejumlah kegiatan yang beragam.Di dunia perusahaan, penambangan data paling sering digunakan untuk menentukan arah tren dan memprediksi masa depan.Ini digunakan untuk membangun model dan sistem pendukung keputusan yang memberi orang informasi yang dapat mereka gunakan.Penambangan data mengambil peran garis depan dalam pertempuran melawan terorisme.Seharusnya digunakan untuk menentukan pemimpin serangan 9/11.

Penambang data adalah ahli statistik yang menggunakan teknik dengan nama-nama seperti Model dekat-tetangga , K-Means Clustering , Metode Holdout , Kabang K-FoldValidasi silang , metode cuti-satu-keluar , dan seterusnya.Teknik regresi digunakan untuk mengurangi pola yang tidak relevan, hanya menyisakan informasi yang berguna.Istilah Bayesian

sering terlihat di lapangan, merujuk pada kelas teknik inferensi yang memprediksi kemungkinan peristiwa masa depan dengan menggabungkan probabilitas dan probabilitas sebelumnya berdasarkan peristiwa bersyarat.Penyaringan spam bisa dibilang bentuk penambangan data, yang secara otomatis membawa pesan yang relevan ke permukaan dari lautan kacau upaya phishing dan nada viagra.

Pohon keputusan digunakan untuk menyaring pegunungan data.Dalam pohon keputusan, semua data melewati node masuk, di mana ia menghadapi filter yang memisahkan data menjadi aliran tergantung pada karakteristiknya.Misalnya, data tentang perilaku konsumen cenderung disaring berdasarkan faktor demografis.Data Mining bukan terutama tentang grafik mewah dan teknik visualisasi, tetapi ia menggunakannya untuk menunjukkan apa yang telah ditemukannya.Diketahui bahwa kita dapat menyerap lebih banyak informasi statistik secara visual daripada secara verbal dan format untuk presentasi ini bisa sangat persuasif dan kuat jika digunakan dalam konteks yang tepat.

Ketika peradaban kita menjadi semakin jenuh data dan sensor didistribusikan secara massal ke dalam lokal kitaLingkungan, kita secara tidak sengaja akan menemukan hal -hal yang mungkin terlewatkan pada lintasan pertama.Penambangan data akan memungkinkan kami memperbaiki kesalahan ini dan menemukan wawasan baru berdasarkan data sebelumnya, memberi kami lebih banyak ledakan untuk uang penyimpanan data kami.