Skip to main content

Apa metode penambangan data yang berbeda?

Ada berbagai metode penambangan data yang berbeda yang digunakan dalam opsi perangkat lunak dan konsep teoritis.Ini memungkinkan pengguna untuk mengekstrak informasi dari data yang dikumpulkan oleh individu dan perusahaan yang menggunakan berbagai alat.Sejumlah besar data dapat digunakan untuk menentukan berbagai faktor dalam satu subjek atau variasi subjek.Metode penambangan data ini paling sering digunakan di bidang perlindungan penipuan, pemasaran dan pengawasan.

Selama ratusan tahun, metode penambangan data telah digunakan untuk mengekstraksi informasi dari subjek.Namun, teknik modern, menggunakan konsep otomatis untuk memberikan data substansial melalui sumber daya terkomputerisasi.Ketika ilmu komputer muncul selama abad ke -20, konsep metode penambangan data yang dikembangkan dalam upaya untuk mengatasi pola tersembunyi di petak besar data yang dikumpulkan.Contoh yang baik dari hal ini adalah ketika sebuah perusahaan periklanan menganalisis pola belanja pelanggan online.Perusahaan ini kemudian dapat memasarkan produk -produk tertentu bahwa individu tersebut mungkin tertarik untuk membeli.

Satu teknik penambangan data yang digunakan secara umum dalam industri ini disebut Penemuan Pengetahuan dalam Database (KDD).Dikembangkan pada tahun 1989 oleh Gregory Piatetsky-Shapiro, KDD memungkinkan pengguna untuk memproses data mentah, menganalisis informasi untuk data yang diperlukan dan menafsirkan hasilnya.Metode ini memungkinkan pengguna untuk menemukan pola dalam algoritma, namun, data umum tidak selalu akurat dan dapat disatukan dengan cara yang kompromi.Ini dikenal sebagai overfitting .

Metode penambangan data dasar melibatkan empat jenis tugas tertentu: klasifikasi, pengelompokan, regresi, dan asosiasi. Klasifikasi mengambil informasi yang ada dan menggabungkannya ke dalam pengelompokan yang ditentukan. Clustering Menghapus pengelompokan yang ditentukan dan memungkinkan data untuk mengklasifikasikan dirinya dengan item serupa. Regresi berfokus pada fungsi informasi, memodelkan data konsep.Metode penambangan data akhir, Asosiasi , berupaya menemukan hubungan antara berbagai umpan data.

Saat menggunakan berbagai metode penambangan data, standar tertentu digunakan untuk menentukan parameter mana yang dapat digunakan dalam proses.Kelompok Minat Khusus Asosiasi untuk Komputasi pada Penemuan Pengetahuan dan Penambangan Data (SIGKDD) mengadakan pertemuan tahunan yang menentukan proses mana yang sesuai.Faktor etika ditimbang bersama dengan aplikasi praktis untuk menemukan informasi terbaik tentang individu dan perusahaan.Informasi ini diterbitkan dalam jurnal industri yang disebut SIGKDD Explorations.