Veri Madenciliği Sınıflaması Nedir?

Veri madenciliği sınıflandırması, veri madenciliği sürecinde bir adımdır. Belirli anahtar özelliklere göre öğeleri gruplamak için kullanılır. Veri madenciliği sınıflandırması için kullanılan en yakın komşu sınıflandırma, karar ağacı öğrenme ve destek vektör makineleri dahil çeşitli teknikler vardır.

Veri madenciliği, araştırmacıların verilerden kalıp çıkarmak için kullandığı bir yöntemdir. Genellikle veri havuzundan temsili bir örnek seçilir ve sonra kalıpları bulmak için manipüle edilir ve analiz edilir. Veri madenciliği sınıflandırmasına ek olarak, araştırmacılar verileri analiz etmek için kümeleme, regresyon ve kural öğrenmeyi de kullanabilirler.

Veri madenciliği sınıflamasında kullanılabilecek birkaç algoritma vardır. En yakın komşu sınıflandırma, veri madenciliği sınıflandırma algoritmalarının en basitlerinden biridir. Bir eğitim setine dayanır. Eğitim seti, bilgisayarı belirli değişkenlere dikkat ederek eğitmek için kullanılan bir veri kümesidir. En yakın komşu sınıflandırmada, bilgisayar, tüm verileri basitçe, girdi değerine en yakın veriyi içeren grubun bir parçası olarak sınıflandırır.

Karar ağacı öğrenmesi verileri sınıflandırmak için dallanma modeli kullanır. Bilgisayar temel olarak veriler hakkında bir dizi soru sorar. İlk sorunun cevabı doğruysa, 2a sorusunu sorar. Cevap yanlışsa, soru 2b'ye sorar. Çizildiğinde, bu yöntem dallanma yolları ağacını oluşturur.

Naive Bayes sınıflandırması olasılığa dayanır. Her veri parçası hakkında bir dizi soru sorar ve ardından verinin belirli bir sınıflandırmaya ait olma olasılığını belirlemek için cevapları kullanır. Bu karar ağacı öğreniminden farklıdır, çünkü ilk sorunun cevabı, hangi sorunun daha sonra sorulacağını etkilememektedir.

Daha karmaşık veri madenciliği sınıflandırma yöntemleri arasında sinir ağları ve destek vektör makineleri bulunur. Bu yöntemler, elle yapılması zor olan bilgisayar tabanlı modellerdir. Yapay sinir ağları sıklıkla yapay zeka programlamasında kullanılır çünkü insan beynini taklit eder. Bilgiyi, desenleri bulabilen ve daha sonra sınıflandıran bir dizi düğüm üzerinden filtreler.

Destek vektör makineleri, genellikle kategoriler arasında geniş bir alana sahip bir dağılım grafiği olarak görselleştirilen bilgileri sınıflandıracak bir model oluşturmak için eğitim örnekleri kullanır. Makineye yeni bilgiler girildiğinde, grafikte çizilir. Veriler daha sonra, grafikteki bilgilerin hangi kategoriye en yakın olduğu temelinde sınıflandırılır. Bu yöntem yalnızca seçilebilecek iki seçenek olduğunda çalışır.