Skip to main content

Mi az adatbányászati osztályozás?

Az adatbányászat osztályozása az adatbányászat folyamatának egyik lépése.Bizonyos kulcsjellemzők alapján csoportosítják az elemeket.Számos technikát alkalmaznak az adatbányászat osztályozására, ideértve a legközelebbi szomszédos osztályozást, a döntésfa tanulását és a támogató vektorgépeket.

Az adatbányászat olyan módszer, amelyet a kutatók használnak az adatokból származó minták kinyerésére.Általában egy reprezentatív mintát választanak az adatkészletből, majd manipulálják és elemzik a minták megtalálása érdekében.Az adatbányászati osztályozás mellett a kutatók klaszterezést, regressziót és szabályokat is használhatnak az adatok elemzéséhez.A legközelebbi szomszédos osztályozás az adatbányászati osztályozási algoritmusok egyik legegyszerűbb.Egy edzőkészletre támaszkodik.Az edzőkészlet egy olyan adatkészlet, amelyet a számítógép kiképzésére használnak, hogy odafigyeljenek bizonyos változókra.A legközelebbi szomszédos osztályozásban a számítógép egyszerűen osztályozza az összes adatot annak a csoportnak a részeként, amely a bemenethez legközelebbi adatokat tartalmazza.A számítógép alapvetően egy sor kérdést tesz fel az adatokkal kapcsolatban.Ha az első kérdésre adott válasz igaz, akkor a 2A.Ha a válasz hamis, akkor a 2B.Kihúzva ez a módszer elágazó utak fát képez.Ez egy sor kérdést tesz fel az egyes adatokkal kapcsolatban, majd a válaszokat használja annak meghatározására, hogy az adatok egy adott osztályozásba tartoznak.Ez különbözik a döntési fa tanulásától, mivel az első kérdésre adott válasz nem befolyásolja, hogy mely kérdést fogják feltenni.Ezek a módszerek olyan számítógépes modellek, amelyeket nehéz lenne kézzel csinálni.A neurális hálózatokat gyakran használják a mesterséges intelligencia programozásában, mert utánozza az emberi agyat.Az információkat olyan csomópontok sorozatán keresztül szűri, amelyek mintákat találnak, majd osztályozzák az információkat.Amikor új információkat továbbítanak a gépbe, azt a grafikonon ábrázolják.Az adatokat ezután besoroljuk annak alapján, hogy mely kategóriába tartozik az információk a legmegfelelőbbek a grafikonon.Ez a módszer csak akkor működik, ha két lehetőség közül lehet választani.