Skip to main content

데이터 마이닝 분류 란 무엇입니까?

data 마이닝 분류는 데이터 마이닝 과정의 한 단계입니다.특정 주요 특성을 기반으로 항목을 그룹화하는 데 사용됩니다.가장 가까운 이웃 분류, 의사 결정 트리 학습 및 지원 벡터 머신을 포함하여 데이터 마이닝 분류에 사용되는 몇 가지 기술이 있습니다. data 마이닝은 연구자들이 데이터에서 패턴을 추출하는 데 사용하는 방법입니다.일반적으로 대표적인 샘플은 데이터 풀에서 선택한 다음 패턴을 찾기 위해 조작 및 분석됩니다.데이터 마이닝 분류 외에도 연구원은 클러스터링, 회귀 및 규칙 학습을 사용하여 데이터를 분석 할 수도 있습니다.

데이터 마이닝 분류에 사용할 수있는 여러 알고리즘이 있습니다.가장 가까운 이웃 분류는 가장 간단한 데이터 마이닝 분류 알고리즘 중 하나입니다.훈련 세트에 의존합니다.교육 세트는 컴퓨터가 특정 변수에주의를 기울 이도록 훈련시키는 데 사용되는 일련의 데이터입니다.가장 가까운 이웃 분류에서 컴퓨터는 모든 데이터를 입력에 가장 가까운 데이터를 포함하는 그룹의 일부로 분류합니다.

의사 결정 트리 학습은 분기 모델을 사용하여 데이터를 분류합니다.컴퓨터는 기본적으로 데이터에 대한 일련의 질문을합니다.첫 번째 질문에 대한 답이 사실이라면 질문 2A를 묻습니다.대답이 거짓이면 질문 2B를 묻습니다.그려지면이 방법은 분기 경로의 트리를 형성합니다.각 데이터에 대한 일련의 질문을 한 다음 답을 사용하여 데이터가 특정 분류에 속할 확률을 결정합니다.첫 번째 질문에 대한 답변은 다음에 어떤 질문에 어떤 질문을할지에 영향을 미치지 않기 때문에 의사 결정 트리 학습과 다릅니다.

더 복잡한 데이터 마이닝 분류 방법에는 신경망과 지원 벡터 머신이 포함됩니다.이 방법은 손으로하기 어려운 컴퓨터 기반 모델입니다.신경망은 종종 인간 뇌를 모방하기 때문에 인공 지능 프로그래밍에 사용됩니다.패턴을 찾은 다음 정보를 분류하는 일련의 노드를 통해 정보를 필터링합니다.새로운 정보가 기계에 공급되면 그래프에 표시됩니다.그런 다음 데이터가 그래프에 가장 가까운 범주를 기반으로 분류됩니다.이 방법은 선택할 수있는 두 가지 옵션이있을 때만 작동합니다.