Skip to main content

데이터 마이닝 프로세스는 무엇입니까?

data 마이닝 프로세스는 많은 양의 데이터에서 통계적으로 유의 한 패턴을 발견하는 도구입니다.일반적으로 준비, 데이터 탐색, 모델 구축, 배포 및 검토를 포함한 5 가지 주요 단계가 포함됩니다.프로세스의 각 단계에는 다른 기술 세트가 포함되지만 대부분의 통계 분석 형태를 사용합니다. data 마이닝 프로세스가 시작되기 전에 연구자들은 일반적으로 연구 목표를 설정합니다.이 준비 단계는 일반적으로 어떤 유형의 데이터를 연구 해야하는지, 어떤 데이터 마이닝 기술을 사용해야하는지, 그리고 결과가 어떤 형태를 취할 것인지 결정합니다.프로세스 의이 초기 단계는 유용한 정보를 수집하는 데 중요 할 수 있습니다. data 데이터 마이닝 프로세스의 다음 단계는 탐색입니다.이 단계에는 일반적으로 정보 창고 또는 수집 엔티티에서 필요한 데이터를 수집하는 것이 포함됩니다.그런 다음 광업 전문가는 일반적으로 분석을 위해 원시 데이터 세트를 준비합니다.이 단계는 일반적으로 수집, 청소, 구성 및 오류에 대한 모든 데이터를 확인하는 것으로 구성됩니다.이를 달성하기 위해 연구자들은 일반적으로 소규모 테스트 데이터 샘플을 가져 와서 다양한 데이터 마이닝 기술을 적용합니다.모델링 단계는 종종 원하는 결과를 달성하는 데 필요한 최상의 통계 분석 방법을 결정하는 데 사용됩니다. Data 마이닝 프로세스에 적용 할 수있는 4 가지 주요 기술이 있습니다.첫 번째는 분류이며, 데이터를 사전 정의 된 그룹 또는 범주로 배열합니다.클러스터링이라는 두 번째 기술에서 연구원들은 컴퓨터가 데이터를 그룹으로 구성 할 수 있도록 허용합니다.세 번째 데이터 마이닝 기술은 변수 간의 연관성을 추구합니다.네 번째는 일반적으로 미래 추세를 예측하는 데 사용될 수있는 데이터의 순차적 패턴을 찾습니다.

데이터 마이닝 프로세스의 최종 단계는 배포입니다.이를 위해 모델에서 선택된 기술은 더 큰 데이터 세트에 적용되며 결과는 분석됩니다.이 단계에서 나온 보고서는 일반적으로 데이터 세트에 존재하는 분류, 클러스터, 연관성 또는 순차적 패턴을 포함하여 전체 프로세스에서 발견 된 패턴을 보여줍니다.프로세스 의이 단계는 일반적으로 기본 세트가 전체 데이터 모집단을 대표하는지 확인하기 위해 새로운 데이터 세트로 마이닝 모델을 반복하는 것을 포함합니다.데이터 샘플이 정확하게 표현되지 않으면 결과는 더 큰 모집단의 추세를 예측할 수 없습니다.