Skip to main content

데이터 마이닝이란 무엇입니까?

data 마이닝은 대규모 데이터 세트에서 작동하는 상대적으로 많은 양의 컴퓨팅 전력을 사용하여 데이터 포인트 간의 규칙 성과 연결을 결정합니다.통계, 기계 학습 및 패턴 인식에서 기술을 사용하는 알고리즘은 대형 데이터베이스를 자동으로 검색하는 데 사용됩니다.데이터 마이닝은 데이터베이스 (KDD)의 지식 발견으로도 알려져 있습니다.기업 세계에서 데이터 마이닝은 동향의 방향을 결정하고 미래를 예측하는 데 가장 자주 사용됩니다.사람들에게 사용할 수있는 정보를 제공하는 모델 및 의사 결정 지원 시스템을 구축하는 데 사용됩니다.데이터 마이닝은 테러와의 전투에서 최전선 역할을합니다.그것은 9/11 공격의 리더를 결정하는 데 사용되었을 것으로 추정됩니다.

데이터 광부는

eighbor models , k-means clustering

,

holdout method , k-fold와 같은 기술을 사용하는 통계 학자입니다.크로스 검증 the, Leave-one-Out Method 등.회귀 기술은 관련없는 패턴을 빼기 위해 사용되며 유용한 정보 만 남습니다.용어 베이지안 는 조건부 사건을 기반으로 한 사전 확률 및 확률을 결합하여 미래 사건의 가능성을 예측하는 추론 기술 클래스를 참조하여 현장에서 자주 볼 수 있습니다.스팸 필터링은 아마도 데이터 마이닝의 형태이며, 혼란스러운 피싱 시도와 비아그라 피치의 바다에서 관련 메시지를 자동으로 가져옵니다.의사 결정 트리에서 모든 데이터는 입구 노드를 통과하여 특성에 따라 데이터를 스트림으로 분리하는 필터를 향합니다.예를 들어, 소비자 행동에 대한 데이터는 인구 통계 학적 요인에 따라 필터링 될 수 있습니다.데이터 마이닝은 주로 멋진 그래프 및 시각화 기술에 관한 것이 아니라 발견 한 내용을 보여주기 위해 사용합니다.우리는 구두로보다 시각적으로 더 많은 통계적 정보를 흡수 할 수 있으며, 프레젠테이션을위한이 형식은 올바른 맥락에서 사용되면 매우 설득력이 있고 강력 할 수 있습니다.환경에서, 우리는 우연히 첫 번째 패스에서 놓칠 수있는 것들을 실수로 발견 할 것입니다.데이터 마이닝은 이러한 실수를 수정하고 과거 데이터를 기반으로 새로운 통찰력을 발견하여 데이터 저장 비용을 더 많이 제공 할 수 있습니다.