Skip to main content

구조 광업이란 무엇입니까?

구조 마이닝은 반 구조화 된 데이터 소스를 스캔하고 그 구조의 요소를 발견하고 강조하는 데이터 마이닝 유형입니다.반 구조화 된 데이터 소스는 테이블의 기존 데이터베이스 구조를 사용하지 않지만 태그와 마커를 통해 정보를 분리하는 의미 론적 요소가 있습니다.구조 마이닝은 데이터베이스, 웹 사이트 및 기타 여러 형태의 컴퓨터 정보를 채굴하여 구조의 요소를 발견하는 데 사용될 수 있습니다.사용자가 조각이 서로 상호 작용하는 방법을 이해하거나 특정 태그에서 정보를 찾는 방법을 이해하는 데 도움이됩니다.이 마이닝은 또한 사용자가 작성한 규칙을 기반으로 항목이 무엇인지 예측하는 데 사용될 수 있습니다.여기에는 대부분의 데이터베이스의 일반적인 테이블 및 노드를 사용하는 소스가 포함됩니다.구조 마이닝에서는 반 구조화 된 데이터 만 사용됩니다.이 경우 데이터는 구조가 있지만 기존 데이터베이스 규칙을 준수하지 않는 웹 사이트 또는 간단한 데이터베이스에서 나온 것입니다.데이터에는 각 항목을 제대로 채굴하도록 설정하는 태그 나 마커가 필요합니다.

반 구조화 된 데이터 세트를 읽음으로써 구조 마이닝은 구조가 상호 작용하는 방식을 발견 할 수 있습니다.예를 들어, 각 웹 사이트에는 탐색 모델이 있으며이 모델은 페이지가 상호 작용하는 방식을 결정하는이 모델입니다.구조를 채굴함으로써 사용자는이 내비게이션이 어떻게 작동하는지 발견 할 수 있으며, 이는 유사한 탐색 스키마를 만드는 데 도움이 될 수 있습니다.

구조 마이닝을 사용하여 마이닝 프로그램에 규칙을 작성하여 항목을 찾을 수 있습니다.예를 들어, 책 데이터 세트가있는 경우 사용자는 색인이없는 책이 소설로 반환되어야한다는 규칙을 작성할 수 있고 색인이있는 책은 논픽션으로 반환해야합니다.대부분의 소설 책에는 색인이 부족 하므로이 규칙은 데이터가 무엇인지 높은 정확도로 예측합니다.이렇게하면 조직 방법이 있지만 사용자가 찾고있는 내용에 맞지 않는 반 구조화 된 세트를 볼 때 사용자를 지원합니다.반 구조화 된 장치.사용자에게 비즈니스 웹 사이트가있는 경우, 탐색 및 링크를 위해 다른 비즈니스 웹 사이트를 채굴하고 자신의 웹 사이트가 어떻게 비슷한 지 확인할 수 있습니다.채굴 된 정보를 비교함으로써 사용자는 구조의 효율성을 높이는 방법을 찾을 수 있습니다.