Skip to main content

構造採掘とは何ですか?

構造マイニングは、半構造化されたデータソースがスキャンされ、その構造の要素が発見され、強調表示されるデータマイニングの一種です。半構造化されたデータソースは、テーブルの従来のデータベース構造を使用していないが、タグとマーカーを介して情報を分離するセマンティック要素を持っているものです。構造マイニングは、構造の要素を発見するために、データベース、Webサイト、その他多くの形式のコンピューター情報をマイニングするために使用できます。これは、ユーザーが互いにどのように相互作用するか、特定のタグの下で情報を見つける方法を理解するのに役立ちます。このマイニングは、ユーザーが書いたルールに基づいて、アイテムとは何かを予測するためにも使用できます。これには、ほとんどのデータベースに典型的なテーブルとノードを使用するソースが含まれます。構造マイニングでは、半構造化データのみが使用されます。この例では、データは、構造を持つが、従来のデータベースルールに準拠したものではないWebサイトまたは単純なデータベースからのものです。データには、各アイテムを適切にマイニングするように設定するタグまたはマーカーが必要です。たとえば、各Webサイトにはナビゲーションモデルがあり、ページの相互作用方法を決定するのはこのモデルです。構造をマイニングすることにより、ユーザーはこのナビゲーションの仕組みを発見できます。これは、同様のナビゲーションスキーマの作成に役立ちます。たとえば、本のデータセットがある場合、ユーザーはインデックスのない本がフィクションとして返されるべきであり、インデックスを持つものがノンフィクションとして返されるべきであるというルールを書くことができます。ほとんどのフィクションの本にはインデックスがないため、このルールはデータが何であるかを高度に予測します。これは、組織的な方法を持つが、ユーザーが探しているものに合わないセミ構造化セットを見るときにユーザーを支援します。半構造化ユニット。ユーザーがビジネスウェブサイトを持っている場合、ナビゲーションとリンクのために別のビジネスWebサイトをマイニングし、彼または彼女のWebサイトがどのように似ているかを確認できます。採掘された情報を比較することにより、ユーザーは構造の効率を高める方法を見つけることができます。