Skip to main content

データマイニング分類とは何ですか?

dataデータマイニング分類は、データマイニングのプロセスの1つのステップです。特定の重要な特性に基づいてアイテムをグループ化するために使用されます。データマイニング分類に使用されるいくつかの手法があります。これには、最近隣接の分類、意思決定ツリー学習、ベクターマシンのサポートが含まれます。通常、代表的なサンプルがデータのプールから選択され、操作および分析されてパターンを見つけます。データマイニングの分類に加えて、研究者はクラスタリング、回帰、およびルール学習を使用してデータを分析することもできます。最近傍分類は、データマイニング分類アルゴリズムの中で最も単純なものの1つです。トレーニングセットに依存しています。トレーニングセットとは、コンピューターに特定の変数に注意を払うようにトレーニングするために使用される一連のデータです。最近傍分類では、コンピューターはすべてのデータを入力に最も近いデータを含むグループの一部として単純に分類します。コンピューターは基本的に、データに関する一連の質問をします。最初の質問に対する答えが真実である場合、それは質問2aを尋ねます。答えが偽の場合、質問2bを尋ねます。引き出されると、この方法は分岐パスの木を形成します。各データについて一連の質問をし、回答を使用して、データが特定の分類に属する確率を決定します。これは、最初の質問への答えが次にどの質問が尋ねられるかに影響しないため、決定ツリー学習とは異なります。これらの方法は、手作業で行うのが難しいコンピューターベースのモデルです。ニューラルネットワークは、人間の脳を模倣するため、人工知能プログラミングでよく使用されます。パターンを見つけてから情報を分類する一連のノードを介して情報をフィルタリングします。新しい情報がマシンに供給されると、グラフにプロットされます。その後、データは、どのカテゴリがグラフに最も近いかに基づいて分類されます。このメソッドは、2つの選択肢がある場合にのみ機能します。