Skip to main content

統計データマイニングとは何ですか?

統計データマイニングは、知識またはデータ発見としても知られており、情報を収集および分析するコンピューター化された方法です。データマイニングツールはデータを取得し、情報を分類して、薬、コンピュータープログラミング、ビジネスプロモーション、ロボットデザインなどの重要なアプリケーションで使用できるパターンまたは相関を発見します。統計データマイニング手法では、複雑な数学と複雑な統計プロセスを使用して分析を作成します。最初のデータマイニングアプリケーションは統計データを収集し、情報を倉庫型プログラムに配置します。次に、倉庫内のデータが編成され、管理システムが作成されます。次のステップでは、管理されたデータにアクセスする方法が作成されます。次に、4番目のステップでは、データマイニング回帰とも呼ばれるデータを分析するソフトウェアを開発し、最終ステップでは統計データの使用または解釈を実用的に促進します。分析ソフトウェアは、オープンエンドのユーザーの質問を使用して、両方のタイプのデータシステムを並べ替えます。自由回答形式の質問により、数え切れないほどの回答が可能になるため、プログラマーはソートの結果に影響を与えません。プログラマーは、全体的な焦点を使用して情報を分類するのを支援するための質問のリストを作成します。

ソートは、データの開発、データに含まれる関連性、および関連性に基づいたパターンと傾向を定義しようとすることに基づいています。たとえば、Googleは、オンライン広告の配置を支援するために、習慣を購入するユーザーに関する情報を収集します。このバイヤーデータをソートするために使用される自由回答形式の質問データは、インターネットユーザーの購入の購入または視聴習慣に焦点を当てています。意思決定ツリー、人工ニューラルネットワーク、最近隣接法、ルール誘導、データの視覚化、および遺伝的アルゴリズムの作成はすべて、統計的に測定されたデータを使用します。これらの分類システムは、分析データプログラムによって発見された関連付けを解釈するのに役立ちます。統計データマイニングには、ホームコンピューターで小規模で実行できる小さなプロジェクトが含まれますが、ほとんどのデータマイニングアソシエーションセットは非常に大きく、データマイニングの回帰は非常に複雑で、スーパーコンピューターまたは高速コンピューターのネットワークが必要です。statisticalデータマイニングは、運用データ、非手術データ、メタデータを含む3つの一般的なタイプのデータを収集します。衣料品店では、運用データは、会計、販売、在庫管理など、ビジネスの運営に使用される基本的なデータです。間接的にビジネスに関連する非運用データには、将来の販売の見積もりと、国家衣料品市場に関する一般的な情報が含まれています。メタデータはデータ自体に関するものです。メタデータを使用したプログラムは、そのデータが収集された場合、衣料品購入者または顧客のお気に入りの色の性別や地理的位置に基づいて顧客を分類に分類することができます。広範な実用的なアプリケーションを持っています。病気の発生の研究は一例です。2000年のデータマイニングプロジェクトでは、カナダのオンタリオ州のクリプトスポリジウムの疾患発生を分析して、疾患の症例の増加の原因を決定しました。データマイニングの結果は、細菌の発生を地域の水条件に結び付け、適切な都市水処理の欠如を支援しました。Biosurveillanceと呼ばれる分野では、疫学的データマイニングを使用して単一の疾患の発生を特定します。Computerコンピュータープログラマーと設計者は、確率と統計データ分析の研究を採用して、機械とコンピュータープログラムを開発します。Googleインターネット検索エンジンは、統計データMIを使用して設計されましたning。Googleはデータマイニングを収集して使用してプログラムの更新とアプリケーションを作成し続けています。