Skip to main content

知識抽出とは何ですか?

知識抽出とは、さまざまな情報源を利用して、まとまりのあるナレッジバンクを作成するプロセスです。このアプローチの一環として、抽出はしばしば構造化されたソースと非構造化されていないソースの両方の範囲に基づいています。成功すると、知識抽出により、特定のプログラムによって簡単に読み、解釈できる強固なデータが得られ、エンドユーザーは望むあらゆる目的のためにその正式な知識を活用できます。知識抽出の。構造化されたソースの範囲内で、データは、さまざまなタイプのリレーショナルデータベースまたは何らかの拡張可能なマークアップ言語またはXMLソースから抽出される場合があります。画像、さまざまな形式のワープロドキュメント、スプレッドシート、さらにはメモ帳スタイルプログラムでキャプチャされたテキストなどの非構造化されたソースは、抽出プロセスの一部として利用できます。ソースが知識抽出プロセスを管理するために使用されているプログラムに読みやすい限り、それらは抽出によって進歩しているプロジェクトの可能性を拡大し、生成された最終知識を使用可能にするソースとして使用できます。

知識抽出で発生するいくつかの一般的なアプリケーションがあります。頻繁な例の1つは、構造化されていないソースからデータをキャプチャし、ある種の構造化された知識ソースに組み込む機能です。リレーショナルデータベースで見つかったデータを抽出し、それを使用して新しいドキュメントを作成したり、電子ドキュメントを使用してデータベースにデータをインポートしたりすることは、このタイプの抽出がデータを入力する必要なく正式な知識の共有をどのように促進できるかの別の例です。それはすでに他のソースから利用可能です。いくつかの新しい形式での既存の知識の再利用は、多くのシナリオで非常に役立つことがよくあり、その知識を既存のソースで不可能な方法で利用することが可能になります。この方法で、ユーザーは、正式な知識の元の家に関連するものではなく、さまざまなアプリケーションに理想的なソースを作成できます。dataデータ抽出を使用すると、膨大なデータウェアハウスを使用して、特定の目的で使用できる新しいソースを作成する方法としてデータを簡単にインポートおよびエクスポートすることができます。これらの新しく作成されたソースは、データウェアハウスにも場所を見つけ、最終的には、新しい使用のニーズを満たすために使用される新しい抽出の作成に使用できます。これを念頭に置いて、知識抽出は、現在手元にあるすべてのリソースを最大限に活用するのに役立つ非常に役立つツールと見なすことができ、その正式な知識の共有に関与するタスクの多くを簡素化します。