Skip to main content

データ統合とは何ですか?

dataデータ統合とは、複数のデータソースを単一のデータソースにマージすることです。さまざまなデータソースが互いに互換性がない可能性が高いため、このプラクティスは非常に時間がかかり、関与していることがよくあります。スプレッドシート上の異なる列名のように単純なことは、日付の再フォーマットを必要とするのに十分です。このプロセスは、2つのグループが接続なしで開始されたが、独立して作業した後に一緒に配置される状況で最も一般的です。データ統合は、無料のデータソースとオンラインデータベースの有病率により、より重要なトピックになりました。computerコンピューターシステムに保存されている限り、データ統合のデータ部分はほとんどすべてのものにすることができます。データの実際のコンテンツは、データが保存される方法ほど重要ではありません。ほとんどの場合、データはデータベース、組織化された情報システムに保持されます。これらのシステムには、ユーザーが情報を迅速に見つけることができる一意のエントリとフィールドが含まれています。多くの場合、データが最初にセットアップされたとき、データセットを別のデータセットと統合するつもりはありませんでした。これは、2つのデータセットが同じものを参照する場合がありますが、それらはまったく互換性がありません。hopitionデータベースはほとんど何でも互換性がありません。フィールドの順序や列の幅など、プレゼンテーションの違いのような単純なものは、簡単な合併を防ぐのに十分な場合があります。多かれ少なかれ情報を含む1つのデータベースなど、データが大きく異なる場合、マージははるかに困難です。ビジネスの世界では、部門または企業の合併には、以前に別々の情報を単一の構造に組み合わせる必要があります。この形式の統合は、元のグループが同様のソフトウェアを使用し、同様の情報目標を持っていない限り、一般に非常に困難です。ある研究者が彼の情報に別の研究者にアクセスできるようにすると、2つの当事者は一般に同じプロセスを検討しています。これは、データをカタログ化および保存するために同様の方法を使用することを意味します。無料のオンラインデータベースがより一般的で正確になっているため、企業は情報を共有可能な形式で取得しようと急いでいます。これにより、情報を公開形式でリリースし、有名な公開インターフェイスのプライベートバージョンをシステムに統合することができます。