Skip to main content

データウェアハウスアーキテクチャとは何ですか?

dataデータウェアハウスアーキテクチャは、エンタープライズ環境向けのデータウェアハウジングのすべての側面をカプセル化する設計です。データウェアハウジングは、データマイニング、ビジネスインテリジェンス、および組織内のすべての関連データへの全体的なアクセスを可能にする、論理ユニットに複雑で分散化されたエンタープライズデータを保存するための中央ドメインの作成です。データウェアハウスアーキテクチャには、すべてのレポート要件、データ管理、セキュリティ要件、バンド幅要件、ストレージ要件が含まれています。デザイン。この設計は、エンタープライズデータアーキテクチャの青写真と見なす必要があります。特に、データウェアハウスアーキテクチャを検討する際には、いくつかの主要な領域を開発する必要があります。これらの領域は、ソースシステムアクセス、ステージングエリアプロセス、データ濃縮プロセス、データアーキテクチャ、ビジネスインテリジェンスプロセス、およびストレージ要件です。dataデータウェアハウジングでは、レコードのトランザクションまたはデータベースからデータウェアハウスにソースデータを転送する必要があります。このプロセスは、抽出物変換と負荷(ETL)という用語に簡素化され、基本的にソースシステムアクセス、データ濃縮、およびデータアーキテクチャの領域をカプセル化します。明確にするために、これらのアーキテクチャエリアを詳細に設計することをお勧めします。これにより、ETLプロセスがどのように達成されるかがわかります。一部のデータはソースシステムから必要ですが、エンタープライズウェアハウスに負担をかけるため、すべてのデータは望ましくありません。ソースシステムレイヤーに対処する際の懸念事項は、データアクセス方法論、ソースシステムから必要なデータ、および更新要件です。dext検討する次のデータウェアハウジングアーキテクチャレイヤーは、ステージングエリアプロセスです。ソースシステムのほとんどのデータには検証とデータクレンジングが必要なため、データウェアハウスのビジネスルールレイヤーにロードする前に、ソースデータが存在するための着陸ゾーンを作成することが重要です。ステージング領域は、データの最新性を確保するために通常タイムスタンプがかかるソースシステムからの生データフィードを維持しています。dataデータ濃縮またはビジネスルールプロセスは、データがクリーンされている場所であり、データウェアハウスの望ましい結果を満たすためです。このクレンジングアプローチの良い例は、アドレスクレンジングツールを使用することです。ソースシステムに誤ったデータがある場合、データ濃縮プロセスは、RAWデータセットからアドレスを、無効なアドレスを修正するビジネスルールシステムに実行します。これは、データウェアハウス内の完全性を確保するために不正確なデータが削除または変更される時間でもあります。この領域は、エンタープライズデータウェアハウスの真の設計またはスキーマが完成する場所です。データウェアハウジングエンタープライズ内のすべてのデータセットの組み合わせではなく、エンタープライズ内のすべてのビジネスエンティティの概要を可能にするために構築された新たに定義されたデータベースです。これには、ビジネスインテリジェンスとデータマイニングの分野でビジネスが提起する質問に答えるためにデータアーキテクチャが必要です。この方法でデータアーキテクチャを作成することにより、RAWデータセットは、特定のデータベースではなく、ユーザーがエンタープライズビュー全体でアドホックレポートを実行できるようにするファクトテーブルに変換されます。これは、ソースシステム名またはプライマリキーを含む可能性のある生システムのデータに関するメタデータを維持する領域でもあります。このレイヤーは、データウェアハウジングのユーザー向け要件と考えることができます。通常、この領域には、缶詰のレポート、アドホックレポート機能、エンタープライズダッシュボードまたはアラートが含まれています。ビジネスインテリジェンスeレイヤーは通常、データウェアハウス内の唯一の外向きコンポーネントであるため、最も考慮されます。データウェアハウスが増え続け、拡大し続けるため、ユーザーベースのデータストレージは厳密に管理および維持する必要があります。さらに、データウェアハウスアーキテクチャを作成する際に、この設計は、データストレージ容量とデータアクセス容量を備えたバンドを形成する必要があるものについて現実的な見積もりを作成する必要があります。これらの要件は、データウェアハウスが企業全体で広く使用されるため、重要です。