Skip to main content

汚れたデータとは何ですか?

dirty Dirty Dataは、時代遅れ、不完全、または正確ではないあらゆる種類の電子データを記述するために使用される用語です。このタイプのデータは、データ入力のエラー、定期的にデータを更新できないこと、または同じデータのエントリさえ複数回更新できないために作成される場合があります。時には、誤ったデータは、電子文書のテキストの句読点のエラーにすぎません。他の例では、汚れたデータは、投資家や他の人々に特定の画像を提示するために会計記録を変更しようとする試みなど、意図的に誤解を招く情報である可能性があります。comsほとんどの場合、あらゆるタイプのデータベースに汚れたデータが蓄積されることは意図的ではありません。データベースに新しい情報を入力している個人は、単語を間違えたり、テキストの意図を理解するために重要な句読点を除外したり、特定の書式設定戦略に従わない場合があります。このタイプの状況では、誤った情報を修正することは比較的単純なプロセスであり、誤ったテキストを変更して変更を保存するだけです。企業は、入力された後にデータを校正し、必要な更新を行うことにより、このプロセスを管理することがあります。intormation情報が変更されたときに既存のレコードを更新しなかったため、汚れたデータが発生する可能性があります。たとえば、営業担当者が特定の顧客で人事の変更が発生したときに販売員が顧客ファイルの更新に失敗した場合、それらのファイルはもはや正確ではなく、汚れていると見なされます。スペルや句読点の修正と同様に、時間をかけて時代遅れの情報を削除し、現在のデータに置き換えるのに、データベースの全体的な使いやすさを高めることができます。dirtyダーティデータの作成が意図的な状況があります。企業は、特定の期間の生成された収益の量を強調するなど、財務に関する特定の認識を作成するために、データベースから特定の認識を作成するために、同じものの収集された収益の量に関連するデータを入力しないことを選択するために、データベースから特定の情報を省略することを選択できます。期間。このタイプの汚れたデータでは、提示される情報は、それが行く限り正確ですが、不完全と見なされます。corteいくつかのタイプの汚れたデータを使用すると、決定は修正を行うために時間と労力をかけないことです。これは、誤ったデータがビジネスが適切に機能する能力に影響を与えないか、大きな苦痛を引き起こす可能性がない場合に一般的です。これは、何らかのタイプのデータベースを維持するほぼすべてのエンティティが、おそらく最新かつ正確な他の情報が散在する少なくとも少し汚れたデータを持っていることを意味します。