Skip to main content

더러운 데이터는 무엇입니까?

dirty Dirty Data data data는 구식, 불완전하거나 정확하지 않은 모든 유형의 전자 데이터를 설명하는 데 사용되는 용어입니다.이 유형의 데이터는 데이터 입력의 오류, 정기적으로 데이터를 업데이트하지 않거나 동일한 데이터의 두 번 이상으로 만들어 질 수 있습니다.때때로, 잘못된 데이터는 전자 문서의 텍스트에서 구두점의 오류에 지나지 않습니다.다른 경우에, 더티 데이터는 회계 기록을 수정하여 투자자 및 타인에게 특정 이미지를 제시하려는 시도와 같이 의도적으로 오해의 소지가있는 정보 일 수 있습니다.

대부분의 경우 모든 유형의 데이터베이스에서 더러운 데이터의 축적은 의도하지 않습니다.데이터베이스에 새로운 정보를 입력하는 개인은 단어를 틀거나 텍스트의 의도를 이해하는 데 중요한 구두점을 남기거나 특정 형식 전략을 따르지 못할 수 있습니다.이 유형의 상황에서는 잘못된 정보를 수정하는 것이 잘못된 텍스트를 변경하고 변경 사항을 저장하는 것 이상이 필요하지 않은 비교적 간단한 프로세스입니다.기업은 때때로 데이터를 입력 한 후 데이터를 교정하고 필요한 업데이트를 통해이 프로세스를 관리합니다.

정보가 변경 될 때 기존 레코드를 업데이트하지 않아 더러운 데이터가 발생할 수 있습니다.예를 들어, 주어진 고객과 함께 인력 변경이 발생할 때 영업 사원이 고객 파일을 업데이트하지 못하면 해당 파일이 더 이상 정확하지 않으며 더러워진 것으로 간주됩니다.철자 및 구두점 오류를 수정하는 것과 마찬가지로 오래된 정보를 제거하고 현재 데이터로 바꾸는 데 시간이 걸리면 데이터베이스의 전반적인 유용성을 높이는 데 도움이됩니다.dirty 더러운 데이터 생성이 의도적 인 상황이 있습니다.회사는 주어진 기간 동안 생성 된 수익 금액을 강조하는 등 재정에 대한 특정 인식을 만들기 위해 데이터베이스에서 특정 정보를 생략 할 수 있지만 동일한 수집 된 수익의 양과 관련된 데이터를 입력하지 않도록 선택할 수 있습니다.기간.이러한 유형의 더러운 데이터에서 제시된 정보는 정확히 정확하지만 불완전한 것으로 간주됩니다.∎ 일부 유형의 더러운 데이터를 사용하면 결정은 수정을 위해 시간과 노력을 기울이지 않는 것입니다.이것은 잘못된 데이터가 비즈니스가 제대로 작동하는 능력에 영향을 미치지 않거나 큰 고통을 유발할 가능성이 없을 때 일반적입니다.이는 일부 유형의 데이터베이스를 유지하는 거의 모든 엔티티가 아마도 최소한 현재와 정확한 다른 정보와 함께 산재 된 약간의 더러운 데이터를 가지고 있음을 의미합니다.