더티 데이터 란?

더티 데이터 는 오래되거나 불완전하거나 정확하지 않은 모든 유형의 전자 데이터를 설명하는 데 사용되는 용어입니다. 이 유형의 데이터는 데이터 입력 오류, 정기적으로 데이터를 업데이트하지 못하거나 동일한 데이터를 두 번 이상 입력하여 생성 될 수 있습니다. 때때로, 부정확 한 데이터는 전자 문서의 텍스트에서 구두점의 오류에 지나지 않습니다. 다른 경우에, 더티 데이터는 특정 이미지를 투자자 및 다른 사람들에게 제시하기 위해 회계 기록을 수정하려는 시도와 같이 의도적으로 오도 된 정보 일 수있다.

대부분의 경우 모든 유형의 데이터베이스에 더티 데이터가 누적되는 것은 의도하지 않은 것입니다. 데이터베이스에 새로운 정보를 입력하는 개인은 철자가 틀리거나 텍스트의 의도를 이해하는 데 중요한 구두점을 생략하거나 특정 형식 지정 전략을 따르지 않을 수 있습니다. 이 유형의 상황에서 잘못된 정보를 수정하는 것은 상대적으로 간단한 프로세스로 잘못된 텍스트를 변경하고 변경 사항을 저장하는 것 외에는 아무것도 필요하지 않습니다. 기업은 때때로 데이터를 입력 한 후 교정하고 필요한 업데이트를 수행하여이 프로세스를 관리합니다.

정보가 변경 될 때 기존 레코드를 업데이트하지 못하면 더티 데이터가 발생할 수도 있습니다. 예를 들어, 특정 고객에 대해 직원이 변경 될 때 영업 사원이 고객 파일을 업데이트하지 못하면 해당 파일은 더 이상 정확하지 않으며 더티로 간주됩니다. 철자 및 구두점 오류 수정과 마찬가지로 오래된 정보를 제거하고 현재 데이터로 바꾸는 데 시간이 걸리면 데이터베이스의 전반적인 유용성이 향상됩니다.

더티 데이터 생성이 의도적 인 상황이 있습니다. 회사는 특정 기간 동안 발생 된 수익 금액을 강조 표시하는 것과 같은 재무에 대한 특정 인식을 생성하기 위해 데이터베이스에서 특정 정보를 생략하도록 선택할 수 있지만 동일한 기간 동안 수집 된 수익 금액과 관련된 데이터를 입력하지 않도록 선택할 수 있습니다 기간. 이러한 유형의 더티 데이터에서는 표시되는 정보가 정확하지만 불완전한 것으로 간주됩니다.

일부 유형의 더티 데이터의 경우 수정을 위해 시간과 노력을 들이지 않는 것이 결정될 수 있습니다. 이것은 잘못된 데이터가 비즈니스의 기능에 영향을 미치지 않거나 큰 고통을 야기 할 가능성이없는 경우에 일반적입니다. 이는 특정 유형의 데이터베이스를 유지 관리하는 거의 모든 엔티티가 최신의 정확한 다른 정보와 함께 약간 더티 데이터가 산재되어 있음을 의미합니다.

더티 데이터 란?

이 문서가 도움이 되었나요?