Skip to main content

데이터 정리 란 무엇입니까?

data 데이터 스크러빙이라고도하는 데이터 정리는 데이터 세트가 정확하고 정확한지 확인하는 프로세스입니다.이 과정에서 레코드는 정확성과 일관성을 확인하고 필요에 따라 수정 또는 삭제됩니다.이것은 단일 레코드 세트 내에서 또는 병합되어야하는 여러 데이터 세트 사이에서 발생할 수 있습니다.정확성을 기록하고 확인합니다.오타 및 철자 오류가 수정되고 잘못 표시된 데이터가 올바르게 레이블이 지정되어 있고 제출되며 불완전하거나 누락 된 항목이 완료됩니다.이러한 작업은 종종 당연히 또는 복귀 할 수없는 레코드를 제거하여 공간을 차지하지 않고 비효율적 인 작업을 유발합니다.

복잡한 프로세스

보다 복잡한 작업에서 데이터 정리는 컴퓨터 프로그램에 의해 수행 될 수 있습니다.이 프로그램은 사용자가 결정한 다양한 규칙과 절차로 데이터를 확인할 수 있습니다.지난 5 년 동안 업데이트되지 않은 모든 레코드를 삭제하고 철자가 잘못된 단어를 수정하고 중복 사본을 삭제하도록 프로그램을 설정할 수 있습니다.보다 복잡한 프로그램은 올바른 우편 번호를 기반으로 누락 된 도시를 작성하거나 데이터베이스의 모든 품목의 가격을 다른 유형의 통화로 변경할 수 있습니다.데이터 의존 비즈니스.예를 들어 데이터베이스 내의 일부 고객에게 정확한 전화 번호가없는 경우 직원에게 쉽게 연락 할 수 없습니다.고객 이메일 주소가 올바르게 형식화되지 않은 경우 다른 예와 같이 자동화 된 이메일 시스템은 최신 쿠폰 및 특별 거래를 보낼 수 없습니다.데이터 정리 작업은 시스템 내 데이터가 정확한지 확인하여 시스템이 데이터를 사용할 수 있도록하는 것입니다.부정확하거나 불완전한 레코드는 누구에게나 많이 사용되지 않습니다.회사에 동일한 고객과 함께 일하는 두 개의 지점이있는 경우 각 지점의 데이터가 완전하고 정확해야 할뿐만 아니라 두 지점에도 일치하는 데이터가 필요합니다.고객이 한 지점으로 전화 번호를 업데이트하면 다른 지점의 데이터를 동일한 정보로 업데이트하여 최고 효율성을 보장해야합니다.데이터 정리는 데이터가 정확한지 확인할뿐만 아니라 다른 레코드간에 일관성을 유지하기 위해 작동합니다.데이터 정리의 목표는 이러한 오류를 최소화하고 데이터를 가능한 한 의미 있고 의미있는 것으로 만드는 것입니다.이 과정이 정기적으로 수행되지 않으면 실수와 오류가 추가되어 덜 효율적인 작업과 더 많은 합병증으로 이어질 수 있습니다.