ข้อมูลสกปรกคืออะไร

ข้อมูลสกปรก เป็นคำที่ใช้เพื่ออธิบายข้อมูลอิเล็กทรอนิกส์ประเภทใด ๆ ที่ล้าสมัยไม่สมบูรณ์หรือไม่ถูกต้อง ข้อมูลประเภทนี้อาจถูกสร้างขึ้นเนื่องจากข้อผิดพลาดในการป้อนข้อมูลความล้มเหลวในการอัพเดทข้อมูลเป็นประจำหรือแม้แต่การป้อนข้อมูลเดียวกันมากกว่าหนึ่งครั้ง บางครั้งข้อมูลที่ไม่ถูกต้องไม่ได้เป็นอะไรมากไปกว่าข้อผิดพลาดในการใช้เครื่องหมายวรรคตอนในข้อความของเอกสารอิเล็กทรอนิกส์ ในกรณีอื่น ๆ ข้อมูลที่สกปรกอาจเป็นข้อมูลที่ทำให้เข้าใจผิดโดยเจตนาเช่นความพยายามที่จะแก้ไขบันทึกทางบัญชีเพื่อนำเสนอภาพที่เฉพาะเจาะจงให้กับนักลงทุนและผู้อื่น

ส่วนใหญ่การสะสมข้อมูลสกปรกในฐานข้อมูลทุกประเภทนั้นไม่ได้ตั้งใจ บุคคลที่กำลังป้อนข้อมูลใหม่ลงในฐานข้อมูลอาจสะกดคำผิดพลาดเว้นวรรคที่สำคัญในการทำความเข้าใจเจตนาของข้อความหรือไม่ปฏิบัติตามกลยุทธ์การจัดรูปแบบเฉพาะ ด้วยสถานการณ์ประเภทนี้การแก้ไขข้อมูลที่ไม่ถูกต้องเป็นกระบวนการที่ค่อนข้างง่ายซึ่งไม่ต้องการอะไรมากไปกว่าการแก้ไขข้อความที่ไม่ถูกต้องและบันทึกการเปลี่ยนแปลง บางครั้งธุรกิจจัดการกระบวนการนี้โดยการพิสูจน์อักษรข้อมูลหลังจากที่ป้อนและทำการอัปเดตที่จำเป็น

ข้อมูลสกปรกอาจเกิดขึ้นเนื่องจากความล้มเหลวในการปรับปรุงระเบียนที่มีอยู่เมื่อมีการเปลี่ยนแปลงข้อมูล ตัวอย่างเช่นหากพนักงานขายไม่สามารถอัปเดตไฟล์ลูกค้าเมื่อมีการเปลี่ยนแปลงบุคลากรเกิดขึ้นกับลูกค้าที่ระบุไฟล์เหล่านั้นจะไม่ถูกต้องอีกต่อไปและถือว่าสกปรก เช่นเดียวกับการแก้ไขข้อผิดพลาดการสะกดและเครื่องหมายวรรคตอนการสละเวลาในการลบข้อมูลที่ล้าสมัยและแทนที่ด้วยข้อมูลปัจจุบันช่วยเพิ่มความสามารถในการใช้งานโดยรวมของฐานข้อมูล

มีบางสถานการณ์ที่การสร้างข้อมูลที่สกปรกนั้นเป็นการจงใจ บริษัท อาจเลือกที่จะละเว้นข้อมูลเฉพาะจากฐานข้อมูลเพื่อสร้างการรับรู้ที่เฉพาะเจาะจงเกี่ยวกับการเงินเช่นการเน้นจำนวนรายได้ที่สร้างขึ้นในช่วงเวลาที่กำหนด แต่เลือกที่จะไม่ป้อนข้อมูลที่เกี่ยวข้องกับจำนวนรายได้ที่รวบรวมไว้เหมือนเดิม ระยะเวลา ในข้อมูลสกปรกประเภทนี้ข้อมูลที่นำเสนอนั้นมีความแม่นยำเท่าที่จะทำได้ แต่ถือว่าไม่สมบูรณ์

ด้วยข้อมูลสกปรกบางประเภทการตัดสินใจอาจไม่ใช้เวลาและความพยายามในการแก้ไข นี่เป็นเรื่องปกติเมื่อข้อมูลที่ไม่ถูกต้องไม่มีผลกระทบใด ๆ ต่อความสามารถของธุรกิจในการทำงานอย่างถูกต้องหรือไม่มีโอกาสที่จะก่อให้เกิดความทุกข์ ซึ่งหมายความว่าเอนทิตีใด ๆ ที่รักษาฐานข้อมูลบางประเภทอาจมีข้อมูลสกปรกอย่างน้อยแยกจากกันกับข้อมูลอื่นที่เป็นปัจจุบันและถูกต้อง