Skip to main content

Hvad er Data Redundancy?

Data -redundans er en situation, der forekommer inden for databasesystemer og involverer den utilsigtede oprettelse af duplikerede data, der ikke er nødvendig for funktionen af databasen.Mens redundans ofte er en ønskelig egenskab i nogle situationer, er dette ikke sandt, når det kommer til funktionen af en database.Tilstedeværelsen af duplikerede data kan ofte have en negativ indvirkning på systemets funktion, hvilket resulterer i tilbagevendende information som svar på systemforespørgsler, der er mindre end nyttige.En af de vigtigste funktioner i datastyring er identifikationen af duplikerede data og fjernelse af disse duplikationer.

Potentialet for dataredundans findes i næsten enhver form for databaseprogram.Programmer, der betragtes som flade, såsom regneark, og er afhængige af manuel indtastning af data, er især modtagelige for duplikering af information, der kan føre til komplikationer, når det kommer til at hente de ønskede oplysninger.Relationelle stildatabaser, såsom salgskontaktdatabaser, inkluderer ofte processer, der hjælper med at minimere chancerne for utilsigtet duplikering, såsom oprettelsen af to forskellige kontaktfiler på den samme kontakt, der er forbundet med det samme firma.Selv med brugen af systemchecks for at hjælpe med at reducere forekomsten af dataredundans er der stadig potentialet for problemer, der skal forekomme, hvilket gør det nødvendigt med jævne mellemrum at deltage i opgaven med dataoprydning i en database.

I bedste fald betyder dataredundans, at databasen er fyldt med information, der ikke er vigtig, men ikke udgør nogen reel trussel mod evnen til at finde dataene, når og efter behov.I værste fald bremser tilstedeværelsen af de duplikerede data de væsentlige funktioner i databasen og kan komplicere processen med at bruge databasen til at styre visse opgaver.For eksempel ville det at bruge en kundedatabase, der er tilstoppet med overflødig information til at generere postetiketter, resultere i oprettelsen af et antal duplikerede niveauer, hvilket gør det nødvendigt at enten sortere og bortskaffe duplikaterne, før etiketterne kunne bruges, eller tage denTid til at rydde op i databasen, før du forsøger at generere etiketterne.

Heldigvis er overvågning af og korrigering af redundans af datasidder noget, som mange datastyringssystemer kan opnå med relativ lethed.Nogle systemer vil markere input af duplikerede data, hvilket gør det nemt at gennemgå den opfattede duplikering og beslutte, om de skal slette dem eller lade dem stå.Der er endda softwareprogrammer, der kan bruges til at scanne en eksisterende database til duplikationer og automatisk fjerne disse overflødige poster med relativ lethed.