Skip to main content

Hva er dataredundans?

Data redundans er en situasjon som oppstår i databasesystemer og involverer utilsiktet oppretting av dupliserte data som ikke er nødvendig for databasens funksjon.Selv om redundans ofte er en ønskelig egenskap i noen situasjoner, er dette ikke sant når det gjelder funksjonen til en database.Tilstedeværelsen av dupliserte data kan ofte ha en negativ innvirkning på systemets funksjon, noe som resulterer i returnerende informasjon som svar på systemspørsmål som er mindre enn nyttig.En av nøkkelfunksjonene til datahåndtering er identifisering av dupliserte data og fjerning av disse duplikasjonene.

Potensialet for dataredundans finnes i omtrent alle typer databaseprogram.Programmer som regnes som flate, for eksempel regneark, og er avhengige av manuell innføring av data er spesielt utsatt for duplisering av informasjon som kan føre til komplikasjoner når det gjelder å hente den ønskede informasjonen.Relasjonsstildatabaser, for eksempel salgskontaktdatabaser, inkluderer ofte prosesser som hjelper til med å minimere sjansene for utilsiktet duplisering, for eksempel å opprette to forskjellige kontaktfiler på samme kontakt tilknyttet det samme selskapet.Selv med bruk av systemkontroller for å redusere forekomsten av dataredundans, er det fortsatt potensialet for at problemer skal oppstå, noe som gjør det nødvendig å med jevne mellomrom delta i oppgaven med dataopprydding i en database.

I beste fall betyr dataredundans at databasen er strødd med informasjon som ikke er viktig, men som ikke utgjør noen reell trussel for muligheten til å finne dataene når og etter behov.I verste fall bremser tilstedeværelsen av de dupliserte dataene de essensielle funksjonene i databasen og kan komplisere prosessen med å bruke databasen for å administrere visse oppgaver.For eksempel å bruke en kundedatabase som er tilstoppet med overflødig informasjon for å generere postetiketter, vil resultere i å lage et antall dupliserte nivåer, noe som gjør det nødvendig å enten sortere og avhende duplikatene før etikettene kan brukes, eller ta denPå tide å rydde opp i databasen før du prøver å generere etikettene.

Heldigvis er overvåking for og korrigerer dataredundans noe som mange datahåndteringssystemer kan oppnå med relativt letthet.Noen systemer vil flagge inngangen til dupliserte data, noe som gjør det enkelt å gjennomgå den opplevde dupliseringen og bestemme om du vil slette dem eller la den stå.Det er til og med programmer som kan brukes til å skanne en eksisterende database for duplikasjoner, og automatisk fjerne de overflødige oppføringene med relativt letthet.