Skip to main content

Hva er en hasjfunksjon?

En hasjfunksjon er en metode for datamaskinfeilkontroll og dataorganisasjon.En stor mengde data manipuleres med en matematisk algoritme til et lite tall er igjen.Dette nummeret brukes som en del av katalogen som lar en datamaskin finne den spesifikke informasjonen senere.En god hasjfunksjon skal gi et lite nok resultat, så det er enkelt å bruke, men gi et unikt resultat for hvert datasett.En hasjfunksjon gir også minimal feilkontroll, ettersom en ødelagt og et godt stykke data skal gi forskjellige resultater når det hashes.

I en database er det vanligvis lettere å lagre steder med tall i stedet for bokstaver.Sifre har et mye større antall metoder for organisering og sortering enn bokstaver.Som et resultat blir tall ofte tilordnet steder som inneholder variabel informasjon i datamaskinens database.Disse tallene kan være vilkårlige eller representative for informasjonen.

Vilkårlige tall tildeles ganske enkelt basert på posisjon i datamaskinens minne eller rekkefølgen dataene ble lagret i.Å lagre informasjon på denne måten er vanlig i mindre databaser eller på steder der dataene ikke endres veldig ofte.Når den brukes i andre områder, begynner å indeksere databasen å ta mer og mer tid til den ikke lenger er effektiv.

.Disse tallene mates inn i en matematisk konstruksjon som gir ut et lite antall, typisk et heltall.Hvis hasjfunksjonen fungerer som den skal, vil hvert sted i den delen av databasen ha sitt eget unike resultat.Hvis to eller flere lokasjoner har samme resultat, kan programmer få opp feil informasjon basert på den dupliserte hasj. Det er mulig å bruke en hasjfunksjon også for andre ting.Store mengder svært repeterende data kan deles opp i mindre verdier.Dette er spesielt fint når du leter etter gjentatte sekvenser i store datasett.For eksempel består deoksyribonukleinsyre (DNA) av et veldig lite antall forskjellige komponenter.Når du bryter disse komponentene ved å bruke hasjverdier, blir steder der to strenger av DNA er de samme og forskjellige veldig klare, ganske enkelt fra å sammenligne to små kolonner med tall. Det siste området der hashfunksjonene er nyttige er i feilkontroll.Når informasjonen først hashes, registreres verdien som en del av stedets indeks.Hvis denne informasjonen er nødvendig senere, hentes informasjonen sammen med den verdien.Hvis programmet omskyller informasjonen og resultatet er annerledes, skjedde en korrupsjon på et tidspunkt.Denne korrupsjonen er vanligvis med dataene, da en hasjkorrupsjon ville ha forhindret at dataene ble hentet i utgangspunktet.