En hashtabell eller nøkkeltabell[1] er en av informatikkens viktigste datastrukturer. I stedet for å lete gjennom en serie, som kan ta O(N) i verste fall, eller en sortert liste på tid, vil letetiden i en hashtabell være konstant, .

En telefonbok lagret i en hashtabell. Man ser at abonnentens navn t.v. brukes som nøkkel (key), og brukes for å beregne det egentlige sted i lageret. Kapasiteten i lageret er N=1000 objekt, og i dette tilfelle vil et objekt være en peker til ytterligere informasjon om abonnenten.

Leting etter et objekt iverksettes på basis av en nøkkel , som klienten oppgir. Nøkkelen kan være et tall eller en tekst. Plassen beregnes så til , der er hashfunksjonen som da skal være utført på tid. Objektet kan da hentes ut fra plass , som er en av de plassene til rådighet. En hashtabell kalles således assosiativ tabell, da den assosierer (kobler) nøkkel og verdi (engelsk: key og value).

Lagerstedet er vanligvis en tabell i maskinens hurtigminne, der man har tilgang til alle plassene. Man har den senere tid utviklet distribuert hashtabell som sprer lagringen på en eller flere maskiner for å øke pålitelighet og ytelse. Lageret vil til enhver tid ha en lastfaktor på B/N, der B er antall belagte plasser.

Hvis flere nøkler kobles til samme plass oppstår nøkkelkollisjon. Hashfunksjonen er laget for å unngå kollisjoner, men ved kollisjon må objektet lagres et annet sted, for eksempel i ekstra datastrukturer (trær, lister, såkalt «chaining»). En alternativ teknikk er å ta i bruk neste ledige lagerplass (lineær prøving), eventuelt lete seg eksponensielt frem til et ledig sted (kvadratisk prøving); en tredje teknikk er tilfeldig prøving, der man seriekobler flere hashfunksjoner for å beregne stedet. Dette øker tiden for å beregne , men er da ment å redusere antall kollisjoner, og derigjennom gi redusert letetid. Sjansen for kollisjon øker med lastfaktor. Man kan da øke lagerplassen (N), etterfulgt av «rehashing», der objektene plasseres på det som vil være nytt korrekt sted. Dette er en operasjon.

Eksempler på hashfunksjon er (der nøkkel er et heltall). Hvis nøkkelen er en tekst (eksempelvis en abonnents navn, som i figuren) kan være beregnet ut fra summen av et utvalg av tekstens tegn. Målet vil alltid være å unngå kollisjon, i hovedsak, ved å spre bruken jevnt over tabellen.

Referanser

rediger
  NODES