Invertert indeks

I informatikk er en omvendt indeks en samsvar mellom innhold, for eksempel ord eller tall, og dets posisjon i et datasett, for eksempel en databasepost , et dokument eller et sett med dokumenter; på samme prinsipp som en terminologisk indeks . Hensikten med den omvendte indeksen er å tillate raskere fulltekstsøk , mot økt tid for å sette inn nye data.

Eksempler

Enkelt eksempel

For å forstå prinsippet kan et eksempel være koblingen mellom matlagingsoppskrifter og ingrediensene. Enten en liste over forenklede matlagingsoppskrifter med ingrediensene:

"crêpes" | {farine, œuf, lait} "génoise" | {œuf, sucre, farine} "caramel" | {sucre, beurre} "flan"| {œuf, lait, sucre}

Den omvendte indeksen til denne tabellen kan være (høyre kolonne):

"farine" | {crêpes, génoise} "œuf" | {crêpes, génoise, flan} "lait" | {crêpes, flan} "sucre" | {génoise, caramel, flan} "beurre" | {caramel}

Eksempel på tekstsøk

Vurder følgende dokumenter:

"D1" = "c'est ce que c'est" "D2" = "c'est ceci" "D3" = "ceci est une banane"

En omvendt indeks på ord eller grupper av ord vil gi (indekseringskriteriet er tilstedeværelsen av ordet i setningen):

"c'" {D1, D2} "est" {D1, D2, D3} "ce" {D1} "que" {D1} "ceci" {D2, D3} "une" {D3} "banane" {D3}


applikasjon

Omvendte indekser brukes spesielt til applikasjoner for søkemotorer . For eksempel, hvis vi søker etter ordene "dette" og "er", kan tilsvarende setning (er) bli funnet ved skjæringspunktet mellom indeksene for de tilsvarende ordene enten:

Se også


<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">