De databaser bibliografisk répertorient noen klasse av objekter bibliografiske bøker, samlinger, anmeldelser, artikler i magasiner gjennom sine metadata som sin tittel , forfatter, abstrakt, under descriptor. De er resultatet av databehandlingen av bibliotekskataloger , og muliggjør søk ved hjelp av nøkkelord , samt dataanalyse ( bibliometri osv.). WorldCat er et eksempel på en slik database.
Bibliografiske databaser eller mer presist bibliografiske referansedatabaser ble opprettet fra 1960-tallet.
I årene 1960-70 er begrepet databank privilegert. Deretter utpeker den databaser, ofte med bibliografiske referanser på den tiden, knyttet til "et definert kunnskapsområde og organisert for å bli tilbudt brukernes konsultasjoner". Dette begrepet gjorde det mulig å skille disse dokumentarsystemene fra selve programvaren eller databasesystemer (DBMS).
Bibliografiske databaser har utviklet seg, spesielt siden 2000-tallet, langs to akser som kan kombineres:
Begrepet database som brukes her bør forstås med forsiktighet. Snarere er det mer en samling av data eller bibliografiske poster. Denne tilsynelatende enkle strukturen kan skjule kompleksitetsfaktorer.
Strukturen til postene kan være relativt elementær (enkel samling av felt), mer kompleks med MARC-formater (eller i samsvar med ISO 2709- standarden ), og nå av enhver struktur med XML .
Sammenlignet med relasjonsdatabaser kommer en kompleksitetsfaktor fra umuligheten av å fryse størrelsen på dataene. Nesten alle feltene har variabel lengde med repetisjonsfaktorer som kan bli veldig store. For eksempel er et forfatternavn i gjennomsnitt mindre enn 10 tegn, men det er forfattere på mer enn 100 tegn. En vitenskapelig artikkel har i gjennomsnitt 2 eller 3 forfattere, men man kan finne fysikkartikler med 500 forfattere.
Mange bibliografiske databaser inneholder informasjon som beskriver innhold ved hjelp av en liste med indeksuttrykk eller nøkkelord. Disse nøkkelordene tilhører ofte terminologiske arkiver hvis natur er variabel: enkel liste over kontrollerte ord, klassifiseringsplan, dokumentar synonymordbok eller ontologi .
I tillegg til indeksering kan mye data henvise til spesialiserte arkiver, som titler på tidsskrifter eller tilknytninger.
Til slutt koderer enkelte databaser også referansene til bibliografien til de behandlede artiklene, for eksempel Science Citation Index, og den bibliografiske databasen blir deretter sitt eget depot.
Bibliografiske databaser er også definert i henhold til de valgte temaene. De kan påvirke basestrukturen betydelig (for eksempel innen biovitenskap kodifisering av gener).
En base er også definert av dekning, eller mer nøyaktig måten basen består av. I mange tilfeller (Medline, Pascal) er dekningen definert av et sett med anmeldelser som systematisk analyseres.