Ressursbeskrivelsesramme

Ressursbeskrivelsesramme RDF-formatlogo Kjennetegn
Utvidelse .rdf
MIME-type application/rdf+xml
PUID fmt / 875
Signatur 3C( heksa )
Utviklet av World Wide Web Consortium
Formattype Semantisk nett
file container FOAF , SKOS ...
Standard [1]
Spesifikasjon Åpent format

Ressurs Description Framework (RDF) er enmodellavgrafment å beskrive formeltnettressurserogmetadatafor å tillate automatisk behandling av slike beskrivelser. Utviklet avW3C, er RDF det grunnleggende språket påSemantic Web. En av syntaksene (ellerserialiseringene) til dette språket er RDF /XML. Andre RDF-syntakser dukket opp da de søkte å gjøre lesingen mer forståelig; Dette er for eksempel tilfelle medNotation3(eller N3).

Ved å kommentere ustrukturerte dokumenter og fungere som et grensesnitt for applikasjoner og strukturerte dokumenter, for eksempel databaser og EDM , muliggjør RDF noe interoperabilitet mellom applikasjoner som utveksler ustabil og ustrukturert informasjon på datamaskinen.

Grunnleggende prinsipper

Et strukturert dokument i RDF er et sett med tripler .

En RDF-trippel er en assosiasjon ( subjekt , predikat , objekt ):

Emnet og objektet, når det gjelder ressurser, kan identifiseres av en URI eller være tomme noder . Predikatet identifiseres nødvendigvis av en URI .

RDF-dokumenter kan skrives i forskjellige syntakser, inkludert XML . Men RDF i seg selv er ikke en XML-dialekt. Det er mulig å bruke andre syntakser for å uttrykke tripler. RDF er ganske enkelt en datastruktur som består av noder og er organisert i en graf. Selv om RDF / XML - dens XML-versjon foreslått av W3C - bare er en syntaks (eller serialisering ) av modellen, kalles den ofte RDF, ved språkbruk.

Et slik dannet RDF-dokument tilsvarer et merket orientert multigrafi . Hver triplett tilsvarer deretter en orientert kant hvis etikett er predikatet, kildenoden er subjektet og målnoden er objektet.

Semantikken til et RDF-dokument kan uttrykkes i mengdeori og modellteori ved å gi begrensninger på verden som kan beskrives i RDF. RDF arver deretter generisiteten og universaliteten til forestillingen om sett. Denne semantikken kan også oversettes til første ordens logiske formel , positiv, konjunktiv og eksistensiell  :

{ subject , object , predicate } ⇔ predicate ( object , subject )

som tilsvarer:

∃ objekt , ∃ emne , predikat ( objekt , emne )

W3C har lagt til rette for en inferensmekanisme for semantikken til RDF som utelukkende og fullt ut trekker konsekvensene av predikater, uten at denne mekanismen er gjenstand for en anbefaling.

RDF-vokabular

Strukturen til RDF er ekstremt generisk og tjener som grunnlag for en rekke skjemaer eller vokabularer dedikert til spesifikke applikasjoner. Noen av disse vokabularene er spesifisert av W3C, for eksempel ontologispråkene RDFS og OWL , eller SKOS vokabular for representasjon av synonymordbøker og andre strukturerte vokabularer. Andre RDF-vokabularer, uten å være spesifisert av W3C, er likevel mye brukt og utgjør de facto standarder i det semantiske nettsamfunnet, for eksempel FOAF som er ment for representasjon av mennesker.

Spørrespråk

Mange spørringsspråk for spørring av RDF-grafer er utviklet. SPARQL- språket , utviklet av W3C, er ment å bli standarden på dette feltet.

Her er et eksempel på et SPARQL-spørsmål:

PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?mbox WHERE { ?x foaf:name ?name. ?x foaf:mbox ?mbox }

Hvis vi bruker dette spørsmålet på følgende RDF-graf (i skilpaddeformat ):

@prefix foaf: <http://xmlns.com/foaf/0.1/> . <http://jlow.me> foaf:name "Johnny Lee Outlaw" . <http://jlow.me> foaf:mbox <mailto:[email protected]> . <http://peter.me> foaf:name "Peter Goodguy" . <http://peter.me> foaf:mbox <mailto:[email protected]> . <http://carol.me> foaf:mbox <mailto:[email protected]> .

Vi oppnår deretter følgende resultat:

Navn mbox
"Johnny Lee Outlaw" <mailto: [email protected]>
"Peter Goodguy" <mailto: [email protected]>

For mer informasjon: Wikiversity-kurs om SPARQL

Eksempler

Eksempel 1: RDF-beskrivelse av en person som heter Eric Miller

Følgende eksempel er hentet fra W3C-nettstedet som beskriver en ressurs med utsagnene "Det er en person som har identifikatoren http://www.w3.org/People/EM/contact#me , hvis navn er Eric Miller, hvis e-postadressen er [email protected] og hvem har tittelen doktor ” .

Ressursen "  http://www.w3.org/People/EM/contact#me  " er temaet.

Objektet er:

  • "Eric Miller" (med predikatet "hva heter han");
  • [email protected] (med predikatet "hva er e-postadressen hans");
  • "Dr." (med predikatet "hva er tittelen hans").

Faget er en URI.

Predikater er også URI. For eksempel er URI for hvert predikat:

I tillegg har motivet typen person (med predikatet http://www.w3.org/1999/02/22-rdf-syntax-ns#type ) (med objektet http: //www.w3. Org / 2000/10 / swap / pim / contact # Person ).

Derfor kan følgende RDF-tripler uttrykkes:

Eksempel 2: Postal forkortelse for New York

Noen begreper i RDF er hentet fra logikk og lingvistikk , hvor subjekt-predikat og subjekt-predikat-objektstrukturer har lignende, men tydelige betydninger. Dette eksemplet viser:

På fransk ville utsagnet "New York har postforkortelsen NY" ha "New York" som emne, "har postforkortelsen" som predikat og "NY" som emne.

Kodet som en RDF-triplett, bør emnet og predikatet navngis av URI-ressurser. Objektet kan være en ressurs eller et bokstavelig element. For eksempel, i Notation3 i RDF-form, kan utsagnet se ut som:

<urn:x-states:New%20York> <http://purl.org/dc/terms/alternative> "NY" .

I dette eksemplet er "  urn: x-states: New% 20York  " URI for en ressurs som representerer den amerikanske staten New York , "http://purl.org/dc/terms/alternative" er URI for predikatet (her er definisjonen ), og "NY" er en bokstavelig streng. Vær oppmerksom på at URI-ene som er valgt her ikke er standard, og ikke trenger å være, så lenge deres betydning er lesbar og tilgjengelig.

N-Triples er et av standard RDF- serialiseringsformatene . Ovenstående triplett kan også representeres ekvivalent med RDF / XML-standarden som nedenfor:

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dcterms="http://purl.org/dc/terms/"> <rdf:Description rdf:about="urn:x-states:New%20York"> <dcterms:alternative>NY</dcterms:alternative> </rdf:Description> </rdf:RDF>

På grunn av syntaksrestriksjonene til QNames (som dcterms:alternativeovenfor) er det imidlertid noen RDF-grafer som ikke kan representeres med RDF / XML.

Eksempel 3: Wikipedia-artikkel om Tony Benn

Siden "http://en.wikipedia.org/wiki/Tony_Benn" identifiserer en bestemt ressurs (uavhengig av om URI er en hyperkobling, eller om ressursen faktisk er ( Wikipedia- artikkelen om Tony Benn ) for å si at tittelen på denne ressursen er "Tony Benn" og dens redaktør er "Wikipedia". Du vil ha to påstander som kan uttrykkes som gyldige RDF-uttalelser. I RDFs N-Triples-format kan disse erklæringene se ut som følger:

<http://en.wikipedia.org/wiki/Tony_Benn> <http://purl.org/dc/elements/1.1/title> "Tony Benn" . <http://en.wikipedia.org/wiki/Tony_Benn> <http://purl.org/dc/elements/1.1/publisher> "Wikipedia" .

Og disse uttalelsene kan uttrykkes i RDF / XML som:

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://en.wikipedia.org/wiki/Tony_Benn"> <dc:title>Tony Benn</dc:title> <dc:publisher>Wikipedia</dc:publisher> </rdf:Description> </rdf:RDF>

For en person som snakker fransk, kan den samme informasjonen bare vises som følger:

“Tittelen på denne ressursen, som er publisert av Wikipedia, er 'Tony Benn'. "

RDF integrerer imidlertid informasjon på en formell måte slik at en maskin kan forstå den. Målet med RDF er å tilby en kodings- og tolkningsmekanisme som representerer ressurser for programvare . Med andre ord, slik at programvare kan få tilgang til og bruke informasjon som ellers ikke kunne brukes.

Begge versjonene av ovennevnte erklæringer er lange, fordi et krav til en RDF-ressurs (for eksempel et emne eller et predikat) er at den er unik. Ressursene som sendes inn må være unike for å tillate eksakt identifisering av de beskrevne ressursene. Predikatet må være unikt for å redusere sjansene for å forvirre forestillingen om tittel eller utgiver av programvare. Hvis programvaren gjenkjenner http://purl.org/dc/elements/1.1/title (en definisjon av begrepet tittel etablert av Dublin Core Metadata Initiative), bør det også være klar over at denne tittelen er forskjellig fra en landtittel eller en heders tittel eller bare tittelbokstavene satt sammen.

Følgende eksempel viser hvordan du kan representere denne informasjonen ved å kombinere flere RDF-vokabularer. Her legger vi i tillegg til hovedtemaet på Wikipedia-siden, som er en person som heter "Tony Benn":

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://en.wikipedia.org/wiki/Tony_Benn"> <dc:title>Tony Benn</dc:title> <dc:publisher>Wikipedia</dc:publisher> <foaf:primaryTopic> <foaf:Person> <foaf:name>Tony Benn</foaf:name> </foaf:Person> </foaf:primaryTopic> </rdf:Description> </rdf:RDF>

RDF-serialisering

RDF er en datamodell, ikke et format. For å publisere en RDF-graf på nettet krever dette bruk av en såkalt RDF-serialisasjonssyntaks.

Det er flere serialiseringsformater:

  • RDF / XML  ;
  • Turtle subset of Notation3  ;
  • N-Triples  (en) delmengde av Turtle;
  • JSON-LD  ;
  • RDFa , anbefalt av W3C i 2008;
  • Web Ontology Language ( OWL ), anbefalt av W3C i 2012.

Eksempler på applikasjoner

  • SKOS , hvis mål er å tillate enkel publisering av strukturerte vokabularer for bruk innenfor rammen av Semantic Web .
  • Dublin Core for bibliografisk klassifisering.
  • RSS- versjon 1.0 er basert på RDF.
  • Mozilla Firefox  : nettleseren bruker RDF for bokmerker, for lokalisering.
  • Wikipedia  : I april 2006 ble innholdet i navneområdet 0 og 14 (kategorier) i den engelske, tyske og franske versjonen gjort tilgjengelig som 47 millioner tredobler.
  • XUL  : grensesnitt språk ved hjelp av RDF for data.
  • DBpedia : en samling av RDF-ressurser fra Wikipedia.
  • Det lille semantiske laboratoriet  : utnytte og grensesnitt semantiske data fra DBpedia og Data.bnf.fr for transponering i form av en graf i katalogen til det kommunale biblioteket i Fresnes.
  • SYRTIS (Library management system). RDF-modellen er kjernen i den bibliografiske overgangen som drives av ABES og BnF . Det brukes til å strukturere kataloger via IFLA LRM konseptuelle modell . Dermed opprettet selskapet Progilone Syrtis-løsningen som tillater utstilling av en katalog på nettet av data i RDF.

Merknader og referanser

  1. (in) "  RDF Primer  " , W3C (åpnet 13. mars 2009 ) .
  2. Myriam Pauillac, “  Nett av data og arkiver - hvilken interesse?  » [Html] , om Anaphore; innovative digitale løsninger; arkiver og arv ,23. november 2014(åpnet 16. april 2018 )
  3. Pierre BOURNERIE, "  Det lille semantiske laboratoriet: eksperimentering ved BM i Fresnes  " , på overgangsbibliographique.fr ,12. mai 2020(åpnet 12. juli 2021 )
  4. Pierre BOURNERIE, Berik portalen din og administrer myndighetsfiler: eksempelet på Fresnes BM  " , på transition-bibliographique.fr ,13. mai 2020(åpnet 12. juli 2021 )
  5. "  Mot ny SGB  " , på transition-bibliographique.fr ,26. mai 2021(åpnet 12. juli 2021 )
  6. Virginie DELAINE og Bénédicte FROCAUT, "  Rapport fra Syrtis de Progilone-verkstedet  " , på transition-bibliographique.fr ,13. mai 2020(åpnet 12. juli 2021 )

Relaterte artikler

Eksterne linker