De åpne data og åpne data er data digital herunder tilgang og bruk er igjen gratis for brukerne, som kan være fra private kilder, men stort sett offentlige, spesielt produsert av et fellesskap eller offentlig institusjon. De distribueres på en strukturert måte i henhold til en metode og en åpen lisens som garanterer fri tilgang og gjenbruk av alle uten tekniske, juridiske eller økonomiske begrensninger.
Tilgang til data har på den ene siden som mål at borgere skal kunne kontrollere administrasjonen bedre, på den andre siden å bruke disse dataene, noe som innebærer at denne retten til tilgang er ledsaget av en rett til gjenbruk.
Disse rettigheter for tilgang og gjenbruk er en del av tenkningen som vurderer offentlig informasjon som et felles gode (som definert av Elinor Ostrom ) som formidling er i offentlig og generell interesse .
Åpenheten til data er således både en filosofi om tilgang til informasjon, en bevegelse for forsvar av friheter og en offentlig politikk .
Noen land var pionerer, inkludert USA , Storbritannia , Australia og Canada og deretter Frankrike . Bevegelsen har spredt seg spesielt under impuls fra ikke-statlige organisasjoner som Open Knowledge Foundation (OKFN) og Open Government Partnership (PGO).
Data er åpen hvis alle fritt kan få tilgang til den, bruke den, endre den og distribuere den, uansett formål.
The Open Data er en bevegelse av skuespillere valgkamp for åpne data. Det er også en offentlig politikk som består i å åpne offentlige data for å fremme åpen innovasjon i offentlig sektor, være ansvarlig overfor innbyggerne og forbedre gjennomsiktigheten av offentlig handling, og til slutt gjøre ressurser tilgjengelig for den private sektoren. Utvikling av nye tjenester .
Artikkel 15 i erklæringen om menneskerettighetene og borgeren fra 1789 nevner at samfunnet har rett til å stille enhver offentlig tjenestemann i sin administrasjon til ansvar. Denne artikkelen utgjør det juridiske grunnlaget for retten til tilgang til offentlig informasjon.
Den offentlighetsloven , gjennomført i 1967, skaper en rett til informasjon for innbyggerne. Den ble spesielt endret i 2007 av OPEN Government Act .
FrankrikeÅpne data er en utvidelse av tilnærmingen som følger av loven fra 17. juli 1978 om tilgang til administrative dokumenter, selv om dette ikke krever publisering av digitale data eller proaktiv publisering av informasjon. Det anerkjenner rett og slett retten til å få formidling av dokumenter som administrasjon har, uansett form eller medium.
I EU oppmuntrer direktiv 2003/98 / EF (" Offentlig sektorinformasjon " (PSI )) fra Rådet for Den europeiske union fra 17. november 2003 om gjenbruk av offentlige data og INSPIRE- direktivet i 2008 til åpne data .
Direktiv 2019/1024 “Direktiv om åpen data” fra 2019 erstatter direktivet fra 2003.
forente staterMed valget av Barack Obama blir åpningen av offentlige data en sentral akse for den amerikanske regjeringen med Open Government Initiative, samt som nevner kriteriene for publisering av åpne data.
I sin innvielsestale kunngjorde Barack Obama sin intensjon om å "skape et hidtil uset nivå av åpenhet i regjeringen " , med sikte på "å styrke demokratiet og fremme dets effektivitet og effektivitet i regjeringen" .
I Mars 2009lanserer den amerikanske regjeringen den føderale åpne dataportalen data.gov . I desember samme år fastlegger det åpne regjeringsdirektivet de tre søylene i samarbeidet mellom staten og innbyggerne, som er: åpenhet, deltakelse og samarbeid fra myndighetene. Vivek Kundra , fremste føderale informasjonssystemer ( Chief Information Officer ) i Obama-administrasjonen, bemerker at "utgivelsen av disse dataene har ført til en redning av applikasjoner [...] det har skjedd en eksplosjon av disse samfunnets utviklere" .
StorbritanniaI Storbritannia krever artikkelen som ble publisert av The Guardian i 2006 "Gi oss tilbake kronjuvelene" en liberalisering av offentlige data og tjener som "det innledende øyeblikket til bevegelsen med åpne data " .
Gordon Brown lanserte den åpne dataportalen Data.gov.uk i januar 2010 under ledelse av Tim Berners-Lee .
FrankrikeI Frankrike har visse lokale myndigheter som Rennes eller Paris startet en åpen datatilnærming i 2010. På nasjonalt nivå opprettet regjeringen i februar 2011 Etalab- oppdraget , en tjeneste for statsministeren som er ansvarlig for å koordinere denne offentlige åpne datapolitikken, og lanserte en spesifikk portal, data.gouv.fr , i desember samme år.
På G8-toppmøtet i 2013 undertegnet statsoverhodene til G8 et " G8-charter for åpning av offentlige data ."
I Frankrike gir loven for en digital republikk fra oktober 2016 i Frankrike, som etablerer prinsippet om åpen som standard overførbar offentlig informasjon og skaper begrepet offentlig datatjeneste , åpne data et lovgivningsgrunnlag.
Det er de åpne dataene fra Public Health France om Covid-19-pandemien som har gjort det mulig for et analytikersamfunn å publisere grafer og kart etter pandemien på nasjonalt nivå, blant dem Guillaume Rozier .
Åpningen av offentlige finansdata har vært kjernen i bevegelsen av åpne data fra begynnelsen. I 2007, i Storbritannia, designet Jonathan Gray prosjektet " Where do my money go ", en visualisering av britiske myndighetsutgiftsdata som gjør det mulig for borgere å få tilgang til dem.
Åpne vitenskapelige data og åpen tilgang er to relaterte, men forskjellige temaer. Åpen tilgang gjelder vitenskapelige publikasjoner, ofte fagfellevurdert. Åpningen av vitenskapelige data kan gjelde dataene som disse artiklene er basert på, eller hvilken som helst database av vitenskapelig art (for eksempel meteorologiske poster eller andre), for å tillate reproduksjon av eksperimentene som er utført, for å bekrefte dem eller ugyldiggjøre dem.
De kan også være data fra offentlige vitenskapelige forskningsinstitutter (eller private som drar nytte av offentlig finansiering, eller frivillig ønsker å åpne og dele dataene sine), ofte samtidig med gratis formidling av forskningsresultater; man snakker da i denne sammenheng om "fri tilgang" eller "fri formidling" , hvis første definisjon ble gitt i den internasjonale erklæringen om åpen tilgang i Budapest som ble holdt den14. februar 2002, kjent under akronymet BOAI (fra det engelske Budapest Open Access Initiative ) .
Derfra har det kommet mange andre initiativer andre steder i verden med for eksempel Berlin- erklæringen fra 2003 om fri tilgang til kunnskap innen vitenskap og humaniora ; fulgt i mars 2005, fra Southampton , en ny erklæring heter Berlin III for å styrke de tiltakene som en del av Berlin jeg .
Prosjektet for sekvensering av det menneskelige genom ble gjort mulig ved en Open Data Consortium opprettet etter forslag fra Jim Kent (en) i 2003, som nyter godt vil være blant annet utviklingsland der universiteter og forskningssentre n ikke alltid har tilgang til vitenskapelige tidsskrifter.
I 2010 lanserte EU lovgivningsprosjektet om åpning av transportdata gjennom direktivet om intelligente transportsystemer (ITS) og klargjorde anvendelsen i 2017 med delegert forordning (EU) 2017/1926.
I Frankrike er åpningen av data om transport styrt av flere lover. Først den Macron lov av 2015 pålegger transport organisere myndigheter å gi vanlige passasjertransport data . Deretter utvider Lemaire-loven fra 2016, gjennom plikten til å åpne data av allmenn interesse, slik som de som er produsert innenfor rammen av public service delegasjoner (DSP) , datafeltet som skal åpnes. Dette gjelder spesielt transportdata fordi DSP er den mest brukte administrasjonsmodusen for urban persontransport i Frankrike.
I 2019 Mobility Orientation Law (LOM) spesifiseres disse dataåpningsforpliktelsene og utvider dem. Den spesifiserer at det er mobilitetsorganisasjonsmyndigheten (AOM) som er ansvarlig for å koordinere tilførselen av data. Hensikten med å åpne disse dataene er å lette utviklingen av MaaS (Mobility as a service) applikasjoner og tjenester som samler flere reiseløsninger .
Disse dataene er både statiske og dynamiske reise- og trafikkdata samt historiske trafikkdata. Faktisk forklarer LOM gjennom artikkel L1115-1 i transportkoden at dataene som skal åpnes er de som er spesifisert i vedlegget til delegert forordning (EU) 2017/1926, her er noen eksempler:
Den LOM går lenger enn europeisk regulering, som bare pålegger publisering av statiske data, og utvider åpenhet av data til dynamiske data, til ladestasjoner for elektriske eller hybrid kjøretøy og til carpooling tjenester som må gi et tilgangspunkt til deres tjenestetilbud .
Den styring av åpne data er også angitt av LOM . Artikkel L1115-2 nevner at AOM eller transportoperatører må sørge for "levere data opp til standarder og oppdateringer gjennom National Access Point (NAP)." I Frankrike er det nasjonale tilgangspunktet transport.data.gouv- nettstedet som i april 2021 høstet 441 datasett.
Den publikasjonen lisensen ikke er pålagt av LOM , men det er rammen av Lemaire lov av 2016 som gjelder, og gjør det mulig å åpne data under Etalab lisens eller under ODbL lisens (Open Database License) .
Til slutt, når det gjelder dataformatet , pålegger den europeiske forskriften standarder som muliggjør interoperabilitet : valg av NeTEx- eller TAP PSI- og SIRI- standarder eller spesifikasjoner i sanntid . Imidlertid er mye av dataene publisert av private operatører og offentlige myndigheter i GTFS- format . Til slutt vil NAP gi gfts-datakonverterer til NETEX-format for å tillate AOM å overholde forskriften.
Det åpne dataøkosystemet inkluderer aktører fra det sivile samfunn som Open Data Institute eller Open Knowledge Foundation eller OpenStreetMap , offentlige administrasjoner, private selskaper, aktører fra forskningsverdenen, aktører fra journalistikkens verden, finansierere og internasjonale organisasjoner.
I 2010 opprettet Sunlight Foundation en liste over ti kriterier som kjennetegner åpne data. For at en data skal sies å være "åpen", må den være:
I 2010 foreslo Tim Berners-Lee en åpen datakvalitetsskala (1 til 5 stjerner).
★ | Ufiltrerte data (muligens degradert) f.eks lastet opp med hvilket som helst format |
★ ★ | Data tilgjengelig på en strukturert måte (f.eks. Tabelldata i CSV , XML , Excel , RDF ) |
★ ★ ★ | Fritt utnyttbare data - lovlig (se lisenser), - teknisk (i ikke-proprietære formater, ikke spesielt i Excel) |
★ ★ ★ ★ | Data identifisert av URL-er (med oppdateringsdato) slik at vi kan "peke" en lenke til dem (og muligens finne dem oppdatert) |
★ ★ ★ ★ ★ | Data knyttet til andre data, for å kontekstualisere og berike dem |
Denne skalaen gjelder grunnleggende digitale data, men kriteriene kan tilpasses aggregerte data eller mer kompleks offentlig informasjon (bilder, videoer, rapporter, studier osv. Som også må legges på nettet, ideelt sett med kvalitetsmetadata . Og kan også omfatte hypertekst i tilfelle rapporter og studier, eller til og med visse videoer)
Hovedmålet var å legge data produsert av staten eller andre online uten å vente på implementering av et fellesskap av private interesser ( Jf. Debatten nedenfor om kylling- eller kyllingeparadokset. Egget ) som kunne redusere tilgjengeligheten av data på nettverket, og reduserer derfor indirekte fremveksten av teknologiske gjennombrudd innen den semantiske nettbevegelsen som Tim Berners-Lee er en av initiativtakerne til.
Innen flere forskningsfelt, til tross for krav om god praksis innen gjennomsiktighet og datadeling, blir ikke rådata kommunisert av forfatterne, ikke engang til anmeldere.
Mange vitenskapelige svindel i forskning kunne ikke oppdages tidlig av vurderingskomiteene fordi forfatterne nektet å dele dataene sine (til og med medforfatterne noen ganger), spesielt innen psykologi der 50% av eksperimentene viser ikke-reproduserbare resultater, som stiller alvorlige problemer med tillit til resultatene og har utløst et initiativ kalt Peer Reviewers 'Openness Initiative , der ifølge at når det ikke er etiske grunner til ikke å gjøre det, bør gjennomsiktighet og åpenhet av data være grunnleggende verdier for vitenskapen, i spesielt for å muliggjøre arbeidet med korrekturlesere.
Det finnes forskjellige moderne måter å dele vitenskapelige data på, inkludert forpublisering og etterpublisering. I tillegg ser forfattere som deler dataene deres øke sjansene for å bli sitert.
I Storbritannia har kryssing av åpne data muliggjort en reduksjon på 30% i energiforbruksregningen i offentlige bygninger på bare to måneder.
Åpne data muliggjør ideell konkurranse mellom alle virksomheter. Imidlertid har sosiologiske studier i India og Canada vist at tilgang og bruk av åpne data er betinget av materiale (strøm, besittelse av datautstyr) og sosiale (utdanning) kriterier.
I tillegg, ifølge visse studier, vil utgivelsen av disse offentlige dataene dele med fem kapitalen som er nødvendig for å utøve en profesjonell aktivitet i mobiltelefonisektoren . MEPSIR-rapporten fra 2006, finansiert av EU-kommisjonen, anslår at det europeiske markedet knyttet til gjenbruk av offentlig informasjon utgjør 27 milliarder euro.
I tillegg er den direkte og indirekte økonomiske virkningen estimert til 140 milliarder euro per år for Europa.
Fra og med 2016 har flere regjeringer planer om å utvikle kunstig intelligens . Disse regjeringene understreket den viktige rollen som åpne data har for utviklingen av en økonomisk sektor med kunstig intelligens.
Det er forskjellige meninger om implementering av åpne data som koker ned til " Kylling- og eggparadokset ":
Åpningen av dataene krever påføring av en lisens som angir vilkårene under hvilke disse dataene kan kopieres, distribueres, brukes fritt. Ettersom juridiske sammenhenger varierer fra land til land, brukes forskjellige lisenser i dag over hele verden.
Open data commons er et prosjekt som ble lansert i Storbritannia i desember 2007 av Open Knowledge Foundation . Den første gratis lisensen for prosjektet ble utviklet i mars 2008 av Jordan Hatcher og D r Charlotte Waelde.
Disse lisensene kan brukes på databaser og dataene de inneholder tas isolert. The Open Knowledge Foundation har utviklet tre typer gratis datalisenser som er basert på deres interne rett, selv basert på den anglo-saksiske modellen og som skiller seg fra Romano-germansk rettigheter, dvs. sivilrett, med en mer anerkjent og vellykket beskyttelse av moralsk rettigheter. Anvendelsen av noen av disse lisensene på intellektuelle verk er derfor ikke gyldig i Frankrike, men kan vurderes for formidling av offentlige data i den grad de per definisjon er offentlige.
Dedikasjon og lisens for offentlig domeneThe Public Domain og lisens (PDDL) gir mulighet til å bruke, kopiere, endre, distribuere en database uten noen begrensning. Det er fritt for alle rettigheter, lisens for offentlig domene. Dataene kan derfor brukes på en helt gratis måte og forfatteren gir opp sine moralske rettigheter.
Åpne Database CommonsDenne lisensen, som finnes under akronymet ODC-by, autoriserer bruk, kopiering, omfordeling, modifisering, produksjon av verk avledet fra databasen, med forbehold om at navnet på forfatteren av den opprinnelige databasen er oppgitt. Disse prinsippene finnes i Creative Commons By-lisensen .
Open Data Commons Åpen databaselisensODbL-lisensen er basert på copyright og sui generis databaserettigheter. Det tillater brukere å kopiere, distribuere, bruke, modifisere og produsere et avledet verk fra en database som er gjenstand for omfordeling på samme vilkår som den opprinnelige lisensen pålegger. Det innebærer også å angi navnet på forfatteren av den opprinnelige databasen.
Med unntak av den spesialdesignede CC-0-lisensen, er ikke lisenser i Creative Commons-familien egnet for databasebruk. De er faktisk bare sentrert om opphavsrett, og forsømmer sui generis- retten til databaser: Dette risikerer på den ene siden å gjøre dem ineffektive (overholdelse av deres forpliktelser er ikke lenger knyttet til overføring av rettigheter.) Og på den annen side for å gjøre usikker status på dataene som formidles under disse lisensene (den mulige sui generis- retten til databasene ikke deles).
I henhold til fransk lov anses offentlige data som sannsynlig å inneholde sensitiv informasjon, enten fordi det gjør at en person kan identifiseres, eller fordi det er underlagt copyright, statshemmelighet eller av nasjonale forsvarshensyn . I denne sammenheng kan ikke dataene spres fritt uten forhåndsgodkjenning eller må være gjenstand for anonymisering. Når kringkastingsrettighetene er garantert, vil lisenser gjelde. Ulike organisasjoner har utviklet gratis lisenser som gjelder for alle typer innhold, publikum eller skapelser i sinnet. Dette er enkle forretningslisensmodeller som ikke krever samsvar. Upubliserte kontrakter kan utarbeides, forutsatt at intern lovgivning respekteres, både med hensyn til bestemmelsene i lovene fra 17. juli 1978 eller til og med 6. januar 1978, og med hensyn til reglene for offentlig orden som gjelder kontrakten. I Frankrike er opptil fem forskjellige lisenser for gjenbruk blitt påført åpne data. I 2013 førte harmoniseringen av praksis til bruk av to standardlisenser som ble brukt i tilsvarende proporsjoner: Open License og Open Database License.
Lisens fra det franske justisdepartementetJustisdepartementet har tatt initiativ til å utforme en lisens tilpasset offentlige data, Freely Reusable Public Information License, ofte kalt LIP.
Det gir muligheten til å gjenbruke dataene fra departementets katalog gratis, selv for kommersielle formål, forutsatt at kildene er nevnt, datoen for oppdateringen, at dataene ikke blir endret og betydningen av dem ikke er forvrengt.
Det forutsettes også at brukeren bare kan godkjenne et nytt gjenbruk under en lisens på betingelse av å ha merverdi til de originale dataene.
Åpen lisensDenne lisensen opprettet av ETALAB er ment å brukes spesielt på data.gouv.fr.
Åpne databaselisensODbL-lisensen er oversatt til fransk av byen Paris for å tilpasse den til nasjonal bruk. En rekke prosjekter bruker denne lisensen, fra OpenStreetMap til lokalsamfunn (Paris, Nantes, Toulouse ...).
The Open Knowledge Foundation publiserte Globalt åpne data-indeksen .
The World Wide Web Foundation publiserer Åpne data barometer for å måle åpenhet av data og dens innvirkning på land.
Den OECD publiserer en vurdering kalt Open Government data på åpenhet av offentlige data i sine medlemsland.
Hvert år i slutten av februar eller begynnelsen av mars arrangerer Open Knowledge Foundation Open data day (in) .