Datakvalitet

Den kvaliteten av dataene i databehandling refererer til overholdelse av data beregnet på bruk i fremgangsmåten , den prosesser , beslutningskoker og planleggings (JM juran).

På samme måte anses dataene for å være av høy kvalitet hvis de korrekt representerer den virkeligheten de henviser til.

Disse to visningene kan ofte komme i konflikt med hverandre, selv når det samme datasettet brukes til et felles formål.

Historisk

De fleste teknologiene i datamaskindataene kommer fra ønsket om å sende informasjon via post . Før fremveksten av billige servere ble mainframes brukt til å oppdatere data (navn, adresser og andre attributter) slik at e-post kom riktig til målet. Den stormaskin bruke forretningsregler for å rette feil i dataene (feil på banen navn og dato, strukturering defekter) og for å spore kunder som hadde endret sin adresse , forsvant, fusjonert, eller opplevd andre arrangementer.

I USA begynte offentlige etater å gjøre postdata tilgjengelig for noen få tjenesteselskaper for å administrere virksomheter under National Change of Address Register (NCOA) . Denne teknikken har spart store bedrifter store summer (millioner dollar) i forhold til manuell håndtering av kundedata . Store selskaper har redusert portokostnadene sine, med fakturaer og post som er mottatt mottakerne mer presist. Opprinnelig solgt som en tjeneste, har datakvaliteten blitt integrert i organisasjoner takket være tilgjengeligheten av rimelige serverteknologier.

Selv om de fleste bedrifter tenker på navn og adresse når de er opptatt av datakvalitet, i dag er det anerkjent at data kvalitet er måten å forbedre alle typer data , for eksempel data om data. Verdikjeden , ERP data, transaksjonsdata, etc. For eksempel har å justere forsyningskjededata til en bestemt standard verdi for en organisasjon ved å:

  1. unngå overlagring av lignende, men litt forskjellige aksjer
  2. forbedre forståelsen av kjøp ved å forhandle om mengderabatter
  3. unngå logistikkostnader ved å lagre og sende reservedeler over en stor organisasjon.

Mens navn og adresse har en klar standard med postmyndighetsdefinisjoner, har andre typer data få anerkjente standarder. Det er en grunnleggende trend i dag i bransjen å standardisere visse data som ikke er adresser. GS1- gruppen er en av gruppene som leder denne bevegelsen.

Viktigheten av datakvalitet

Datakvalitet er veldig viktig for å oppnå interoperabilitet av komplekse systemer. Spesielt griper det inn i kravene til sporbarhet , som vises i flere økonomiske sektorer:

På samme måte er datakvaliteten også involvert i analysen av livssyklusen til produkter .

Datakvalitet er også av stor betydning i direkte markedsføring eller mer generelt i Customer Relationship Management (CRM) hvor kundedata representerer en viktig verdikilde for selskaper.

Fra en vinkel som er mer direkte knyttet til datasikkerhet , griper den inn i administrasjonen av arkivdokumenter for å være ansvarlig.

Kvaliteten på informasjon er en av de 11 faktorene av virksomheten intelligens modellen (AFDIE).

I følge CIGREF- rapporten om immateriell kapital , er påliteligheten og revisjonen av data betinget av evalueringen av den immaterielle kapitalen til selskaper, og beregningen av avkastningen på kunnskapstekniske prosjekter . Det er derfor nødvendig å ha referansedata standard for å vurdere datakvalitet.

Vi kan også si at målet for innholdsstyring å oppnå en konvergens av innholdsstyringssystemer er en del av en kvalitetsmetode innen datafeltet .

Kvaliteten på informasjonen i virksomheten intelligens modellen

Modellen for økonomisk intelligens fra AFDIE identifiserer seks kvalitetskriterier for informasjon  :

1. Kostnad og verdi av informasjon:

Implementeringen av IAS / IFRS-standardene inkluderer innregning av immateriell kapital som immaterielle eiendeler  ; det presser selskapet til å bedre vurdere verdien av informasjon i strategien.

2. Kunnskap kapitalisert og validert,

Måten å kapitalisere og validere kunnskap på er gjennom kunnskapstekniske prosjekter .

3. Levende og tilgjengelig minne,

Minnet kan styres effektivt ved hjelp av en innholdsadministrasjonsmetode , som tar sikte på å forene de forskjellige innholdsstyringssystemene som finnes i selskapet.

4. Informasjon og kunnskap bedre delt og beskyttet,

Det er et spørsmål om å opprette praksisfellesskap , med kriterier som gjør det mulig å beskytte informasjonsarven .

5. Skriftlig og muntlig informasjon som er viktig før beslutningstaking,

6. Fremoverlent og historisk informasjon.

Det er et spørsmål om å ha et historisk depot og gjøre det mulig å gjennomføre potensielle analyser i henhold til analyseakser.

Datakvalitet og beslutningssystem

Hensikten med beslutningssystemet er å hjelpe beslutningstakere med å ta relevante valg basert på historiske data. Dette innebærer vanligvis å håndtere store mengder av forskjellige data for å kalibrere dem til informasjon som er tilstrekkelig presis og pålitelig slik at handlinger kan defineres og igangsettes med tillit. Denne klassiske utfordringen for BI-arkitekter forsterkes i nyere tid med økende krav til mangfold, dybde og friskhet av historiske data som skal håndteres. I denne sammenheng blir hastigheten som data kan "renses", "transformeres" og integreres i et datalager avgjørende for bedriftens konkurranseevne.

Kvaliteten på dataene avhenger først og fremst av konteksten de ble opprinnelig angitt i, men fra et beslutningssynspunkt avhenger interessen av bruken en bruker kan gjøre av det. Kvaliteten på dataene bør derfor ikke vurderes i absolutte termer, men på en måte i forhold til forretningsinteressen. Etter hvert som forretningsbehovene utvikler seg, kan vurderingen av datakvaliteten derfor aldri løses definitivt. Program for forbedring av datakvalitet må være målrettet i henhold til forretningsinteresser, ellers er det høy risiko for å skape en Sisyphus- verdig arbeidsmengde .

Standardisering

Det er svært få standarder spesielt relatert til datakvalitet . Vi kan imidlertid merke oss:

Det er også behov for informasjonen i dataressursene som dataforskere kaller "ustrukturert". Arbeidet pågår for å oppnå standardisering av referansedata som brukes i disse typer ressurser , inkludert nettressurser som nå er uheldig og trenger å grensesnitt med andre typer dataressurser .

Bibliografi

Merknader og referanser

Se også

Kilde