Den BI (engelsk business intelligence ( BI ) og beslutningssystem støtte ( DSS )) er datamaskinen for bruk av beslutningstakere og næringslivsledere. Den angir virkemidlene, verktøyene og metodene som gjør det mulig å samle inn, konsolidere, modellere og gjenopprette dataene , materielle eller immaterielle , til et selskap for å tilby beslutningsstøtte og la beslutningstakere få oversikt over aktiviteten Bearbeidet.
Denne typen applikasjoner er basert på en felles arkitektur hvis teoretiske grunnlag hovedsakelig kommer fra Ralph Kimball , Bill Inmon og DanLinstedt.
Forretningsintelligens er en del av den bredere arkitekturen til et informasjonssystem , men er ikke et begrep som konkurrerer med styringen av informasjonssystemet . På samme måte som ledelse er et spørsmål om sosiologi og økonomi , er ledelse gjennom IT konstituerende for to radikalt forskjellige felt, nemlig ledelse og IT . For å berike konseptet med disse to måtene å tenke på, er det mulig å vurdere en IT-engineering-orientert side som kalles business intelligence , og en annen side som betjener mer spesielt administrasjonsmetoder som kalles system management .
Det engelske ordet business intelligence (BI) kan føre til forvirring med begrepet økonomisk intelligens (IE). Forretningsintelligens betyr ikke " økonomisk intelligens ", i motsetning til hva en bokstavelig oversettelse vil tilsi (Jf. Denne diskusjonen) .
BI skiller seg fra EI på tre måter:
Foreløpig lagres data for forretningssøknader i en (eller flere) relasjonell eller ikke-relasjonsdatabase (r) .
Disse dataene blir ekstrahert, transformert og lastet inn i et datalager, vanligvis av et ETL - verktøy ( Extract-Transform-Load ).
Et datalager kan ha form av et datalager eller et datamarked . Som en generell regel, aggregerer datavarehuset alle de program data i selskapet, mens data marts (vanligvis mates fra data fra datavarehus ) er undergrupper av opplysninger om en bestemt virksomhet i selskapet (markedsføring, risiko, styring kontroll, etc.), spesifikke bruksområder (analyse, rapportering osv.), eller til og med oppfylle spesifikke krav eller begrensninger (partisjonering av data, volum osv.). Begrepet datateller eller data lager blir også anvendt for å betegne en Datamart.
Datalager lar deg produsere rapporter som svarer på spørsmålet "Hva skjedde?" Men de kan også utformes for å svare på det analytiske spørsmålet "Hvorfor skjedde dette?" "Og til det prognostiske spørsmålet" Hva vil skje? ". I operativ sammenheng svarer de også på spørsmålet "Hva skjer akkurat nå?" ", Eller til og med i tilfelle en aktiv datalagerløsning" Hva skal skje? ".
Den rapporteringen er trolig den mest brukte i dag og BI-programmet, kan det ledere:
Programmene som brukes for rapportering gjør det selvfølgelig mulig å reprodusere de samme valgene og de samme behandlingene fra periode til periode, og å variere visse kriterier for å foredle analysen. Men rapportering er ikke strengt tatt en søknad om beslutningstøtte. Fremtiden tilhører heller instrumenter som er utstyrt med flerdimensjonale analysefunksjoner av Olap-typen. OLAP- funksjon som kan oppnås på forskjellige måter, for eksempel via en R-OLAP relasjonsdatabase, eller flerdimensjonal M-OLAP-database, eller til og med i H-OLAP.
Datamarts og / eller datalager kan således via OLAP tillate en veldig grundig analyse av selskapets aktivitet, takket være statistikk som kombinerer informasjon om aktiviteter som tilsynelatende er veldig forskjellige eller veldig fjernt fra hverandre, men studien som ofte avslører dysfunksjoner , sammenhenger eller muligheter for veldig betydelige forbedringer.
Den interoperabilitet mellom systemer datalager , datamaskin-applikasjoner eller innholdsadministrasjon , og rapporteringssystemer er oppnådd gjennom en styring metadata .
Business intelligence fokuserer på å måle:
For eksempel kan det være lurt å måle:
Vi får dermed en tabell med to oppføringer:
Som illustrasjon gjør kryss tabellene til de viktigste regnearkene det mulig å bygge denne typen dashbord fra en database .
Hvis vi er interessert i en tredje analysedimensjon, for eksempel det geografiske hierarkiet for salgssteder (etter land, region, butikk), beveger vi oss dermed til en kube . Den pivot tabeller av Excel kan representere denne type kube med "side", som representerer den samlede data for hvert hierarkisk nivå og for hver dimensjon.
Hvis vi er interessert i en ekstra analyseakse, for eksempel kundesegmentering (etter kategori, yrke, kunde), får vi en kube med mer enn 3 dimensjoner, kalt hypercube . Begrepet kube brukes ofte i stedet for hyperkube .
Verktøyene i beslutningsverdenen gir muligheter for "navigering" i de forskjellige dimensjonene til kuben eller hyperkuben:
Hver av disse delvise visningene av kuben resulterer til slutt i enten en dobbeltoppføringstabell (kryssortering) eller en generelt todimensjonal graf .
Så selv om navigasjonen i kuben er flerdimensjonal, har ikke beslutningstakeren i realiteten tilgang til en syntese, men til et mangfold av kryssorter eller todimensjonale synspunkter hvis utforskning, lang og kjedelig, noen ganger er kort. - krets for mangel på tid. Dette kan føre til kostbare beslutningsfeil.
Det kan derfor være nyttig å kombinere denne tilnærmingen med en ikonografi av sammenhenger , som gir en virkelig flerdimensjonal oversikt , uten redundanser.
Et beslutningsinformasjonssystem (CIS) må kunne gi fire grunnleggende funksjoner: innsamling, integrering, distribusjon og presentasjon av data . Til disse fire funksjonene er det lagt til en administrasjonsfunksjon , det vil si kontrollen av selve SID.
Samlingen funksjon (noen ganger kalt datapumping ) dekker alle de oppgavene som består i å detektere, velge, ekstraksjon og filtrering av rå data fra de aktuelle miljøene gitt omfang omfattes av SID. Som det er vanlig for interne og / eller eksterne datakilder for å være heterogene - både teknisk og semantisk - denne funksjon er det mest vanskelige å sette opp i en kompleks beslutningssystem. Den er spesielt avhengig av ETL- verktøy ( ekstrakt-transform-last for ekstraksjon-transformasjon-lasting).
Den kilden data som mater SID kommer fra transaksjonsproduksjonssystemer, oftest i form av:
Samlingsfunksjonen spiller også en omkodingsrolle, om nødvendig. En data representert forskjellig fra en kilde til en annen krever selektering av en enkelt representasjon og derfor en nyttig egen for fremtidig analyse.
Integrasjonsfunksjonen består i å konsentrere de innsamlede dataene i et samlet rom, og det viktigste IT-fundamentet er datalageret . Sentralt i systemet, det lar applikasjonsinformasjonssøknader skjule mangfoldet av opprinnelsen til data og dra nytte av en felles, homogen, standardisert og pålitelig kilde til informasjon, innenfor et enkelt og om mulig standardisert system.
I forbifarten blir dataene renset eller transformert av:
Det er også i denne funksjonen at beregningene og akkumuleringene (akkumuleringene) som er felles for hele prosjektet, blir utført.
Integreringsfunksjonen leveres vanligvis av administrasjonen av metadata , som sikrer interoperabilitet mellom alle dataressurser , enten det er strukturerte data ( databaser som er tilgjengelige med programvarepakker eller applikasjoner), eller ikke- data. Strukturert (dokumenter og andre ustrukturerte ressurser, manipulert av innholdsstyringssystemer ).
Formidlingsfunksjonen gjør dataene tilgjengelige for brukere , i henhold til mønstre som tilsvarer profilene eller yrkene til hver, og vet at direkte tilgang til datalageret generelt ikke samsvarer med de spesifikke behovene til en beslutningstaker eller leder. 'En analytiker. Det prioriterte målet er derfor å segmentere dataene i svært sammenhengende informasjonskontekster, enkle å bruke og tilsvarer en bestemt beslutningstaking. Mens et datalager kan være vert for hundrevis eller tusenvis av variabler eller indikatorer, har en rimelig utgivelseskontekst bare noen få dusin på det meste. Hver kontekst kan tilsvare et datamart , selv om det ikke er noen generelle regler for fysisk lagring. Svært ofte er en diffusjonskontekst flerdimensjonal , det vil si kan modelleres i form av en hyperkube ; den kan deretter gjøres tilgjengelig ved hjelp av et OLAP- verktøy .
De forskjellige sammenhengene i det samme beslutningssystemet trenger ikke alle det samme detaljnivået. Mange aggregater eller akkumuleringer er bare av interesse for bestemte applikasjoner og trenger derfor ikke å administreres som vanlige aggregater av integrasjonsfunksjonen: Administrasjonen av denne typen spesifisitet kan håndteres av kringkastingsfunksjonen. Disse aggregatene kan valgfritt lagres vedvarende eller dynamisk beregnet på forespørsel.
På dette stadiet, og når det gjelder utforming av et rapporteringssystem, må tre nivåer av spørsmål stilles:
Denne fjerde funksjonen, den mest synlige for brukeren, styrer vilkårene for brukertilgang til informasjon, innenfor rammen av et bestemt menneske-maskin-grensesnitt ( MMI ). Det gir tilgangskontroll og drift av arbeidsstasjonen , håndtering av forespørsler, visning av resultater i en eller annen form. Den bruker alle mulige kommunikasjonsteknikker: office verktøy , queryers og spesialiserte rapport generatorer, web infrastruktur , mobil telekommunikasjon, etc.
Det er den tverrgående funksjonen som overvåker riktig utførelse av alle de andre. Det styrer oppdatering prosessdata , dokumentasjon av data (den metadata ), den sikkerhets , den backup , og hendelsen ledelse.
I en bedrift vokser datamengden raskt over tid. Disse dataene kan komme fra leverandører, kunder, miljøet osv. Denne mengden data øker avhengig av sektor og aktivitet i selskapet. For eksempel i supermarkeder er datamengdene som samles inn hver dag enorme (spesielt når butikker samler ut kvitteringer).
Selskapet har flere alternativer for å behandle denne dataflyten:
Beslutningsprosjektet tilsvarer dette siste alternativet. Det handler om å behandle data og lagre dem konsekvent etter hvert som de kommer. Dette er grunnen til at beslutningsprosjektet er et prosjekt uten tidsbegrensning. Det vil si at så snart selskapet starter dette prosjektet, stopper det ikke (unntatt i unntakstilfeller). Wal-Mart (en supermarked kjeden ) er et av de selskapene som lagrer mest data (det har multiplisert sine data ved 100 i noen år), og vil nå i årene som kommer The petabyte (1000 terabyte ).
For å gjennomføre disse beslutningsprosjektene er det en rekke verktøy, hver mer eller mindre tilpasset størrelsen på selskapet, strukturen til eksisterende data og ønsket type analyse.
Tre områder bør være spesielt dokumentert:
Dette fører til valg av presise teknologier og en bestemt modell.