Forretningsintelligens

Den BI (engelsk business intelligence ( BI ) og beslutningssystem støtte ( DSS )) er datamaskinen for bruk av beslutningstakere og næringslivsledere. Den angir virkemidlene, verktøyene og metodene som gjør det mulig å samle inn, konsolidere, modellere og gjenopprette dataene , materielle eller immaterielle , til et selskap for å tilby beslutningsstøtte og la beslutningstakere få oversikt over aktiviteten Bearbeidet.

Denne typen applikasjoner er basert på en felles arkitektur hvis teoretiske grunnlag hovedsakelig kommer fra Ralph Kimball , Bill Inmon og DanLinstedt.

De dataoperasjoner periodisk hentet fra heterogene kilder: flate filer , filer Excel , database ( DB2 , Oracle , SQL Server , etc.), web-tjeneste , massive data og lagret i et datavarehus .
Dataene er omstrukturert, beriket, samlet, omformatert, kategorisert for å bli presentert for brukeren i en semantisk form (forretningsvisninger med mening) som gjør det mulig for beslutningstakere å samhandle med dataene uten å måtte kjenne deres fysiske lagringsstruktur, av stjerneskjemaer. som kan spre fakta og tiltak som hierarkiske dimensjoner, rapporterer forhåndsforberedt konfigurerbart til dashbord mer syntetiske og interaktive.
Disse dataene blir levert til de forskjellige funksjonelle områdene (strategisk retning, økonomi, produksjon, regnskap, menneskelige ressurser, etc.) gjennom et sikkerhetssystem eller spesialisert datamart for konsultasjon, analyse, forhåndsdefinerte varsler, ' data mining , etc.

Forretningsintelligens er en del av den bredere arkitekturen til et informasjonssystem , men er ikke et begrep som konkurrerer med styringen av informasjonssystemet . På samme måte som ledelse er et spørsmål om sosiologi og økonomi , er ledelse gjennom IT konstituerende for to radikalt forskjellige felt, nemlig ledelse og IT . For å berike konseptet med disse to måtene å tenke på, er det mulig å vurdere en IT-engineering-orientert side som kalles business intelligence , og en annen side som betjener mer spesielt administrasjonsmetoder som kalles system management .

Definisjon

Det engelske ordet business intelligence (BI) kan føre til forvirring med begrepet økonomisk intelligens (IE). Forretningsintelligens betyr ikke " økonomisk intelligens ", i motsetning til hva en bokstavelig oversettelse vil tilsi (Jf. Denne diskusjonen) .

BI skiller seg fra EI på tre måter:

BI jobber med informasjon internt for selskapet, mens EI bruker informasjon ekstern for selskapet;
BI bruker strukturert informasjon , administrert i datalager, mens EI er basert på ustrukturert informasjon ;
fremfor alt gir BI en visjon om fortiden mens EI ser på fremtiden.

Innsatser av forretningsinformasjon

Foreløpig lagres data for forretningssøknader i en (eller flere) relasjonell eller ikke-relasjonsdatabase (r) .
Disse dataene blir ekstrahert, transformert og lastet inn i et datalager, vanligvis av et ETL - verktøy ( Extract-Transform-Load ).

Et datalager kan ha form av et datalager eller et datamarked . Som en generell regel, aggregerer datavarehuset alle de program data i selskapet, mens data marts (vanligvis mates fra data fra datavarehus ) er undergrupper av opplysninger om en bestemt virksomhet i selskapet (markedsføring, risiko, styring kontroll, etc.), spesifikke bruksområder (analyse, rapportering osv.), eller til og med oppfylle spesifikke krav eller begrensninger (partisjonering av data, volum osv.). Begrepet datateller eller data lager blir også anvendt for å betegne en Datamart.

Datalager lar deg produsere rapporter som svarer på spørsmålet "Hva skjedde?" Men de kan også utformes for å svare på det analytiske spørsmålet "Hvorfor skjedde dette?" "Og til det prognostiske spørsmålet" Hva vil skje? ". I operativ sammenheng svarer de også på spørsmålet "Hva skjer akkurat nå?" ", Eller til og med i tilfelle en aktiv datalagerløsning" Hva skal skje? ".

Den rapporteringen er trolig den mest brukte i dag og BI-programmet, kan det ledere:

å velge data relatert til en gitt periode, slik produksjon, slik kundesektor osv.
å sortere, gruppere eller distribuere disse dataene i henhold til kriteriene de ønsker
utføre forskjellige beregninger (totaler, gjennomsnitt, forskjeller, sammenligning fra en periode til en annen, etc.)
presentere resultatene på en syntetisk eller detaljert måte, ofte grafisk i henhold til deres behov eller forventningene til selskapets ledere

Programmene som brukes for rapportering gjør det selvfølgelig mulig å reprodusere de samme valgene og de samme behandlingene fra periode til periode, og å variere visse kriterier for å foredle analysen. Men rapportering er ikke strengt tatt en søknad om beslutningstøtte. Fremtiden tilhører heller instrumenter som er utstyrt med flerdimensjonale analysefunksjoner av Olap-typen. OLAP- funksjon som kan oppnås på forskjellige måter, for eksempel via en R-OLAP relasjonsdatabase, eller flerdimensjonal M-OLAP-database, eller til og med i H-OLAP.

Datamarts og / eller datalager kan således via OLAP tillate en veldig grundig analyse av selskapets aktivitet, takket være statistikk som kombinerer informasjon om aktiviteter som tilsynelatende er veldig forskjellige eller veldig fjernt fra hverandre, men studien som ofte avslører dysfunksjoner , sammenhenger eller muligheter for veldig betydelige forbedringer.

Den interoperabilitet mellom systemer datalager , datamaskin-applikasjoner eller innholdsadministrasjon , og rapporteringssystemer er oppnådd gjennom en styring metadata .

Fra maling til hyperkube

Business intelligence fokuserer på å måle:

en rekke indikatorer eller tiltak (også kalt fakta )
gjenopprettet i henhold til aksene for analyse, som vanligvis er kalt dimensjoner .

Borde

For eksempel kan det være lurt å måle:

Tre fakta : omsetning, antall salg, mengde avgifter for produktsalg
i henhold til en første dimensjon , kalenderen: etter år, etter kvartal, etter måned, etter dag;
og i henhold til en andre dimensjon , produkthierarkiet: produktfamilie, produktserie, produktreferanse.

Vi får dermed en tabell med to oppføringer:

for eksempel i linjer: produktnomenklaturen på 3 nivåer (familie, rekkevidde, referanse)
og i kolonner: årene, fordelt på kvartaler, fordelt på måneder
med i skjæringspunktet mellom radene og kolonnene, for hver celle: omsetningen, mengden avgifter og antall salg

Som illustrasjon gjør kryss tabellene til de viktigste regnearkene det mulig å bygge denne typen dashbord fra en database .

Terning

Hvis vi er interessert i en tredje analysedimensjon, for eksempel det geografiske hierarkiet for salgssteder (etter land, region, butikk), beveger vi oss dermed til en kube . Den pivot tabeller av Excel kan representere denne type kube med "side", som representerer den samlede data for hvert hierarkisk nivå og for hver dimensjon.

Hypercube

Hvis vi er interessert i en ekstra analyseakse, for eksempel kundesegmentering (etter kategori, yrke, kunde), får vi en kube med mer enn 3 dimensjoner, kalt hypercube . Begrepet kube brukes ofte i stedet for hyperkube .

Navigering i en hyperkube

Verktøyene i beslutningsverdenen gir muligheter for "navigering" i de forskjellige dimensjonene til kuben eller hyperkuben:

det boret ned eller bore før: det er mulighet for å "zoome" på en dimensjon (for eksempel for å bryte gjennom årene til 4 kvartaler til å ha en mer detaljert syn, eller å passere fra land til de forskjellige regionene)
den drill opp eller drill tilbake (også kalt "roll-up"): Det er det motsatte som gjør det mulig å "samlede" komponentene i en av aksene (f.eks gruppering måned kvartal, eller til sammen antall forskjellige områder for å få den totale etter land)
de dele opp , også kalt "terninger down" (som kan oversettes med "for å hogge meny", det vil si skåret i strimler og deretter terninger): det er en mer kompleks operasjon som innebærer en permutasjon akser analyse (f.eks , vil du kanskje erstatte en visning etter land / region med en ny visning etter familier og produktserier)
den drill gjennom : når bare fra data som er samlet (aggregerte indikatorer), det boret gjennom gir tilgang til de grunnleggende detaljene i informasjons (hver salg av hvert produkt til hver kunde i hver butikk)

Forholdsregler å ta

Hver av disse delvise visningene av kuben resulterer til slutt i enten en dobbeltoppføringstabell (kryssortering) eller en generelt todimensjonal graf .

Så selv om navigasjonen i kuben er flerdimensjonal, har ikke beslutningstakeren i realiteten tilgang til en syntese, men til et mangfold av kryssorter eller todimensjonale synspunkter hvis utforskning, lang og kjedelig, noen ganger er kort. - krets for mangel på tid. Dette kan føre til kostbare beslutningsfeil.

Det kan derfor være nyttig å kombinere denne tilnærmingen med en ikonografi av sammenhenger , som gir en virkelig flerdimensjonal oversikt , uten redundanser.

Viktige funksjoner i forretningsinformasjon

Et beslutningsinformasjonssystem (CIS) må kunne gi fire grunnleggende funksjoner: innsamling, integrering, distribusjon og presentasjon av data . Til disse fire funksjonene er det lagt til en administrasjonsfunksjon , det vil si kontrollen av selve SID.

Samle funksjon

Samlingen funksjon (noen ganger kalt datapumping ) dekker alle de oppgavene som består i å detektere, velge, ekstraksjon og filtrering av rå data fra de aktuelle miljøene gitt omfang omfattes av SID. Som det er vanlig for interne og / eller eksterne datakilder for å være heterogene - både teknisk og semantisk - denne funksjon er det mest vanskelige å sette opp i en kompleks beslutningssystem. Den er spesielt avhengig av ETL- verktøy ( ekstrakt-transform-last for ekstraksjon-transformasjon-lasting).

Den kilden data som mater SID kommer fra transaksjonsproduksjonssystemer, oftest i form av:

elementer som kommer fra strømopptaket: hendelsesrapport eller operasjonsrapport. Det er observasjonen over tid av drift (kjøp, salg, regnskapsposter ...), filmen om den daglige aktiviteten, uansett vanlig, av selskapet
elementer som gjenspeiler en situasjon på et gitt tidspunkt: lagerrapport eller lagerrapport. Det er bildebilde tatt i et gitt øyeblikk (på slutten av en periode for eksempel: måned, kvartal ...) av data som kjennetegner en aksje. For eksempel: kundebeholdningen, kontrakter, ordrer, utestående osv.

Samlingsfunksjonen spiller også en omkodingsrolle, om nødvendig. En data representert forskjellig fra en kilde til en annen krever selektering av en enkelt representasjon og derfor en nyttig egen for fremtidig analyse.

Integrasjonsfunksjon

Integrasjonsfunksjonen består i å konsentrere de innsamlede dataene i et samlet rom, og det viktigste IT-fundamentet er datalageret . Sentralt i systemet, det lar applikasjonsinformasjonssøknader skjule mangfoldet av opprinnelsen til data og dra nytte av en felles, homogen, standardisert og pålitelig kilde til informasjon, innenfor et enkelt og om mulig standardisert system.

I forbifarten blir dataene renset eller transformert av:

filtrering og validering av data med sikte på å opprettholde generell konsistens: verdiene som aksepteres av filtrene i samlingsfunksjonen, men som kan føre til inkonsekvenser i referansen sammenlignet med andre data, må enten avvises eller integreres med spesiell status
synkronisering: hvis det er behov for å integrere, på samme tid eller på samme "verdidato", hendelser mottatt eller observert forskjøvet eller ut av fase
sertifisering: å forene lageret data med andre “lovlige” systemer i selskapet som regnskap eller forskriftsmessige erklæringer)

Det er også i denne funksjonen at beregningene og akkumuleringene (akkumuleringene) som er felles for hele prosjektet, blir utført.

Integreringsfunksjonen leveres vanligvis av administrasjonen av metadata , som sikrer interoperabilitet mellom alle dataressurser , enten det er strukturerte data ( databaser som er tilgjengelige med programvarepakker eller applikasjoner), eller ikke- data. Strukturert (dokumenter og andre ustrukturerte ressurser, manipulert av innholdsstyringssystemer ).

Kringkastingsfunksjon (eller distribusjon)

Formidlingsfunksjonen gjør dataene tilgjengelige for brukere , i henhold til mønstre som tilsvarer profilene eller yrkene til hver, og vet at direkte tilgang til datalageret generelt ikke samsvarer med de spesifikke behovene til en beslutningstaker eller leder. 'En analytiker. Det prioriterte målet er derfor å segmentere dataene i svært sammenhengende informasjonskontekster, enkle å bruke og tilsvarer en bestemt beslutningstaking. Mens et datalager kan være vert for hundrevis eller tusenvis av variabler eller indikatorer, har en rimelig utgivelseskontekst bare noen få dusin på det meste. Hver kontekst kan tilsvare et datamart , selv om det ikke er noen generelle regler for fysisk lagring. Svært ofte er en diffusjonskontekst flerdimensjonal , det vil si kan modelleres i form av en hyperkube ; den kan deretter gjøres tilgjengelig ved hjelp av et OLAP- verktøy .

De forskjellige sammenhengene i det samme beslutningssystemet trenger ikke alle det samme detaljnivået. Mange aggregater eller akkumuleringer er bare av interesse for bestemte applikasjoner og trenger derfor ikke å administreres som vanlige aggregater av integrasjonsfunksjonen: Administrasjonen av denne typen spesifisitet kan håndteres av kringkastingsfunksjonen. Disse aggregatene kan valgfritt lagres vedvarende eller dynamisk beregnet på forespørsel.

På dette stadiet, og når det gjelder utforming av et rapporteringssystem, må tre nivåer av spørsmål stilles:

Hvem er spesialistrapporten for? : valg av indikatorer å presentere, valg av layout
Ved hvilken rute? : "arbeidsflyt" kringkastingskrets for mennesker eller "telekom" overføringskretser for midler
I henhold til hvilken agenda? : rutinemessig kringkasting eller utløst på en forhåndsdefinert hendelse

Presentasjonsfunksjon

Denne fjerde funksjonen, den mest synlige for brukeren, styrer vilkårene for brukertilgang til informasjon, innenfor rammen av et bestemt menneske-maskin-grensesnitt ( MMI ). Det gir tilgangskontroll og drift av arbeidsstasjonen , håndtering av forespørsler, visning av resultater i en eller annen form. Den bruker alle mulige kommunikasjonsteknikker: office verktøy , queryers og spesialiserte rapport generatorer, web infrastruktur , mobil telekommunikasjon, etc.

Administrasjonsfunksjon

Det er den tverrgående funksjonen som overvåker riktig utførelse av alle de andre. Det styrer oppdatering prosessdata , dokumentasjon av data (den metadata ), den sikkerhets , den backup , og hendelsen ledelse.

Beslutningsprosjekt

I en bedrift vokser datamengden raskt over tid. Disse dataene kan komme fra leverandører, kunder, miljøet osv. Denne mengden data øker avhengig av sektor og aktivitet i selskapet. For eksempel i supermarkeder er datamengdene som samles inn hver dag enorme (spesielt når butikker samler ut kvitteringer).

Selskapet har flere alternativer for å behandle denne dataflyten:

gamle data slettes, og selskapet beholder bare aktive data eller nyere historie
dataene lagres i en database og selskapet ser ikke for seg øyeblikkelig bruk
data lagres når de ankommer på en konsekvent måte slik at de kan utnyttes direkte

Beslutningsprosjektet tilsvarer dette siste alternativet. Det handler om å behandle data og lagre dem konsekvent etter hvert som de kommer. Dette er grunnen til at beslutningsprosjektet er et prosjekt uten tidsbegrensning. Det vil si at så snart selskapet starter dette prosjektet, stopper det ikke (unntatt i unntakstilfeller). Wal-Mart (en supermarked kjeden ) er et av de selskapene som lagrer mest data (det har multiplisert sine data ved 100 i noen år), og vil nå i årene som kommer The petabyte (1000 terabyte ).

For å gjennomføre disse beslutningsprosjektene er det en rekke verktøy, hver mer eller mindre tilpasset størrelsen på selskapet, strukturen til eksisterende data og ønsket type analyse.

Påminnelse om beslutningens verdikjede

Den databasesystemet relasjonelle og andre systemer som inneholder operasjonelle data.
En ETL trekker ut relevante data og laster det inn i ODS til datalager
De data som er strukturert i datalager
Data marts bruker X-OLAP teknologi oppdateres fra datalager
Rapporter genereres på disse dataene

Kravsinnsamlingsfase

Tre områder bør være spesielt dokumentert:

hvilken type informasjon rapporten brukeren trenger
reproduksjonstypen (ergonomi, frekvens, reproduksjonshastighet)
det eksisterende tekniske systemet: teknologier som brukes

Fase for design og teknisk valg

Basert på de innsamlede kravene, hvilke elementer i beslutningens verdikjede må implementeres?
Bør vi bare lage en rapport om en eksisterende OLAP-kube?
Bygg hele kjeden?
Hva er dataene som må håndteres nøyaktig?

Dette fører til valg av presise teknologier og en bestemt modell.

Åpen kildekode skuespillere

Vanilje
Spagobi

Eieraktører

AskR.ai (fransk chatbot)
Tilgang med Access Insight
Anaplan , økonomisk planlegging
Anvendt Olap Dodeca
BiX-programvare - løsning på OLAP-kuber (MS, ORACLE, IBM, SAP, SAS ...) for rapportering og dataanalyse.
Informasjonsbyggere (no)
BearingPoint ( HyperCube )
BiBOARD - Transaksjonsrapportering som har vært i mottak siden 06/11/2017
Bittle - Online rapportering og dashboards
BIME
BI Square Software (Business Intelligence for IT)
BORDE
BrightAnalytics
Business Objects ( SAP ) og dets nye navn SAP BI4
IMS Health med Reportive-programvare
Coheris Liberty
Comarch Business Intelligence
CORICO, programvare for korrelasjonsikonografi
DATAROCKS med PROMPTO
DigDash (DigDash Enterprise-programvare, full nett- og mobil dashbordprogramvare)
Dimensjonal innsikt
Domo
Hurence - Hadoop native ETL- og BI-løsninger basert på Hadoop , HBase og Pig
IcCube (no)
IBM :
- Cognos
- TM1
- SPSS
Jedox (en)
Informatica
Inside Reporting
Microsoft
- PowerBI
- Excel , PowerPivot og Power View (sistnevnte avvikles)
- SQL Server Reporting Services
- SQL Server Analysis Services
MicroStrategy
MyReport
MyDataViz
OpenText - ETL OTIC med sitt tidligere navn Génio
Oracle Corporation med:
- Oracle Business Intelligence Enterprise Edition (OBIEE)
- Hyperion (ex Brio)
Serenytics
Tableau-programvare med verktøy som Tableau Desktop
Talend
Tagetik
Teradata
SAS og dets datavisualiseringsverktøy SAS Visual Analytics
Qlik med QlikView og Qlik Sense-programvare
R2C SYSTEM - MyDataBall (programvare for bedriftsoptimalisering)
SYMTRAX med StarQuery-programvare
Weenove
Verdensprogrammering (no)

Merknader og referanser

“ Hva er Business Intelligence (BI)? "
Metodikk for et datavarehusprosjekt [1]
hvordan du spør etter en AzureSQL-database [2]
beskrivelse av Dodeca spreedsheat Management System [3]
Legal Recovery BI BOARD http://www.procedurecollective.fr/fr/redressement-judiciaire/1322625/biboard.aspx
beskrivelse av BIME [4]
beskrivelse av styret [5]
beskrivelse av BrightAnalytics [6]
BusinessObjects-pakken [7]
[8]
[9]
OBIEE beskrivelse [10]
Hyperion-beskrivelse " https://www.solution-bi.com/solution-bi/solutions-epm/expert-bi-oracle-hyperion-ing/ " ( Arkiv • Wikiwix • Archive.is • Google • Hva skal jeg gjøre? )
beskrivelse av qlikView [11]

Se også

Relaterte artikler

Hjelp med avgjørelsen
Forretningsanalyse
Beslutningsanalyse av komplekse systemer
Database : IBM , Oracle , Teradata
Datalager
"Star" datamodell
Datautvinning
Datalagring
Nettverksadministrasjon (IT)
Administrasjon av informasjonssystem
Metadata
Analysebehandling på nettet
Open source business intelligence
Operasjonell forskning
Beslutningstabell
Ny forretningsinformasjon

Bibliografi

Alphonse Carlier, Business Intelligence and Management , Afnor Éditions, 2013, ( ISBN 978-2-12-465429-1 )
(en) Lawrence Corr og Jim Stagnitto, Agile Data Warehouse Design : Collaborative Dimensional Modeling, fra Whiteboard til Star Schema , DecisionOne Press,november 2011, 328 s. ( ISBN 978-0-9568172-0-4 ).
Jean-Marie Gouarné, The Decisional Project - Issues, Models, Data Warehouse Architectures , Eyrolles, 1997, ( ISBN 978-2-212-05012-7 )
Alain Garnier, ustrukturert informasjon i næringslivet - bruk og verktøy , Hermes - Lavoisier, 2007, ( ISBN 978-2-7462-1605-1 )
R. Kimball, L. Reeves, M. Ross, W. Thornthwaite, The Data Warehouse: Guide to Project Management, Eyrolles, 2005, ( ISBN 978-2-212-11600-7 )
Alain Fernandez, nye ledere Dashbord, Business Intelligence Prosjekt totalentreprise , Eyrolles, 6 th edition, 2013. ( ISBN 978-2-212-55647-6 ) redaktør presentasjon
Roland og Patrick Mosimann, Meg Dussault, Performance Manager Making performance everyday for everyone , Cognos Press, 2007, ( ISBN 978-0-9730124-4-6 )
James Taylor, Decision Management System , IBM Press, Pearson Education