I sannsynlighetsteori og statistikk beskriver en lov om sannsynlighet den tilfeldige oppførselen til et fenomen som er avhengig av tilfeldigheter . Studiet av tilfeldige fenomener begynte med studiet av sjansespill . Terningspill, stemmeseddling og myntkasting var motivasjon for å forstå og forutsi tilfeldige opplevelser. Disse første tilnærmingene er diskrete fenomener, det vil si hvis antall mulige resultater er endelige eller i det høyeste tellbare . Imidlertid har visse spørsmål avslørt lover med utallig uendelig støtte; for eksempel når antall kast eller haler som er laget, har en tendens til uendelig, nærmer fordelingen av frekvenser som halene vises med en normal lov .
Svingninger eller variasjoner er tilstede i nesten hvilken som helst verdi som kan måles når man observerer et fenomen, uavhengig av natur; dessuten har nesten alle målinger noen egenfeil . Sannsynlovene gjør det mulig å modellere disse usikkerhetene og beskrive fysiske , biologiske , økonomiske fenomener , etc. Feltet av statistikk gjør det mulig å finne lover sannsynlig tilpasset tilfeldige fenomener.
Det er mange forskjellige sannsynlighetslover. Blant alle disse lovene har normalloven en spesiell betydning, siden den i henhold til den sentrale grensesetningen nærmer seg den asymptotiske oppførselen til mange sannsynlighetslover.
Konseptet med sannsynlighetsloven er matematisk formalisert ved bruk av teorien om måling : en lov om sannsynlighet er et mål , ofte sett på som loven som beskriver oppførselen til en tilfeldig , diskret eller kontinuerlig variabel . Et mål er en sannsynlighetslov hvis den totale massen er lik 1. Studien av en tilfeldig variabel i henhold til en lov om diskret sannsynlighet avslører beregninger av summer og serier , mens hvis loven er absolutt kontinuerlig, studerer den tilfeldige variabelen avslører beregninger av integraler . Spesielle funksjoner gjør det mulig å karakterisere lovene for sannsynlighet, for eksempel fordelingsfunksjonen og den karakteristiske funksjonen .
En lov om sannsynlighet beskriver teoretisk tilfeldigheten til et eksperiment som regnes som tilfeldig. Begrepet “ tilfeldig erfaring ” blir gitt ut for å betegne en reell prosess av eksperimentell karakter, hvor tilfeldigheten griper inn, med tydelig identifiserte mulige resultater. For eksempel, under terningkast (dette er den tilfeldige hendelsen), er resultatet et tall fra 1 til 6, og det er generelt akseptert at hvert resultat har samme sjanse til å vises; sannsynlighetsloven er derfor: hver av de 6 sifrene er sannsynlig med sannsynlighet 1/6.
Historisk ble sannsynlighetsfordelinger studert i sjansespill : terningspill , kortspill osv. De mulige resultatene av disse fenomenene er endelige, sannsynlighetsloven sies å være diskret. Å gi sannsynloven tilsvarer å gi listen over mulige verdier med tilhørende sannsynlighet. Den blir deretter gitt i form av en formel, en verditabell, et sannsynlighetstre eller funksjoner (som vil bli detaljert i de følgende avsnittene).
I en mer generell sammenheng, det vil si i tilfelle hvor antallet mulige verdier av det tilfeldige fenomenet ikke er endelig, men uendelig ( tellbar eller ikke), beskriver sannsynlighetsloven alltid fordelingen av sjansene for mulige resultater men er preget av funksjoner ( sannsynlighetstetthet og distribusjonsfunksjon , blant andre) eller mer generelt av tiltak .
Bruk av sjanser har eksistert siden antikken, spesielt i sjansespill , ved å satse på risikoen ved sjøtransport eller livrenter . Men en første kjente referanser til sannsynlighetsberegninger er en enkel beregning av Divine Comedy , som bare vises i XV th århundre under Renaissance . De første avhandlingene danner begynnelsen på sannsynlighetsteorien , hovedsakelig basert på kombinatoriske sannsynligheter. Problemene oppstår som følger med hensyn til varigheten til en kortstokk:
"På varigheten av spillene vi spiller ved å brette ... Vi spør hvor mye det er å satse på at spillet som kan vare på ubestemt tid vil være ferdig i et bestemt bestemt antall trekk på det meste. "
- Essay , de Montmort , 1713
Vi anerkjenner her sannsynligheten ( "å satse" ) for at en variabel ( "spillets varighet" ) er mindre enn en verdi ( "bestemt bestemt tall" ), dette er fordelingsfunksjonen for loven om sannsynlighet for varigheten av et spill.
Det er i avhandlingen til Nicolas Bernoulli , publisert i 1711, at uniformsloven dukker opp for første gang . Enkelte andre lover ser ut som binomialoven eller normalloven , selv om deres tilnærminger ikke er helt strenge. For eksempel er den normale loven konstruert av Abraham de Moivre takket være den Gaussiske kurven ved en numerisk tilnærming . I XVIII th århundre, er andre ideer relatert til lover sannsynlighet også fremstår som den forventning av en tilfeldig variabel diskret med Jean le Rond d'Alembert eller betingede sannsynligheter med Thomas Bayes . Noen lover med kontinuerlig sannsynlighet er angitt i en memoar av Joseph-Louis Lagrange i 1770.
Den strenge bruk av sannsynlighets lover utvikler seg fra XIX th århundre i Applied Sciences, som for eksempel biometri med Karl Pearson eller statistisk fysikk med Ludwig Boltzmann .
Den formelle definisjonen av sannsynlighetstiltak begynte i 1896 med en publisering av Émile Borel og fortsatte med flere andre matematikere som Henri-Léon Lebesgue , René Maurice Fréchet , Paul Lévy og spesielt Andreï Kolmogorov som formulerte sannsynlighetens aksiomer i 1933.
I sannsynlighetsteori er en sannsynlighetslov et mål hvis totale masse er 1. Spesielt tilfredsstiller dette tiltaket de tre aksiomene av sannsynligheter .
Definisjon - For et målbart rom , er det en sannsynlighetslov , et sannsynlighetsmål eller mer sannsynlig sannsynlighet hvis:
Trillingen kalles sannsynlighetsrommet . En sannsynlighetslov kalles også en sannsynlighetsfordeling for en mer anvendt studie.
En vanlig måte å uttrykke en lov er bruk av en stokastisk variabel siden, for enhver sannsynlighet rett på , eksisterer det en tilfeldig variabel som er definert på en Sannsynlighetsrom (potensielt forskjellig fra ) og lov . Lovene som ofte studeres i sannsynlighetsteori er de virkelig verdsatte lovene; de kan vises med en reell tilfeldig variabel ved følgende definisjon.
Definisjon - La være en reell tilfeldig variabel på sannsynlighetsrommet , dvs. en målbar funksjon .
Den sannsynlighet lov av tilfeldige variable er sannsynligheten måle, betegnet , definert på plass målbar ved:
for enhver ekte Borelian . Med andre ord er bildemålet til by .
For å definere loven til en tilfeldig variabel, transporterer vi sannsynlighetsloven videre til et mål videre .
Representasjonen av en lov med en tilfeldig variabel er ikke unik. Med andre ord, to forskjellige tilfeldige variabler, eller til og med definert i forskjellige mellomrom, kan ha samme lov. To virkelige tilfeldige variabler og har samme lov hvis (når det gjelder måling). Det vil si: for alt . Følgende setning gjør det mulig å bruke en annen karakterisering:
Overføring (eller transport) teorem - La være en virkelig tilfeldig variabel . Deretter :
for enhver funksjon slik at minst en av de to integralene har en betydning.
Integralet som vises i siste periode er integralet, i betydningen målingsteori , av funksjonen i forhold til målingen . Denne integralen har form av en sum når det gjelder diskrete lover .
Dermed har to virkelige tilfeldige variabler og har samme lov hvis: for en hvilken som helst funksjon slik at minst ett av de to begrepene av likheten har en betydning.
Dette resultatet kalles " lov av den ubevisste statistikeren (en) " på engelsk.
Intuitivt sies en sannsynlighetslov å være flerdimensjonal, eller n-dimensjonal , når loven beskriver flere (tilfeldige) verdier av et tilfeldig fenomen. For eksempel når du kaster to terninger, er sannsynlighetsloven for de to oppnådde resultatene en todimensjonal lov. Det flerdimensjonale tegnet vises således under overføringen, ved en tilfeldig variabel, fra det sannsynlige rommet til et numerisk rom med dimensjonen n . I eksemplet med de to terningene er dimensjonen n = 2 og mellomrommet er . Loven kalles også felles lov .
Et viktig eksempel på en flerdimensjonal lov er produktsannsynlighetsloven hvor og er to endimensjonale lover. Denne sannsynlighetsloven er loven til et par tilfeldige variabler uavhengig , det er tilfellet med eksemplet med de to terningene.
Definisjon - La være en tilfeldig variabel på det sannsynlige rommet , med verdier i muni av den virkelige Borelian-stammen produsert . Loven til den tilfeldige variabelen er det sannsynlighetsmål som er definert av for alle :
Den tilfeldige variabelen blir deretter identifisert i en tilfeldig vektor til n dimensjoner . Cramer-Wold-teoremet sørger for at ( n- dimensjonal) loven til denne tilfeldige vektoren er helt bestemt av (ensidige) lover for alle lineære kombinasjoner av disse komponentene: for alle .
Tilfelle med en absolutt kontinuerlig lovEn todimensjonal (eller n- dimensjonal) lov sies å være absolutt kontinuerlig hvis loven er absolutt kontinuerlig med hensyn til Lebesgue-tiltaket på , dvs. hvis loven til den tilsvarende tilfeldige variabelen er skrevet i formen:
for alt MarginalloverIntuitivt er marginalloven til en tilfeldig vektor sannsynlighetsloven til en av komponentene. For å oppnå det projiserer man loven om det ensidige rommet til den søkte koordinaten. Sannsynlighetsloven for den i. Koordinaten til en tilfeldig vektor kalles den i. Marginale loven . Margiloven er oppnådd med formelen:
for alt .Randlovene til en absolutt kontinuerlig lov uttrykkes ved hjelp av deres marginale tetthet .
Intuitivt gjør en betinget sannsynlighetslov det mulig å beskrive den tilfeldige oppførselen til et fenomen når vi vet informasjon om denne prosessen. Med andre ord gjør den betingede sannsynligheten det mulig å evaluere graden av stokastisk avhengighet mellom to hendelser. For eksempel, under terningkast, gjør den betingede loven det mulig å gi loven av summen av resultatene, vel vitende om at en av de to terningene ga et resultat på minst fire.
Definisjon på hendelserDen betinget sannsynlighet er definert, desto mer intuitivt på hendelser ved sannsynligheten for at en hendelse En betinget av en annen hendelse B . For alle A og B i den underliggende stammen som :
Sannsynloven brukes i elementær sannsynlighet og statistikk , for den totale sannsynlighetsformelen eller Bayes 'teorem for eksempel.
Definisjon for tilfeldige variablerBetinget sannsynlighet er også definert for tilfeldige variabler . Vi deretter studere jus av en variabel X betinget til en variabel Y . Når er loven om X som vet Y = y definert av:
Denne definisjonen er imidlertid ikke gyldig hvis loven i Y er helt kontinuerlig siden for alle y . Følgende definisjon er gyldig for alle par tilfeldige variabler.
Definisjon - La være et par virkelige tilfeldige variabler . Det eksisterer en lov om sannsynlighet , kalt betinget lov om å vite , eller vite , definert av, for enhver avgrenset boreliansk funksjon :
, nesten sikkert .Loven er også notert eller . Den forrige likheten er en likhet mellom tilfeldige variabler.
Definisjon for stammerMer generelt er sannsynlighetsloven definert fra den betingede forventningen om at en tilfeldig variabel X kjenner en stamme . Denne betingede forventningen er den eneste tilfeldige variabelen - målbar , bemerket og verifiserende: for enhver Z , variabel- målbar. Den betingede loven blir deretter definert av:
hvor er indikatorfunksjonen til . Definisjon for absolutt kontinuerlige loverNår det gjelder absolutt kontinuerlige lover , er det en betinget tetthet av den ene loven i forhold til den andre, og omvendt. Hvis er tettheten til den todimensjonale loven, blir de to betingede tettheter gitt av:
og .Her, og er de to marginale lovene til henholdsvis X og Y. Ved å erstatte integralene med summer, oppnår vi lignende formler i tilfelle der marginallovene er diskrete, eller når marginalloven til X er diskret og den til Y er absolutt kontinuerlig, eller omvendt.
Siden er et Banach-rom , generaliserer verdilovene i et Banach-rom de virkelige verdilovene. Definisjonen er da lik.
Definisjon - La være en tilfeldig variabel på det sannsynlige rommet og med verdier i et Banach-rom utstyrt med stammen generert av de åpne settene med . Den sannsynlighet lov av den tilfeldige variable er sannsynligheten mål definert over løpet målbar ved:
for alt .
For å oppnå gode egenskaper er det vanlig å vurdere stramme sannsynlighetstiltak , det vil si som intuitivt er konsentrert om et kompakt sett , og å anta at Banach-rommet er separerbart .
Et mulig eksempel på et Banach-rom er rommet til kontinuerlige funksjoner . En stokastisk prosess er en familie av stokastiske variable indeksert av et sett med indekser T . En mulig definisjon av sannsynlighetsloven til en slik prosess er gitt av endelige dimensjonale lover , dvs. den flerdimensjonale sannsynlighetsloven til vektorer når . Loven kan deretter utvides med Carathéodorys utvidelsessetning for hele prosessen. La oss ta eksemplet med Brownian-bevegelse som har kontinuerlige baner, dens sannsynlighetslov er Wieners mål , generelt betegnet med W :
, for alle A- undergrupper av .En sannsynlighetslov er et mål på enhetens totale masse. Settet med sannsynlighetslover er derfor et underområde av rommet for endelige tiltak . Dette rommet er ofte bemerket eller for de virkelige sannsynlighetslovene. I resten av dette avsnittet er egenskapene til dette rommet beskrevet for de virkelige sannsynlighetslovene; de er imidlertid sanne på Banach-områder.
Vi kan tilby dette rommet en topologi som kalles den svake topologien. Denne topologien definerer derfor en svak konvergens av sannsynlighetslovene: en rekke sannsynlighetslover konvergerer svakt mot en sannsynlighetslov hvis:
for en kontinuerlig avgrenset funksjon .Konvergens betegnes: . Denne konvergensen reflekteres av overføringsteoremet på tilfeldige variabler i respektive lover ; konvergensen av tilfeldige variabler kalles da konvergens i lov (eller i distribusjon eller svak ) og blir notert eller . Hvis den svake konvergensen av tilfeldige variabler ofte brukes, gjelder det faktisk bare loven deres.
Rommet for sannsynlighetslovene som er gitt med denne svake topologien, er et metrisk rom , komplett og separerbart (i tilfelle et Banach-rom som også kan skilles), noe som gjør det til et polsk rom .
Enkelte lover er gruppert etter familie med hensyn til bestemte egenskaper for dens tetthet eller deres massefunksjon, eller i henhold til antall parametere som definerer dem, kalles de parametriske familie av sannsynlighetslover .
InnstillingerDe såkalte posisjonsparametrene påvirker den sentrale tendensen i sannsynlighetsloven, det vil si verdien eller verdiene som loven tar sine største verdier rundt. Den forventning , at median , den modus , de forskjellige quantiles eller desiler er eksempler.
De således - kalt skalaparametre påvirke dispersjonen eller “flate” av sannsynlighets lov. Den varians (eller det øyeblikk av annen orden), er standardavviket og interkvartilt område er eksempler.
De så - kalt formparameterne er de andre parametere knyttet til sannsynligheten lover. Den hale eller hale av en ekte sannsynlighet loven er en del av sin form. Venstre og høyre haler er intervaller av henholdsvis type og . En sannsynlighetslov sies å være tunghalset hvis sannsynlighetsmålet på halen har en mindre tendens mot 0, for x går til uendelig, enn normalloven . Spesielt enhver absolutt kontinuerlig, sentrert, redusert lov hvis tetthet bekrefter:
er en lov med tunge høyre og venstre haler . Den asymmetri (eller bestillingstidspunktet tre) er et eksempel på en parameter, gjør det mulig å foreta den riktige hale er mer eller mindre tung. Den kurtosis (eller øyeblikket for fire) gjør det mulig å favorisere eller til ulempe verdiene nær middelverdien av de som er langt fra den. En sannsynlighetslov sies å være mesokurtisk , leptokurtisk eller platikurtisk hvis kurtosen er null, positiv eller negativ.
Familier av loverEn lov sies å være av den eksponensielle familien med en parameter hvis dens sannsynlighetstetthet eller dens massefunksjon bare avhenger av en parameter og har formen:
Denne familien inkluderer mange klassiske lover: normalfordeling , eksponensiell fordeling , gammadistribusjon , chi-kvadratfordeling , beta-distribusjon , Bernoulli , Poisson , etc.
En lov sies å være av maktsfamilien med to parametere, og hvis densiteten er av formen:
RetningslovNår en flerdimensjonal sannsynlighetslov representerer den tilfeldige retningen til et fenomen, kalles den en retningsrettslov . Det er da loven til en tilfeldig vektor d -dimensjonal enhet hvor eller, på en ekvivalent måte, det er en lov om sannsynlighet på d -dimensjonal sfære . En d- dimensjonsretningslov kan deretter representeres av en ( d-1- dimensjonal) vektor i polare koordinater . Lovene til von Mises og Bingham er eksempler på dette.
Hvis den eksisterer, defineres det nte øyeblikket av en sannsynlighetslov av:
.Denne formelen skrives enklere i tilfelle der loven er definert fra den tilfeldige variabelen .
Det første øyeblikket, eller øyeblikk av ordre 1, kalles også lovens håp ; når dette øyeblikket er null, sies det at loven er sentrert . Det andre øyeblikket av en sentrert fordeling kalles også variansen til fordelingen; når dette øyeblikket er lik ett, sies det at loven blir redusert .
Generelt sett er det ikke tilstrekkelig å samle alle øyeblikkene til en sannsynlighetslov for å karakterisere sistnevnte. Visse lover er definert av et endelig antall av deres øyeblikk: Poissons lov er fullstendig definert av dens forventning; den normale loven er fullstendig definert av de to første øyeblikkene. Noen lover har ikke øyeblikk, dette er tilfellet med Cauchys lov .
Sannsynlovene gjør det mulig å representere tilfeldige fenomener. Den Shannon entropien av en sannsynlighets lov ble innført i termodynamikk for å kvantifisere tilstanden av molekylær uorden i et system. Målet er å måle mangelen på informasjon i sannsynlighetsloven ved en funksjon. Entropi ble først definert for diskrete lover og deretter utvidet til absolutt kontinuerlige lover. For en diskret lov og en tetthetslov defineres entropien H henholdsvis av:
og .Tilstanden for maksimal entropi er den mest uordnede, mest stabile og mest sannsynlige tilstanden til et system. Disse lovene er derfor den minst forsiktige av alle lovene som er forenlige med observasjonene eller begrensningene, og derfor de eneste tillatte objektivt som a priori sannsynlighetsfordelinger . Denne egenskapen spiller en stor rolle i Bayesianske metoder .
De vanligste sannsynlighetslovene i applikasjoner er de såkalte diskrete lovene og de såkalte absolutt kontinuerlige lovene . Imidlertid er det sannsynlighetslover som verken er diskrete eller absolutt kontinuerlige.
En sannsynlighetslov er konsentrert eller føres over et sett når . En sannsynlighetslov sies å være diskret hvis det er et endelig eller tellbart sett som den er konsentrert på.
Elementet kalles atomet for en sannsynlighetslov når og . Settet med atomer i en sannsynlighetslov er endelig eller tellbar . Mer generelt er denne egenskapen gyldig for ethvert σ- endelig mål . For en reell sannsynlighetslov er atomsettet nøyaktig settet med punkter for diskontinuitet av fordelingsfunksjonen; i dette tilfellet er endeligheten av settet med atomer funnet fra det faktum at fordelingsfunksjonen er avgrenset.
Et tilstrekkelig kriterium for at en lov skal være diskret, er at den er endelig eller tellbar.
Hvis det er diskret, er det spesielt konsentrert om settet (endelig eller tellbart) av atomene . Å definere er det derfor tilstrekkelig å definere settet med par: hvor er massefunksjonen til . Vi får dermed:
hvor er Dirac-tiltaket på punktet .
I tilfelle hvor sannsynlighetsloven er definert fra en tilfeldig variabel, brukes de tidligere begrepene for den tilfeldige variabelen: En tilfeldig variabel er konsentrert på et sett , henholdsvis er diskret hvis loven er konsentrert om , henholdsvis er diskret. Likeledes Atomer av er atomer av .
For en diskret tilfeldig variabel , den blir overførings teorem uttrykkes i form av summer (eller rekke ):
, for enhver funksjon , , for alt .Generelt er fordelingsfunksjonen til en diskret lov stykkevis konstant. En diskret lov kan vises med et søylediagram .
EksemplerHer er en ikke-uttømmende liste over diskrete sannsynlighetslover med endelig eller tellbar støtte.
Dirac-tiltakDirac-tiltaket er det enkleste av de diskrete lovene i den forstand at lovens støtte bare inneholder en verdi. Hvis en tilfeldig variabel har Diracs lov , er det verdt med en sannsynlighet lik 1. Denne loven modellerer et deterministisk (ikke-tilfeldig) fenomen siden resultatet av eksperimentet er (nesten sikkert) lik den kjente verdien .
Diskret enhetlig lovDen diskrete uniformsloven modellerer et tilfeldig fenomen hvis resultater er like sannsynlige. Dette er for eksempel tilfelle med et terningkast. Hvis lovens støtte er elementet , er denne loven definert av:
Bernoullis lovBernoullis lov tilsvarer et eksperiment med to resultater (suksess - fiasko), vanligvis kodet henholdsvis av verdiene 1 og 0. Denne loven avhenger av en parameter som måler sannsynligheten for suksess og er definert av:
Binomial lovDet er loven om antall suksesser oppnådd på slutten av uavhengige Bernoulli-tester av parameter , med andre ord er det loven for summen av uavhengige tilfeldige variabler i Bernoulli-loven med samme parameter. Denne loven med begrenset støtte er definert av:
for alt .
Aritmetisk fordelingDet er en distribusjon som er fokusert på et sett av hvor- typen .
Geometrisk lovDet er loven som modellerer ventetiden for den første suksessen i en serie uavhengige Bernoulli-tester med sannsynlighet for suksess . Det er den eneste diskrete loven å ha egenskapen til hukommelsestap . Denne loven med utallig uendelig støtte er definert av:
for alt .
Poissons lovPoissons lov er loven som beskriver oppførselen til antall hendelser som skjer i en bestemt periode. Denne loven med utallig uendelig støtte avhenger av en parameter og er definert av:
for alt .
Hypergeometrisk lovDen hypergeometriske loven beskriver antall vinnende baller ekstrahert under en samtidig tegning av baller i en urne som inneholder vinnende baller og tapende baller. Denne endelige støtteloven avhenger av tre parametere , og defineres av:
for alt .
En reell sannsynlighetslov sies å være absolutt kontinuerlig eller med tetthet når den er helt kontinuerlig med hensyn til Lebesgue-tiltaket .
Hvis det er absolutt kontinuerlig, har det i kraft av Radon-Nikodym-teoremet en sannsynlighetstetthet i forhold til Lebesgue-tiltaket, det vil si at det eksisterer en unik (lik Lebesgue - nesten overalt i nærheten) positiv målbar funksjon slik at for alt :
hvor er Borelians karakteristiske funksjon . Denne sannsynlighetstettheten har ikke alltid et analytisk uttrykk (se eksemplene nedenfor).
Når en absolutt kontinuerlig sannsynlighetslov er definert fra en tilfeldig variabel , sies den tilfeldige variabelen å være absolutt kontinuerlig eller tetthet, og tettheten av loven blir også kalt tettheten av , den betegnes noen ganger .
For en absolutt kontinuerlig tilfeldig variabel , blir overføringssetningen skrevet ved hjelp av en Lebesgue-integral , for enhver integrerbar funksjon med hensyn til :
.Distribusjonsfunksjonen til en absolutt kontinuerlig lov er lokalt absolutt kontinuerlig , den er en nødvendig og tilstrekkelig eiendom . En absolutt kontinuerlig lov har ikke et atom . Imidlertid er denne egenskapen, som er i strid med absolutt kontinuerlige lover mot diskrete lover, ikke karakteristisk for absolutt kontinuerlige lover, men av kontinuerlige lover (se avsnittet Singular Laws nedenfor).
Helt sammenhengende lover kalles noen ganger enklere kontinuerlige lover. Dette er et misbruk av språk på grunn av at i de fleste applikasjoner i statistikken er de kontinuerlige lovene absolutt kontinuerlige, men dette er ikke sant i det generelle tilfellet.
Eksempler Ensartet lovDen ensartede loven i et intervall indikerer intuitivt at alle verdiene til intervallet har de samme sjansene for å vises. Mer formelt har hvert delintervall en sannsynlighet som er lik Lebesgue-målet på (multiplisert med en konstant) for å forekomme. Den ensartede loven avhenger bare av intervallet, støtten er kompakt og dens tetthet er gitt av:
for . ellers.Eksponentiell lovDen eksponentielle loven er loven som ofte brukes til å modellere et fenomenes levetid, siden den er den eneste absolutt kontinuerlige loven som har egenskapen til hukommelsestap . I denne forstand er det den kontinuerlige analogen til den geometriske loven . Denne loven med semi-uendelig støtte avhenger bare av en parameter (noen ganger kalt intensiteten), dens tetthet er gitt av, for alt :
.Normal lovNormalloven, eller Gaussisk lov, er en sentral lov i sannsynlighetsteori og statistikk. Den beskriver oppførselen til serier av tilfeldige eksperimenter når antall forsøk er veldig stort. Det er grenseloven i den sentrale grensesetningen , det er også den unike stabile loven til parameter 2. Normalloven er preget av middelverdien (som også er dens median ) og av dens standardavvik er dens støtte den virkelige retten. Tettheten er symmetrisk, og formen kalles ofte Gauss- kurven eller bjelkekurven:
.Cauchys lovCauchys lov er den stabile loven til parameter 1, som gir den gode egenskaper. Det er imidlertid et typisk eksempel på en lov som ikke innrømmer øyeblikk, spesielt verken middel eller varians. Støtten er den virkelige linjen og dens tetthet er symmetrisk og definert av:
.Loven om posisjonen til en plan Brownian-bevegelse når den når linjen er en Cauchy-lov.
Tukey-lambdas lovTukey-lambdas lov er en absolutt kontinuerlig lov, så den har en sannsynlighetstetthet, men sistnevnte har ikke noe analytisk uttrykk. Denne loven avhenger av en parameter, dens støtte er enten et avgrenset intervall sentrert på opprinnelsen, eller den virkelige linjen (avhengig av parameteren). Tuckey-lambda-loven er definert fra dens kvantile funksjon (se seksjonen Andre karakteriseringer nedenfor):
.En sannsynlighets lov sies å være kontinuerlig eller diffus når den ikke har et atom.
Spesielt er absolutt kontinuerlige lover kontinuerlige, men det omvendte er ikke sant. Den fordelingsfunksjonen for en kontinuerlig reell sannsynlighet lov er kontinuerlig, det er en nødvendig og tilstrekkelig eiendom .
En sannsynlighetslov sies å være entall når den er kontinuerlig, men ikke absolutt kontinuerlig. Det vil si at en entallov verken har atom eller tetthet.
Disse forestillingene blir også sagt for sannsynlighetslovene definert fra tilfeldige variabler: en tilfeldig variabel er kontinuerlig (eller diffus ), henholdsvis entall , når dens tilknyttede sannsynlighetslov er kontinuerlig (eller diffus), henholdsvis entall.
EksempelDet er en enestående lov. Det er definert fra Cantor sett : . Når er uavhengige og identisk distribuerte variabler for diskret uniform fordeling på , da
er en Cantors lov tilfeldig variabel. Denne sannsynlighetsloven er skrevet i form , det er den ensartede loven på Cantor-settet. Dens distribusjonsfunksjon er Cantor-trapp , den kan avledes nesten overalt og med null derivater nesten overalt.
I applikasjoner er det sjelden at kontinuerlige lover inneholder en entydig del. Cantorsettet vises imidlertid i visse kjente eksempler: settet med nuller i bruniansk bevegelse er et sett av Cantor-typen.
Det er sannsynlighetslover som verken er diskrete, ikke absolutt kontinuerlige eller entall, de kalles noen ganger blandede lover .
Fra et mer generelt synspunkt kan enhver sannsynlighetslov brytes ned i en lineær kombinasjon av en kontinuerlig lov og en diskret lov . Videre Lebesgue s dekomponering teoremet anvendt på tyder på at denne kontinuerlige lov spaltes til en lineær kombinasjon av to kontinuerlige lover, man er helt sammenhengende med hensyn til Lebesgue måle, og den andre er entall, fremmed til det mål fra Lebesgue. Nedbrytningen er derfor skrevet:
med og . Tilstedeværelsen av sørger for at .
Følgende virkelige sannsynlighetslov er et eksempel på en blandet lov oppnådd ved å blande en diskret lov, definert av dens atomer og dens massefunksjon , med en absolutt kontinuerlig tetthetslov :
hvor . Dens fordelingsfunksjon er en kontinuerlig stykkevis funksjon , men ikke stykkevis konstant , noe som er tilfelle med fordelingsfunksjonene til diskrete lover.
Intuitivt tilsvarer dette et tilfeldig fenomen hvis lov er helt kontinuerlig. Imidlertid kan måleenheten bare måle dataene over en viss terskel c . Alle målingene som ikke oppdages av enheten vil bli tildelt 0, så loven er null på en hvilken som helst del "mindre" enn c mens et hopp vises på singleton c . Målingene følger den absolutt kontinuerlige loven for verdier større enn c . I dette eksemplet er distribusjonsfunksjonen diskontinuerlig ved c .
Det er flere funksjoner med reelle eller komplekse variabler som unikt bestemmer sannsynlighetslovene. Egenskapene til noen av disse funksjonene gjør det mulig å utlede egenskaper for lover som beregning av øyeblikk eller et uttrykk for konvergens i loven.
I følge det monotone klasselemmaet , genererer settene , kalt brostein eller rektangler , den virkelige Borelian-stammen , det er da tilstrekkelig å definere en sannsynlighetslov på brosteinen. Det antas at sannsynlighetsloven er reell, det vil si .
Distribusjonsfunksjonen til en reell sannsynlighetslov , betegnet med , er funksjonen definert av, for alle :
En sannsynlighetslov er preget av fordelingsfunksjonen, dvs. to sannsynlighetslover er like hvis og bare hvis fordelingsfunksjonene deres er like.
Mer generelt øker enhver funksjon , riktig kontinuerlig og tilfredsstillende: og er fordelingsfunksjonen til en enkelt sannsynlighetslov . Sannsynloven definert fra en distribusjonsfunksjon kalles Lebesgue-Stieltjes-tiltaket .
En av fordelene med funksjonen er at den er veldefinert for enhver sannsynlighetsfordeling. Imidlertid har det ikke alltid et eksplisitt uttrykk, et eksempel er fordelingsfunksjonen til normalfordelingen . Distribusjonsfunksjonen tillater noen ganger enkle beregninger av lover (lov for maksimum eller minimum for en prøve, for eksempel) og gir et praktisk kriterium for konvergens av sannsynlighetsloven via kappestativsetningen .
Vi kaller en karakteristisk funksjon av en sannsynlighetslov , og vi betegner "symmetrien" til Fourier-transformasjonen av . For alt :
I henhold til definisjonen av Fourier-transformasjonen er den karakteristiske funksjonen dens symmetrisk eller ikke. Som navnet antyder, bestemmer den karakteristiske funksjonen loven unikt, det vil si at to sannsynlighetslover er like hvis og bare hvis deres karakteristiske funksjoner er like.
En av fordelene med den karakteristiske funksjonen er at den eksisterer for enhver sannsynlighetslov. Videre, ved å bruke Fourier transform inversjonsformelen , er sannsynlighetsloven hentet fra den karakteristiske funksjonen. Representasjonen av lovene ved den karakteristiske funksjonen gjør det også mulig å karakterisere konvergensen av sannsynlighetslovene via kappstativsetningen .
I tilfelle hvor sannsynlighetsloven er definert fra en tilfeldig variabel , i henhold til overføringssatsen, for alle :
Generatorfunksjonen til øyeblikkene til en sannsynlighetslov , bemerket , er "symmetrien" til Laplace-transformasjonen av . Når funksjonen kan integreres i forhold til målingen , for alle :
Moment-genereringsfunksjonen bestemmer unikt sannsynlighetsloven hvis denne funksjonen eksisterer i et intervall som inneholder opprinnelsen.
En av fordelene med denne momentgenererende funksjonen er at den gjør det mulig å finne øyeblikkene til sannsynlighetsloven av derivatene . For alt , den -te deriverte av funksjonen genererer øyeblikk på 0 er for øyeblikket av sannsynligheten lov:
.Representasjonen av lovene med momentfunksjonenes generatorfunksjon gjør det også mulig å karakterisere konvergensen av sannsynlovene via kappestativsetningen .
I tilfelle hvor sannsynlighetsloven er definert fra en tilfeldig variabel , i henhold til overføringssatsen, for alle :
.Videre, for lover definert fra tilfeldige variabler, lar denne funksjonen enkelt vise variablens uavhengighet .
Det er et spesielt tilfelle for diskrete lover. Den genererende funksjonen for sannsynlighetene for en diskret sannsynlighetsfordeling er definert som håp om å generere serier : gjenstand for eksistens i denne serien. Denne generatorfunksjonen bestemmer loven for sannsynlighet på en unik måte.
Kvantilfunksjonen til en reell sannsynlighetslov , betegnet , er funksjonen som gir lovkvantilene . Det er definert av, for alt :
hvor er fordelingsfunksjonen til .
Noen sannsynlighetslover er lettere å definere, via deres kvantile funksjon. Intuitivt er verdien slik at en andel av lovens mulige verdier er mindre enn den. , Og henholdsvis er en st kvartil , den median og 3 th kvartil lov.
Dersom er bikontinuerlig så er den inverse funksjon av fordelingsfunksjonen: ; dette er grunnen til at vi i det generelle tilfellet også kaller den generaliserte gjensidige kvantile funksjonen til eller kontinuerlig invers funksjon til høyre for .
Denne kvantile funksjonen bestemmer den tilknyttede fordelingen i den forstand at, hvis er en tilfeldig variabel med kontinuerlig jevn fordeling over [0, 1], så er en tilfeldig variabel med startfordeling. Denne representasjonen er spesielt nyttig for å simulere sannsynlighetslover siden det er tilstrekkelig å simulere en kontinuerlig enhetlig lov og bruke kvantilfunksjonen på den (se avsnittet nedenfor om simulering av sannsynlighetslover).
Noen lover har ikke en eksplisitt fordelingsfunksjon, men er definert fra deres kvantile funksjon, dette er tilfellet med Tukey-lambda-loven .
Den statistiske fordelingen av en variabel i en populasjon er ofte nær matematiske modeller for sannsynlighetslovene. Av teoretiske og praktiske grunner er det ofte interessant å studere den sannsynlighetsmodellen, kjent som teoretisk. Studien begynner deretter med et tilfeldig utvalg av flere aksjer eller enkeltpersoner. Hvis metoden som er brukt er perfekt, det vil si at disse observerte verdiene kommer fra et ekviprobielt utvalg , så er de tilfeldige variabler, og studiet av fenomenet tilsvarer å studere sannsynlighetsloven.
For å studere sannsynlighetslovene er det viktig å kunne simulere dem, dette skyldes spesielt bruken av informatikk i realfagene. Som antydet ovenfor er sannsynlighetslovene preget av kvantilfunksjonen via en kontinuerlig enhetlig lov tilfeldig variabel . Denne generelle metoden består av to trinn: generering av såkalte pseudo-tilfeldige verdier av ensartet lov og inversjon av fordelingsfunksjonen til loven som studeres. Dette andre trinnet er ikke lett å gjennomføre for alle lovene, andre metoder blir deretter brukt.
“Enhver som vurderer aritmetiske metoder for å produsere tilfeldige tall, begår selvfølgelig en synd. " |
For å oppnå verdier i henhold til den kontinuerlige uniformsloven , simulerer datamaskinen verdiene til den diskrete uniformsloven . Flere metoder ble brukt: bruk av datatabeller som kan inneholde mer enn en million av dem blir mindre og mindre brukt; bruken av fysiske prosesser som oppretting av elektronisk støy er ganske kostbar for datagjenoppretting; den enkleste metoden er å bruke aritmetiske algoritmer. Disse algoritmene er deterministiske (ikke-tilfeldige), og de oppnådde verdiene kalles pseudo-tilfeldige . Mange algoritmer er opprettet for å forbedre uavhengigheten mellom verdier og deres fordeling i intervallet .
Simulering av andre loverNår fordelingsfunksjonen er inverterbar, brukes karakterisering av kvantilfunksjonen. Noen eksempler på tilfeller der denne funksjonen ikke er reversibel: Box-Muller simulerer normal lov , avvisningsmetoden til von Neumann er basert på en statistisk test og gjelder for en rekke lover, andre lovspesifikke metoder eksisterer.
EksempelEt kjent eksempel på bruk av en sannsynlighetssimulering er Monte-Carlo-metoden , for eksempel for å tilnærme verdien av π . Metoden består i å simulere et stort antall verdier i henhold til en kontinuerlig enhetlig lov på og i å telle andelen av parene av dem som verifiserer . Denne andelen nærmer seg når antall poeng har en tendens til uendelig.
Det finnes flere tilnærminger av en sannsynlighetslov ved å bruke de forskjellige karakteriseringene som er beskrevet ovenfor. Dette er vanligvis teknikkene som brukes i praktiske tilfeller. Det første trinnet er innsamling av data, som gjør det mulig å konstruere empiriske objekter som den empiriske distribusjonsfunksjonen . Disse kalles noen ganger, ved misbruk av språk, sannsynlighetslover, men de er faktisk empiriske lover som kalles statistiske distribusjoner . Begrensningssetninger eller statistiske tester gjør det endelig mulig å identifisere den beste sannsynlighetsloven som modellerer det opprinnelige tilfeldige fenomenet.
”Sannsynlighetene må betraktes som analoge med måling av fysiske størrelser, det vil si at de aldri kan bli kjent nøyaktig, men bare med en viss tilnærming. "
Av fordelingsfunksjonenDen statistiske testen Kolmogorov-Smirnov , basert på kappstativsetningen , identifiserer den empiriske fordelingsfunksjonen beregnet fra dataene til en fordelingsfunksjon av en sannsynlighetslov, som en funksjon av en avvisningshastighet. Fordelen med konvergensen av distribusjonsfunksjoner er at disse funksjonene eksisterer for alle sannsynlighetslover. Denne konvergensen gjør det spesielt mulig å nærme seg en absolutt kontinuerlig lov ved en rekke diskrete lover.
Konvergens av andre karakteristiske funksjonerUlike teoremer om konvergens av tilfeldige variabler gjør det mulig å konstruere en rekke sannsynlighetslover som konvergerer mot en gitt lov, eller omvendt å konstruere en lov som en grense for sannsynlighetslover. Den sentrale grensesetningen gjelder normal lov for grenseloven. The Paul Lévy kontinuitet teorem om konvergens av karakteristiske funksjoner.
Kvantil regresjonDen quantile regresjon kan nærme kvantil av loven ved den empiriske quantile, det vil si avledet fra data. En statistisk test kan brukes til å sammenligne de empiriske (observerte) kvantilene med kvantilene i loven som skal modellere fenomenet.
Denne tilnærmingen er spesielt nyttig for å studere visse lover som ikke er kjent eksplisitt av dens tetthet eller fordelingsfunksjon, men av deres kvantiler, for eksempel Tukey-lambda-loven .
Statistiske testerDet finnes flere statistiske tester for å sammenligne to lover. Mer presist gjør tilstrekkelighetstestene det mulig å sammenligne en empirisk lov (det vil si beregnet ut fra data hentet fra prøver) med en såkalt a priori sannsynlighetslov som skal modellere det studerte fenomenet. De to hovedtestene er: Kolmogorov-Smirnov-testen som er nevnt ovenfor, som sammenligner fordelingsfunksjonene og ²²-test av godhet, som sammenligner de observerte tallene med en ²²-lov . Blant disse testene kalles de som gjelder normalfordeling normalitetstester .
De homogenitet tester gjør det mulig å sammenligne to empiriske lover å vite om de er et resultat av samme fenomen, eller i en tilsvarende måte, hvis de kan modelleres av samme a priori sannsynlighet lov . Disse testene sammenligner visse egenskaper ved empiriske lover med eiendommen til tidligere lov . De er nyttige i praksis siden de gjør det mulig å sammenligne ikke hele fordelinger, men verdier som følger av lovene: Fisher-testen estimerer forholdet mellom de empiriske avvikene via Fishers lov , Studenttesten estimerer det empiriske gjennomsnittet via Studentens lov , etc.
Sannsynlovene brukes til å representere de observerte fenomenene. En sannsynlighetslov, kalt a priori , skal modellere dataene som er hentet, og deretter utføres statistiske tester for å bekrefte eller ugyldiggjøre at sannsynlighetsloven er i samsvar med dataene. På mange områder har metoder utviklet seg og bedre sannsynlighetslover har blitt opprettet for bedre å samsvare med problemet. Her er en liste over konkrete eksempler som tilbyr modeller: