Kumulativ (statistikk)
I matematikk og nærmere bestemt i sannsynlighetsteori og statistikk er kumulantene til en sannsynlighetslov koeffisienter som har en rolle som ligner på øyeblikkene . Kumulantene bestemmer øyeblikkene fullt ut og omvendt, det vil si at to lover har de samme kumulantene hvis og bare hvis de har de samme øyeblikkene.
Den forventning utgjør den første cumulant, den varians den andre og den tredje sentrert øyeblikket utgjør den tredje cumulant. På den annen side tilsvarer kumulantene av ordre 4 eller mer ikke lenger de sentrerte øyeblikkene.
Bruk av kumulanter kan vise seg å være nyttig fordi de tilfredsstiller spesielt følgende egenskaper: den niende kumulanten av en sum av uavhengige variabler er lik summen av den niende kumulanten av hver variabel av summen.
En lov med gitte kumulanter κ n kan tilnærmes ved en Edgeworth-utvidelse.
Definisjon
La X være en virkelig verdifull variabel. Vi definerer først genereringsfunksjonen til kumulantene K X assosiert med X :
KX(t)=ln(E(et⋅X)){\ displaystyle K_ {X} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {t \ cdot X}))}.
Kumulantene κ n blir deretter definert som koeffisientene i utvidelsen av K X i eksponensiell serie:
KX(t)=∑ikke=1∞κikketikkeikke!=μt+σ2t22+⋯{\ displaystyle K_ {X} (t) = \ sum _ {n = 1} ^ {\ infty} \ kappa _ {n} {\ frac {t ^ {n}} {n!}} = \ mu t + \ sigma ^ {2} {\ frac {t ^ {2}} {2}} + \ cdots}Hvis vi med μ = E ( X ) betegner forventningen til X og σ 2 = E (( X - μ) 2 ) dens avvik, har vi spesielt at μ = κ 1 og σ 2 = κ 2 .
Kumulantene er gitt av derivatene i 0 av K X :
KX(ikke)(0)=κikke ∀ikke≥1.{\ displaystyle K_ {X} ^ {(n)} (0) = \ kappa _ {n} ~~~ \ forall n \ geq 1.}Den kumulantgenererende funksjonen er nært knyttet til den øyeblikksgenererende funksjonen til variabelen x . Å jobbe med kumulantgeneratorfunksjonen er noen ganger mer praktisk siden for uavhengige variabler X og Y :
KX+Y(t)=ln(E(et⋅(X+Y)))=ln(E(etX)⋅E(etY))=ln(E(etX))+ln(E(etY))=KX(t)+KY(t).{\ displaystyle K_ {X + Y} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {t \ cdot (X + Y)})) = \ ln (\ mathbb {E} ( \ mathrm {e} ^ {tX}) \ cdot \ mathbb {E} (e ^ {tY})) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {tX})) + \ ln ( \ mathbb {E} (\ mathrm {e} ^ {tY})) = K_ {X} (t) + K_ {Y} (t).}Mens med generatorfunksjonen til øyeblikkene vi oppnår:
MX+Y(t)=E(et⋅(X+Y))=E(etX)⋅E(etY)=MX(t)⋅MY(t).{\ displaystyle M_ {X + Y} (t) = \ mathbb {E} (\ mathrm {e} ^ {t \ cdot (X + Y)}) = \ mathbb {E} (\ mathrm {e} ^ { tX}) \ cdot \ mathbb {E} (\ mathrm {e} ^ {tY}) = M_ {X} (t) \ cdot M_ {Y} (t).}Det vil vi merke
KαX(t)=ln(E(et⋅αX))=KX(αt).{\ displaystyle K _ {\ alpha X} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {t \ cdot \ alpha X})) = K_ {X} (\ alpha t). }Noen forfattere foretrekker å definere generatorfunksjonen til kumulanter i stedet for den naturlige logaritmen til den karakteristiske funksjonen . Den kumulative generatorfunksjonen tar noen ganger navnet på den andre karakteristiske funksjonen .
HX(t)=ln(E(eJegtX))=∑ikke=1∞κikke⋅(Jegt)ikkeikke!=μJegt-σ2t22+⋯{\ displaystyle H_ {X} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {\ mathrm {i} tX})) = \ sum _ {n = 1} ^ {\ infty} \ kappa _ {n} \ cdot {\ frac {(\ mathrm {i} t) ^ {n}} {n!}} = \ mu \ mathrm {i} t- \ sigma ^ {2} {\ frac { t ^ {2}} {2}} + \ cdots}Karakteriseringen av kumulanter er gyldig selv for lover hvis øyeblikk av høyere ordre ikke eksisterer.
Kumulanter av noen diskrete distribusjoner
Lovens navn
|
Innstillinger
|
Genererer funksjon av kumulanter K X
|
Kumulanter κ n
|
---|
Dirac-tiltak
|
x∈R{\ displaystyle x \ in \ mathbb {R}}
|
tx{\ displaystyle tx}
|
{κ1=xκikke=0 til ikke≥2{\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = x & \\\ kappa _ {n} = 0 & {\ text {for}} n \ geq 2 \ end { array}} \ høyre.}
|
Bernoullis lov
|
s∈[0;1]{\ displaystyle p \ in [0; 1]}
|
ln(set+1-s){\ displaystyle \ ln (p \ mathrm {e} ^ {t} + 1-p)}
|
{κ1=sκ2=s(1-s)κikke+1=s(1-s)dκikkeds til ikke≥1{\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = p & \\\ kappa _ {2} = p (1-p) & \\\ kappa _ {n + 1 } = p (1-p) {\ frac {d \ kappa _ {n}} {dp}} og {\ text {for}} n \ geq 1 \ end {array}} \ høyre.}
|
Geometrisk lov
|
s∈[0;1]{\ displaystyle p \ in [0; 1]}
|
ln(set)-ln(1-(1-s)et){\ displaystyle \ ln (p \ mathrm {e} ^ {t}) - \ ln (1- (1-p) \ mathrm {e} ^ {t})}
|
{κ1=1sκ2=1-ss2{\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = {\ frac {1} {p}} & \\\ kappa _ {2} = {\ frac {1-p } {p ^ {2}}} & \ end {array}} \ høyre.}
|
Poissons lov
|
λ>0{\ displaystyle \ lambda> 0}
|
λ(et-1){\ displaystyle \ lambda (\ mathrm {e} ^ {t} -1)}
|
κikke=λ til ikke≥1{\ displaystyle \ kappa _ {n} = \ lambda {\ text {for}} n \ geq 1}
|
Binomial lov
|
ikke∈IKKE∗,s∈[0;1]{\ displaystyle n \ in \ mathbb {N} ^ {*}, \, p \ in [0; 1]}
|
ikkeln(set+1-s){\ displaystyle n \ ln (p \ mathrm {e} ^ {t} + 1-p)}
|
{κ1=ikkesκ2=ikkes(1-s)κikke+1=s(1-s)dκikkeds til ikke≥1{\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = np & \\\ kappa _ {2} = np (1-p) & \\\ kappa _ {n + 1 } = p (1-p) {\ frac {d \ kappa _ {n}} {dp}} og {\ text {for}} n \ geq 1 \ end {array}} \ høyre.}
|
Negativ binomelov
|
ikke∈IKKE∗,s∈]0;1]{\ displaystyle n \ in \ mathbb {N} ^ {*}, \, p \ in \ left] 0; 1 \ right]}
|
ikkeln(s)-ikkeln(1-(1-s)et){\ displaystyle n \ ln (p) -n \ ln (1- (1-p) \ mathrm {e} ^ {t})}
|
{κ1=ikke(1-s)sκ2=ikke(1-s)s2{\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = {\ frac {n (1-p)} {p}} & \\\ kappa _ {2} = {\ frac {n (1-p)} {p ^ {2}}} & \ end {array}} \ høyre.}
|
Ved å introdusere gir de foregående fordelingene en enhetlig formel for de to første derivatene av generatorfunksjonen til kumulantene:
ε=σ2μ=κ2κ1{\ displaystyle \ varepsilon = {\ frac {\ sigma ^ {2}} {\ mu}} = {\ frac {\ kappa _ {2}} {\ kappa _ {1}}}}
KX′(t)=μ1+ε⋅(e-t-1){\ displaystyle K_ {X} '(t) = {\ frac {\ mu} {1+ \ varepsilon \ cdot (\ mathrm {e} ^ {- t} -1)}}}og
KX"(t)=KX′(t)1+et⋅(ε-1-1){\ displaystyle K_ {X} '' (t) = {\ frac {K_ {X} '(t)} {1+ \ mathrm {e} ^ {t} \ cdot (\ varepsilon ^ {- 1} -1 )}}}.
Dette bekrefter at den første kumulanten er κ 1 = μ og at den andre kumulanten er κ 2 = με .
De konstante tilfeldige variablene X = x er slik at ε = 0 . Binomiale lover verifiserer ε = 1 - p slik at 0 <ε <1 .
Poissons lover verifiserer ε = 1 mens negative binomiale lover er preget av ε =1/sslik at ε> 1 . Legg merke til analogi med den eksentrisitet av kjeglesnitt : sirkler ε = 0 , ellipser 0 <ε <1 , parabler ε = 1 , hyperbler ε> en .
Kumulanter av visse sammenhengende lover
Noen egenskaper til kumulanter
Invarians
Kumulantene verifiserer for hvilken som helst tilfeldig variabel X og hvilken som helst konstant c relasjonene: κ 1 ( X + c ) = κ 1 ( X ) + c og κ n ( X + c ) = κ n ( X ) for n ≥ 2 . For å oppsummere blir c lagt til i den første kumulanten, og alle kumulanter av høyere orden er uendret.
Homogenitet
Den n -te kumulanten er homogen av grad n , dvs. hvis c er en konstant, så:
κikke(vs.X)=vs.ikkeκikke(X).{\ displaystyle \ kappa _ {n} (cX) = c ^ {n} \ kappa _ {n} (X).}
Tilsetningsevne
Hvis X og Y er uavhengige , er kumulantene av summen summen av kumulantene:
κikke(X+Y)=κikke(X)+κikke(Y).{\ displaystyle \ kappa _ {n} (X + Y) = \ kappa _ {n} (X) + \ kappa _ {n} (Y).}
Et blandet resultat
Å kjenne resultatene av kumulantene av normalfordelingen , kunne man håpe på å finne fordelinger der κ m = κ m +1 = ... = 0 for en m > 3 , og hvor lavere ordens kumulanter (ordre 3 til m - 1) er ikke null. Det er ingen slike distribusjoner. Dermed kan ikke generatorfunksjonen til kumulantene være et polynom med endelig grad større enn 2.
Kumulanter og øyeblikk
Den øyeblikksgenererende funksjonen er:
∑ikke=0∞mikketikkeikke!=eksp(∑ikke=0∞κikketikkeikke!)=eksp(KX(t)).{\ displaystyle \ sum _ {n = 0} ^ {\ infty} {\ frac {m_ {n} t ^ {n}} {n!}} = \ exp \ left (\ sum _ {n = 0} ^ {\ infty} {\ frac {\ kappa _ {n} t ^ {n}} {n!}} \ right) = \ exp (K_ {X} (t)).}slik at genereringsfunksjonen til kumulantene er logaritmen til momentenes generasjonsfunksjon. Den første kumulanten er håp ; det andre og tredje kumulantene er henholdsvis det andre og tredje sentrerte øyeblikk (det sentrerte øyeblikk av ordre 2 er variansen ); men kumulantene av høyere orden er ikke like de ikke-sentrerte øyeblikkene, og heller ikke de sentrerte øyeblikkene. Snarere er de polynomer av disse øyeblikkene.
Kumulantene er relatert til øyeblikkene ved gjentakelsesformelen:
κikke=mikke-∑k=1ikke-1(ikke-1k-1)κkmikke-k.{\ displaystyle \ kappa _ {n} = m_ {n} - \ sum _ {k = 1} ^ {n-1} {\ binom {n-1} {k-1}} \, \ kappa _ {k } \, m_ {nk}.}Det n- øyeblikket m n er et polynom av grad n av de første n kumulantene:
m1=κ1{\ displaystyle m_ {1} = \ kappa _ {1}}
m2=κ2+κ1 2{\ displaystyle m_ {2} = \ kappa _ {2} + \ kappa _ {1} ^ {\ 2}}
m3=κ3+3κ2κ1+κ1 3{\ displaystyle m_ {3} = \ kappa _ {3} +3 \ kappa _ {2} \ kappa _ {1} + \ kappa _ {1} ^ {\ 3}}
m4=κ4+4κ3κ1+3κ2 2+6κ2κ1 2+κ1 4{\ displaystyle m_ {4} = \ kappa _ {4} +4 \ kappa _ {3} \ kappa _ {1} +3 \ kappa _ {2} ^ {\ 2} +6 \ kappa _ {2} \ kappa _ {1} ^ {\ 2} + \ kappa _ {1} ^ {\ 4}}
m5=κ5+5κ4κ1+10κ3κ2+10κ3κ1 2+15κ2 2κ1+10κ2κ1 3+κ1 5{\ displaystyle m_ {5} = \ kappa _ {5} +5 \ kappa _ {4} \ kappa _ {1} +10 \ kappa _ {3} \ kappa _ {2} +10 \ kappa _ {3} \ kappa _ {1} ^ {\ 2} +15 \ kappa _ {2} ^ {\ 2} \ kappa _ {1} +10 \ kappa _ {2} \ kappa _ {1} ^ {\ 3} + \ kappa _ {1} ^ {\ 5}}
m6=κ6+6κ5κ1+15κ4κ2+10κ3 2+15κ4κ1 2+60κ3κ2κ1+15κ2 3+20κ3κ1 3+45κ2 2κ1 2+15κ2κ1 4+κ1 6{\ displaystyle m_ {6} = \ kappa _ {6} +6 \ kappa _ {5} \ kappa _ {1} +15 \ kappa _ {4} \ kappa _ {2} +10 \ kappa _ {3} ^ {\ 2} +15 \ kappa _ {4} \ kappa _ {1} ^ {\ 2} +60 \ kappa _ {3} \ kappa _ {2} \ kappa _ {1} +15 \ kappa _ { 2} ^ {\ 3} +20 \ kappa _ {3} \ kappa _ {1} ^ {\ 3} +45 \ kappa _ {2} ^ {\ 2} \ kappa _ {1} ^ {\ 2} +15 \ kappa _ {2} \ kappa _ {1} ^ {\ 4} + \ kappa _ {1} ^ {\ 6}}
Koeffisientene er nøyaktig de som vises i polynomene til Bell og følgelig i formelen til Faà di Bruno .
Momentene m n skal ikke forveksles med de sentrerte momentene μ n . For å uttrykke de sentrale øyeblikkene som en funksjon av kumulantene, er det tilstrekkelig å sette κ 1 = 0:
μ1=0{\ displaystyle \ mu _ {1} = 0}
μ2=κ2{\ displaystyle \ mu _ {2} = \ kappa _ {2}}
μ3=κ3{\ displaystyle \ mu _ {3} = \ kappa _ {3}}
μ4=κ4+3κ2 2{\ displaystyle \ mu _ {4} = \ kappa _ {4} +3 \ kappa _ {2} ^ {\ 2}}
μ5=κ5+10κ3κ2{\ displaystyle \ mu _ {5} = \ kappa _ {5} +10 \ kappa _ {3} \ kappa _ {2}}
μ6=κ6+15κ4κ2+10κ3 2+15κ2 3{\ displaystyle \ mu _ {6} = \ kappa _ {6} +15 \ kappa _ {4} \ kappa _ {2} +10 \ kappa _ {3} ^ {\ 2} +15 \ kappa _ {2 } ^ {\ 3}}
μ7=κ7+21κ5κ2+35κ4κ3+105κ3κ2 2{\ displaystyle \ mu _ {7} = \ kappa _ {7} +21 \ kappa _ {5} \ kappa _ {2} +35 \ kappa _ {4} \ kappa _ {3} +105 \ kappa _ { 3} \ kappa _ {2} ^ {\ 2}}
μ8=κ8+28κ6κ2+56κ5κ3+35κ4 2+210κ4κ2 2+280κ3 2κ2+105κ2 4{\ displaystyle \ mu _ {8} = \ kappa _ {8} +28 \ kappa _ {6} \ kappa _ {2} +56 \ kappa _ {5} \ kappa _ {3} +35 \ kappa _ { 4} ^ {\ 2} +210 \ kappa _ {4} \ kappa _ {2} ^ {\ 2} +280 \ kappa _ {3} ^ {\ 2} \ kappa _ {2} +105 \ kappa _ {2} ^ {\ 4}}
Kobling til statistisk fysikk
I statistisk fysikk kan et system i likevekt med et termisk bad ved temperaturen oppta energitilstander . La være tettheten til energitilstandene . Det system partisjonsfunksjonen er gitt ved
kbT=1/β{\ displaystyle k_ {b} T = 1 / \ beta}E{\ displaystyle E}f(E){\ displaystyle f (E)}E{\ displaystyle E}
Z(β)=⟨eksp(-βE)⟩{\ displaystyle Z (\ beta) = \ langle \ exp (- \ beta E) \ rangle}.
Systemets frie energi er definert av
F(β)=(-1/β)ln(Z){\ displaystyle F (\ beta) = (- 1 / \ beta) \ ln (Z)}.
Den frie energien i systemet gir tilgang til alle de termodynamiske egenskapene til systemet som dets indre energi , dets entropi , dets spesifikke varme ...
Historie
Kumulanter ble definert i 1889 av dansk astronom, matematiker og aktuar Thorvald Nicolai Thiele (1838 - 1910). Thiele kaller dem deretter halvinvariere . Det var først i 1931 å finne navnet kumulanter i artikkelen " The derivation of the pattern formulas of two-way partitions from those of simpler patterns " av Ronald Aylmer Fisher og John Wishart ( Proceedings of the London Mathematical Society , Series 2 , v . 33, s. 195-208 ). Historikeren Stephen Stigler rapporterer at det kumulative navnet ble foreslått til Fisher i et brev fra Harold Hotelling . Delingsfunksjonen for det kanoniske ensemblet i statistisk fysikk ble definert av Josiah Willard Gibbs i 1901.
Se også
Referanser
-
Kendall, MG, Stuart, A. (1969), The Advanced Theory of Statistics , bind 1 ( 3. utgave). Griffin, London (avsnitt 3.12).
-
Lukacs, E. (1970) Karakteristiske funksjoner ( 2 av utgaven). Griffin, London (side 27).
-
Lukacs, E. (1970) Karakteristiske Funksjoner ( 2 d Edition), Griffin, London (Theorem 7.3.5).
Eksterne linker
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">