Kumulativ (statistikk)

I matematikk og nærmere bestemt i sannsynlighetsteori og statistikk er kumulantene til en sannsynlighetslov koeffisienter som har en rolle som ligner på øyeblikkene . Kumulantene bestemmer øyeblikkene fullt ut og omvendt, det vil si at to lover har de samme kumulantene hvis og bare hvis de har de samme øyeblikkene.

Den forventning utgjør den første cumulant, den varians den andre og den tredje sentrert øyeblikket utgjør den tredje cumulant. På den annen side tilsvarer kumulantene av ordre 4 eller mer ikke lenger de sentrerte øyeblikkene.

Bruk av kumulanter kan vise seg å være nyttig fordi de tilfredsstiller spesielt følgende egenskaper: den niende kumulanten av en sum av uavhengige variabler er lik summen av den niende kumulanten av hver variabel av summen.

En lov med gitte kumulanter κ n kan tilnærmes ved en Edgeworth-utvidelse.

Definisjon

La $X være$ en virkelig verdifull variabel. Vi definerer først genereringsfunksjonen til kumulantene $K X$ assosiert med $X$ :

{\ displaystyle K_ {X} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {t \ cdot X}))}

Kumulantene $κ n$ blir deretter definert som koeffisientene i utvidelsen av $K X$ i eksponensiell serie:

{\ displaystyle K_ {X} (t) = \ sum _ {n = 1} ^ {\ infty} \ kappa _ {n} {\ frac {t ^ {n}} {n!}} = \ mu t + \ sigma ^ {2} {\ frac {t ^ {2}} {2}} + \ cdots}

Hvis vi med $μ = E ( X )$ betegner forventningen til $X$ og $σ 2 = E (( X - μ) 2 )$ dens avvik, har vi spesielt at $μ = κ 1$ og $σ 2 = κ 2$ .

Kumulantene er gitt av derivatene i 0 av $K X$ :

{\ displaystyle K_ {X} ^ {(n)} (0) = \ kappa _ {n} ~~~ \ forall n \ geq 1.}

Den kumulantgenererende funksjonen er nært knyttet til den øyeblikksgenererende funksjonen til variabelen $x$ . Å jobbe med kumulantgeneratorfunksjonen er noen ganger mer praktisk siden for uavhengige variabler $X$ og $Y$ :

{\ displaystyle K_ {X + Y} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {t \ cdot (X + Y)})) = \ ln (\ mathbb {E} ( \ mathrm {e} ^ {tX}) \ cdot \ mathbb {E} (e ^ {tY})) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {tX})) + \ ln ( \ mathbb {E} (\ mathrm {e} ^ {tY})) = K_ {X} (t) + K_ {Y} (t).}

Mens med generatorfunksjonen til øyeblikkene vi oppnår:

{\ displaystyle M_ {X + Y} (t) = \ mathbb {E} (\ mathrm {e} ^ {t \ cdot (X + Y)}) = \ mathbb {E} (\ mathrm {e} ^ { tX}) \ cdot \ mathbb {E} (\ mathrm {e} ^ {tY}) = M_ {X} (t) \ cdot M_ {Y} (t).}

Det vil vi merke

{\ displaystyle K _ {\ alpha X} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {t \ cdot \ alpha X})) = K_ {X} (\ alpha t). }

Noen forfattere foretrekker å definere generatorfunksjonen til kumulanter i stedet for den naturlige logaritmen til den karakteristiske funksjonen . Den kumulative generatorfunksjonen tar noen ganger navnet på den andre karakteristiske funksjonen .

{\ displaystyle H_ {X} (t) = \ ln (\ mathbb {E} (\ mathrm {e} ^ {\ mathrm {i} tX})) = \ sum _ {n = 1} ^ {\ infty} \ kappa _ {n} \ cdot {\ frac {(\ mathrm {i} t) ^ {n}} {n!}} = \ mu \ mathrm {i} t- \ sigma ^ {2} {\ frac { t ^ {2}} {2}} + \ cdots}

Karakteriseringen av kumulanter er gyldig selv for lover hvis øyeblikk av høyere ordre ikke eksisterer.

Kumulanter av noen diskrete distribusjoner

Lovens navn	Innstillinger	Genererer funksjon av kumulanter $K X$	Kumulanter $κ n$
Dirac-tiltak	${\ displaystyle x \ in \ mathbb {R}}$	$tx$	${\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = x & \\\ kappa _ {n} = 0 & {\ text {for}} n \ geq 2 \ end { array}} \ høyre.}$
Bernoullis lov	${\ displaystyle p \ in [0; 1]}$	${\ displaystyle \ ln (p \ mathrm {e} ^ {t} + 1-p)}$	${\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = p & \\\ kappa _ {2} = p (1-p) & \\\ kappa _ {n + 1 } = p (1-p) {\ frac {d \ kappa _ {n}} {dp}} og {\ text {for}} n \ geq 1 \ end {array}} \ høyre.}$
Geometrisk lov	${\ displaystyle p \ in [0; 1]}$	${\ displaystyle \ ln (p \ mathrm {e} ^ {t}) - \ ln (1- (1-p) \ mathrm {e} ^ {t})}$	${\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = {\ frac {1} {p}} & \\\ kappa _ {2} = {\ frac {1-p } {p ^ {2}}} & \ end {array}} \ høyre.}$
Poissons lov	$\ lambda> 0$	${\ displaystyle \ lambda (\ mathrm {e} ^ {t} -1)}$	${\ displaystyle \ kappa _ {n} = \ lambda {\ text {for}} n \ geq 1}$
Binomial lov	${\ displaystyle n \ in \ mathbb {N} ^ {*}, \, p \ in [0; 1]}$	${\ displaystyle n \ ln (p \ mathrm {e} ^ {t} + 1-p)}$	${\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = np & \\\ kappa _ {2} = np (1-p) & \\\ kappa _ {n + 1 } = p (1-p) {\ frac {d \ kappa _ {n}} {dp}} og {\ text {for}} n \ geq 1 \ end {array}} \ høyre.}$
Negativ binomelov	${\ displaystyle n \ in \ mathbb {N} ^ {*}, \, p \ in \ left] 0; 1 \ right]}$	${\ displaystyle n \ ln (p) -n \ ln (1- (1-p) \ mathrm {e} ^ {t})}$	${\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = {\ frac {n (1-p)} {p}} & \\\ kappa _ {2} = {\ frac {n (1-p)} {p ^ {2}}} & \ end {array}} \ høyre.}$

Ved å introdusere gir de foregående fordelingene en enhetlig formel for de to første derivatene av generatorfunksjonen til kumulantene: ${\ displaystyle \ varepsilon = {\ frac {\ sigma ^ {2}} {\ mu}} = {\ frac {\ kappa _ {2}} {\ kappa _ {1}}}}$

{\ displaystyle K_ {X} '(t) = {\ frac {\ mu} {1+ \ varepsilon \ cdot (\ mathrm {e} ^ {- t} -1)}}}

{\ displaystyle K_ {X} '' (t) = {\ frac {K_ {X} '(t)} {1+ \ mathrm {e} ^ {t} \ cdot (\ varepsilon ^ {- 1} -1 )}}}

Dette bekrefter at den første kumulanten er $κ 1 = μ$ og at den andre kumulanten er $κ 2 = με$ .

De konstante tilfeldige variablene $X = x$ er slik at $ε = 0$ . Binomiale lover verifiserer $ε = 1 - p$ slik at $0 <ε <1$ .

Poissons lover verifiserer $ε = 1$ mens negative binomiale lover er preget av $ε = 1 / s$ slik at $ε> 1$ . Legg merke til analogi med den eksentrisitet av kjeglesnitt : sirkler $ε = 0$ , ellipser $0 <ε <1$ , parabler $ε = 1$ , hyperbler $ε> en$ .

Kumulanter av visse sammenhengende lover

Lovens navn	Innstillinger	Genererer funksjon av kumulanter $K X$	Kumulanter $κ n$
Kontinuerlig enhetlig lov	${\ displaystyle [-1; 0]}$	${\ displaystyle \ ln (1- \ mathrm {e} ^ {- t}) - \ ln (t)}$	${\ displaystyle \ kappa _ {n} = {\ frac {B_ {n}} {n}} {\ text {for}} n \ geq 1}$ hvor $B n$ er den n- te Bernoulli antall
Normal lov	${\ displaystyle \ mu \ in \ mathbb {R}, \, \ sigma ^ {2}> 0}$	${\ displaystyle \ mu t + {\ frac {\ sigma ^ {2} t ^ {2}} {2}}}$	${\ displaystyle \ left \ {{\ begin {array} {ll} \ kappa _ {1} = \ mu & \\\ kappa _ {2} = \ sigma ^ {2} & \\\ kappa _ {n} = 0 og {\ text {for}} n \ geq 3 \ end {array}} \ høyre.}$

Noen egenskaper til kumulanter

Invarians

Kumulantene verifiserer for hvilken som helst tilfeldig variabel $X$ og hvilken som helst konstant $c$ relasjonene: $κ 1 ( X + c ) = κ 1 ( X ) + c$ og $κ n ( X + c ) = κ n ( X )$ for $n \geq 2$ . For å oppsummere blir $c$ lagt til i den første kumulanten, og alle kumulanter av høyere orden er uendret.

Homogenitet

Den n -te kumulanten er homogen av grad n , dvs. hvis c er en konstant, så:

\ kappa_n (cX) = c ^ n \ kappa_n (X).

Tilsetningsevne

Hvis X og Y er uavhengige , er kumulantene av summen summen av kumulantene:

{\ displaystyle \ kappa _ {n} (X + Y) = \ kappa _ {n} (X) + \ kappa _ {n} (Y).}

Et blandet resultat

Å kjenne resultatene av kumulantene av normalfordelingen , kunne man håpe på å finne fordelinger der $κ m = κ m +1 = ... = 0$ for en $m > 3$ , og hvor lavere ordens kumulanter (ordre 3 til m - 1) er ikke null. Det er ingen slike distribusjoner. Dermed kan ikke generatorfunksjonen til kumulantene være et polynom med endelig grad større enn 2.

Kumulanter og øyeblikk

Den øyeblikksgenererende funksjonen er:

{\ displaystyle \ sum _ {n = 0} ^ {\ infty} {\ frac {m_ {n} t ^ {n}} {n!}} = \ exp \ left (\ sum _ {n = 0} ^ {\ infty} {\ frac {\ kappa _ {n} t ^ {n}} {n!}} \ right) = \ exp (K_ {X} (t)).}

slik at genereringsfunksjonen til kumulantene er logaritmen til momentenes generasjonsfunksjon. Den første kumulanten er håp ; det andre og tredje kumulantene er henholdsvis det andre og tredje sentrerte øyeblikk (det sentrerte øyeblikk av ordre 2 er variansen ); men kumulantene av høyere orden er ikke like de ikke-sentrerte øyeblikkene, og heller ikke de sentrerte øyeblikkene. Snarere er de polynomer av disse øyeblikkene.

Kumulantene er relatert til øyeblikkene ved gjentakelsesformelen:

\ kappa_n = m_n- \ sum_ {k = 1} ^ {n-1} \ binom {n-1} {k-1} \, \ kappa_k \, m_ {nk}.

Det n- øyeblikket $m n$ er et polynom av grad n av de første n kumulantene:

m_1 = \ kappa_1

m_2 = \ kappa_2 + \ kappa_1 ^ {\ 2}

m_3 = \ kappa_3 + 3 \ kappa_2 \ kappa_1 + \ kappa_1 ^ {\ 3}

m_4 = \ kappa_4 + 4 \ kappa_3 \ kappa_1 + 3 \ kappa_2 ^ {\ 2} + 6 \ kappa_2 \ kappa_1 ^ {\ 2} + \ kappa_1 ^ {\ 4}

m_5 = \ kappa_5 + 5 \ kappa_4 \ kappa_1 + 10 \ kappa_3 \ kappa_2 + 10 \ kappa_3 \ kappa_1 ^ {\ 2} + 15 \ kappa_2 ^ {\ 2} \ kappa_1 + 10 \ kappa_2 \ kappa_1 ^ {\ 3} + \ kappa_1 ^ {\ 5}

m_6 = \ kappa_6 + 6 \ kappa_5 \ kappa_1 + 15 \ kappa_4 \ kappa_2 + 10 \ kappa_3 ^ {\ 2} + 15 \ kappa_4 \ kappa_1 ^ {\ 2} + 60 \ kappa_3 \ kappa_2 \ kappa_1 + 15 ^ {kappa_3 \ 3} + 20 \ kappa_3 \ kappa_1 ^ {\ 3} + 45 \ kappa_2 ^ {\ 2} \ kappa_1 ^ {\ 2} + 15 \ kappa_2 \ kappa_1 ^ {\ 4} + \ kappa_1 ^ {\ 6}

Koeffisientene er nøyaktig de som vises i polynomene til Bell og følgelig i formelen til Faà di Bruno .

Momentene $m n$ skal ikke forveksles med de sentrerte momentene $μ n$ . For å uttrykke de sentrale øyeblikkene som en funksjon av kumulantene, er det tilstrekkelig å sette κ 1 = 0:

\ mu_1 = 0

\ mu _ {2} = \ kappa _ {2}

\ mu_3 = \ kappa_3

\ mu _ {4} = \ kappa _ {4} +3 \ kappa _ {2} ^ {\ 2}

\ mu_5 = \ kappa_5 + 10 \ kappa_3 \ kappa_2

\ mu_6 = \ kappa_6 + 15 \ kappa_4 \ kappa_2 + 10 \ kappa_3 ^ {\ 2} + 15 \ kappa_2 ^ {\ 3}

\ mu_7 = \ kappa_7 + 21 \ kappa_5 \ kappa_2 + 35 \ kappa_4 \ kappa_3 + 105 \ kappa_3 \ kappa_2 ^ {\ 2}

\ mu_8 = \ kappa_8 + 28 \ kappa_6 \ kappa_2 + 56 \ kappa_5 \ kappa_3 + 35 \ kappa_4 ^ {\ 2} + 210 \ kappa_4 \ kappa_2 ^ {\ 2} + 280 \ kappa_3 ^ {\ 2} \ kappa_2 + 105 \ kappa_2 ^ {\ 4}

Kobling til statistisk fysikk

I statistisk fysikk kan et system i likevekt med et termisk bad ved temperaturen oppta energitilstander . La være tettheten til energitilstandene . Det system partisjonsfunksjonen er gitt ved ${\ displaystyle k_ {b} T = 1 / \ beta}$ $E$ $f (E)$ $E$

Z (\ beta) = \ langle \ exp (- \ beta E) \ rangle

Systemets frie energi er definert av

F (\ beta) = (- 1 / \ beta) \ ln (Z)

Den frie energien i systemet gir tilgang til alle de termodynamiske egenskapene til systemet som dets indre energi , dets entropi , dets spesifikke varme ...

Historie

Kumulanter ble definert i 1889 av dansk astronom, matematiker og aktuar Thorvald Nicolai Thiele (1838 - 1910). Thiele kaller dem deretter halvinvariere . Det var først i 1931 å finne navnet kumulanter i artikkelen " The derivation of the pattern formulas of two-way partitions from those of simpler patterns " av Ronald Aylmer Fisher og John Wishart ( Proceedings of the London Mathematical Society , Series 2 , v . 33, s. 195-208 ). Historikeren Stephen Stigler rapporterer at det kumulative navnet ble foreslått til Fisher i et brev fra Harold Hotelling . Delingsfunksjonen for det kanoniske ensemblet i statistisk fysikk ble definert av Josiah Willard Gibbs i 1901.

Se også

Referanser

Kendall, MG, Stuart, A. (1969), The Advanced Theory of Statistics , bind 1 ( 3. utgave). Griffin, London (avsnitt 3.12).
Lukacs, E. (1970) Karakteristiske funksjoner ( 2 av utgaven). Griffin, London (side 27).
Lukacs, E. (1970) Karakteristiske Funksjoner ( 2 d Edition), Griffin, London (Theorem 7.3.5).

Eksterne linker

(no) Eric W. Weisstein , “ Cumulant ” , på MathWorld