Geometrisk gjennomsnitt
I matematikk er det geometriske gjennomsnittet en type middel .
Elementær definisjon
Det geometriske gjennomsnittet av to positive tall a og b er det positive tallet c slik at:
påvs.=vs.b{\ displaystyle {\ frac {a} {c}} = {\ frac {c} {b}}}.
Geometrisk tolkning
Geometrisk er dette tallet c siden av et kvadrat hvis areal er det samme som for rektangelet til sidene a og b , siden i dette tilfellet:
vs.2=påb.{\ displaystyle c ^ {2} = ab.}Vi kan direkte beregne det geometriske gjennomsnittet av to tall ved å ta kvadratroten til forrige uttrykk:
vs.=påb=(påb)1/2.{\ displaystyle c = {\ sqrt {ab}} = (ab) ^ {1/2}.}
Generalisering
Diskret sak
I denne siste formen ser vi at logaritmen (i hvilken som helst base) forvandler uttrykket til et aritmetisk gjennomsnitt: (forutsatt at a og b ikke er null, logaritmen ikke er definert som 0).
Loggvs.=Loggpå+Loggb2{\ displaystyle \ log c = {\ frac {\ log a + \ log b} {2}}}
Derav generaliseringen: det geometriske gjennomsnittet av en ikke-null positiv kvantitativ statistisk serie er definert slik at logaritmen er det aritmetiske gjennomsnittet av logaritmene til seriens verdier.
Formuleringen kan gjøres som følger:
Loggx¯=Loggx1+Loggx2+...+Loggxikkeikke=1ikke∑Jeg=1ikkeLoggxJeg.{\ displaystyle \ log {\ bar {x}} = {\ frac {\ log x_ {1} + \ log x_ {2} + \ ldots + \ log x_ {n}} {n}} = {1 \ over n} \ sum _ {i = 1} ^ {n} \ log x_ {i}.}Vi kan utlede:
x¯=x1×x2×...×xikkeikke=∏Jeg=1ikkexJegikke.{\ displaystyle {\ bar {x}} = {\ sqrt [{n}] {x_ {1} \ times x_ {2} \ times \ ldots \ times x_ {n}}} = {\ sqrt [{n} ] {\ prod _ {i = 1} ^ {n} {x_ {i}}}}.}For en statistisk serie hvis totale antall forekomster er uendelig eller ukjent, men hvis antall mulige ikke-null positive verdier er endelig og deres respektive frekvenser i serien er kjent, blir den matematiske formuleringen:
Loggx¯=f1Loggx1+f2Loggx2+...+fikkeLoggxikkef1+f2+...+fikke=∑Jeg=1ikkefJegLoggxJeg∑Jeg=1ikkefJeg,påvevs.∑Jeg=1ikkefJeg=1.{\ displaystyle \ log {\ bar {x}} = {\ frac {f_ {1} \ log x_ {1} + f_ {2} \ log x_ {2} + \ ldots + f_ {n} \ log x_ { n}} {f_ {1} + f_ {2} + \ ldots + f_ {n}}} = {\ frac {\ sum _ {i = 1} ^ {n} {f_ {i} \ log x_ {i }}} {\ sum _ {i = 1} ^ {n} {f_ {i}}}}, \ quad \ mathrm {med} \ quad \ sum _ {i = 1} ^ {n} {f_ {i }} = 1.}Vi utleder (bruker for eksempel den naturlige logaritmen ):
x¯=eksp(f1lnx1+f2lnx2+...+fikkelnxikkef1+f2+...+fikke)=eksp(∑Jeg=1ikkefJeglnxJeg∑Jeg=1ikkefJeg),{\ displaystyle {\ bar {x}} = \ exp \ left ({\ frac {f_ {1} \ ln x_ {1} + f_ {2} \ ln x_ {2} + \ ldots + f_ {n} \ ln x_ {n}} {f_ {1} + f_ {2} + \ ldots + f_ {n}}} høyre) = \ exp \ left ({\ frac {\ sum _ {i = 1} ^ {n } f_ {i} \ ln x_ {i}} {\ sum _ {i = 1} ^ {n} {f_ {i}}}} høyre),}fra hvor :
x¯=x1f1×x2f2×...×xikkefikke=∏Jeg=1ikkexJegfJeg.{\ displaystyle {\ bar {x}} = {x_ {1}} ^ {f_ {1}} \ times {x_ {2}} ^ {f_ {2}} \ times \ ldots \ times {x_ {n} } ^ {f_ {n}} = \ prod _ {i = 1} ^ {n} {{x_ {i}} ^ {f_ {i}}}.}Kontinuerlig sak
Den geometriske middelverdi av en fordeling f av en kontinuerlig variabel med verdien i et avgrenset skalar intervallet [ x 0 , x 1 ] er generaliseringen ved grensen av de foregående diskrete statistisk formel:
Loggf¯x0x1=∫x0x1Loggxf(x) dx,{\ displaystyle \ log {{\ bar {f}} _ {x_ {0}} ^ {x_ {1}}} = \ int _ {x_ {0}} ^ {x_ {1}} {\ log xf ( x) ~ \ mathrm {d} x},}fra hvor :
f¯x0x1=eksp(∫x0x1lnxf(x) dx)påvevs.∫x0x1f(x) dx=1.{\ displaystyle {\ bar {f}} _ {x_ {0}} ^ {x_ {1}} = \ exp \ left (\ int _ {x_ {0}} ^ {x_ {1}} \ ln xf ( x) ~ \ mathrm {d} x \ right) \ quad \ mathrm {with} \ quad \ int _ {x_ {0}} ^ {x_ {1}} f (x) ~ \ mathrm {d} x = 1 .}Dimensjonen er ikke en frekvens, men er dens kontinuerlige variabel.
Hvis fordelingen f er definert på alle de virkelige verdiene til dens kontinuerlige variabel, er det geometriske gjennomsnittet av fordelingen:
f¯=eksp(∫-∞+∞lnxf(x) dx)påvevs.∫-∞+∞f(x) dx=1.{\ displaystyle {\ bar {f}} = \ exp \ left (\ int _ {- \ infty} ^ {+ \ infty} \ ln xf (x) ~ \ mathrm {d} x \ right) \ quad \ mathrm {med} \ quad \ int _ {- \ infty} ^ {+ \ infty} f (x) ~ \ mathrm {d} x = 1.}
Renter
For statistikere er det geometriske gjennomsnittet ( antilogaritme av gjennomsnittet av logaritmene til hver observasjon) mindre følsom enn det aritmetiske gjennomsnittet ved de høyeste verdiene i en dataserie. Det gir derfor et nytt og bedre estimat av den sentrale tendensen til dataene i tilfelle en langhalefordeling i den øvre enden av kurven (distribusjonstype hyppig i helse- eller miljøtiltak, f.eks. Giftig i kroppen, blodet eller miljøet , der visse individer eller grupper som er sårbare eller utsatt for bestemte tilfeller er mer berørt)
Se også
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">