Gjennomsnittlig kvadratfeil

I statistikk er den gjennomsnittlige kvadratfeilen til en estimator for en parameter av dimensjon 1 ( gjennomsnittlig kvadratfeil ( ), på engelsk) et mål som karakteriserer "presisjonen" til denne estimatoren. Det kalles oftere "kvadratfeil" ("mener" å være underforstått); det kalles noen ganger også ”kvadratisk risiko”. ${\ hat \ theta}$ $\ theta$ ${\ displaystyle \ operatorname {MSE}}$

Roten gjennomsnittlig kvadratfeil er definert av:

Definisjon - ${\ displaystyle \ operatorname {MSE} ({\ hat {\ theta}}) \, {\ overset {\ text {def}} {=}} \, \ mathbb {E} \ left [({\ hat {\ theta}} - \ theta) ^ {2} \ right]}$

Eiendommer

Uttrykk

Vi kan uttrykke den gjennomsnittlige kvadrerte feilen som en funksjon av forspenningen og variansen til estimatoren:

Teorem - ${\ displaystyle \ operatorname {MSE} ({\ hat {\ theta}}) = \ operatorname {Bias} ({\ hat {\ theta}}) ^ {2} + \ operatorname {Var} ({\ hat {\ theta}})}$

Demonstrasjon

Først tilbakekalling som og er konstanter, som tillater bruk av lineariteten forventning : . ${\ displaystyle \ operatorname {Bias} ({\ hat {\ theta}}) \, {\ overset {\ text {def}} {=}} \, \ mathbb {E} ({\ hat {\ theta}} ) - \ theta}$ ${\ mathbb {E}} ({\ hat \ theta})$ ${\ displaystyle \ mathbb {E} (c_ {1} X + c_ {2}) = c_ {1} \ mathbb {E} (X) + c_ {2}}$

${\ displaystyle {\ begin {align} \ operatorname {MSE} ({\ hat {\ theta}}) \, {\ overset {\ text {def}} {=}} \, \ mathbb {E} \ left [ ({\ hat {\ theta}} - \ theta) ^ {2} \ right] & = \ mathbb {E} \ left [\ left ({\ hat {\ theta}} - \ mathbb {E} ({\ hatt {\ theta}}) + \ operatorname {Bias} ({\ hat {\ theta}}) \ høyre) ^ {2} \ høyre] \\ & = \ mathbb {E} \ venstre [\ venstre ({\ hatt {\ theta}} - \ mathbb {E} ({\ hat {\ theta}}) \ høyre) ^ {2} +2 \ venstre ({\ hat {\ theta}} - \ mathbb {E} ({ \ hat {\ theta}}) høyre) \ operatorname {Bias} ({\ hat {\ theta}}) + \ operatorname {Bias} ({\ hat {\ theta}}) ^ {2} \ right] \ \ & = \ mathbb {E} \ left [\ left ({\ hat {\ theta}} - \ mathbb {E} ({\ hat {\ theta}}) \ right) ^ {2} \ right] +2 \ mathbb {E} \ left ({\ hat {\ theta}} - \ mathbb {E} ({\ hat {\ theta}}) \ right) \ operatorname {Bias} ({\ hat {\ theta}}) + \ operatorname {Bias} ({\ hat {\ theta}}) ^ {2} \\ & = \ operatorname {Var} ({\ hat {\ theta}}) + 2 \ left (\ mathbb {E} ( {\ hat {\ theta}}) - \ mathbb {E} ({\ hat {\ theta}}) til høyre) \ operatorname {Bias} ({\ hat {\ theta}}) + \ operatorname {Bias} ( {\ hat {\ theta}}) ^ {2} \\ & = \ operatorname { Var} ({\ hat {\ theta}}) + \ operatorname {Bias} ({\ hat {\ theta}}) ^ {2} \ end {aligned}}}$

Skilt

Konsekvens - Den variansen er alltid positiv eller null , . ${\ displaystyle \ operatorname {MSE} ({\ hat {\ theta}}) \ geq 0}$

Minimalisering

Teorem - Tenk på en objektiv estimator av parameteren , slik at (hvis den gjennomsnittlige kvadrerte feilen er null, er den allerede minimal, se avsnittet "Sign" ovenfor). ${\ displaystyle {\ bar {\ theta}}}$ $\ theta$ ${\ displaystyle \ operatorname {MSE} ({\ bar {\ theta}})> 0}$

Blant alle estimatorer som er proporsjonale med , er den gjennomsnittlige kvadratiske feilen minimum for estimatoren . ${\ displaystyle {\ bar {\ theta}}}$ ${\ displaystyle {\ check {\ theta}} \, {\ overset {\ text {def}} {=}} \, {\ frac {\ theta ^ {2}} {\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}})}} {\ bar {\ theta}}}$

Denne minste gjennomsnittlige kvadratiske feilen er gyldig . ${\ displaystyle \ operatorname {MSE} ({\ check {\ theta}}) = {\ frac {\ theta ^ {2} \ operatorname {MSE} ({\ bar {\ theta}})} {\ theta ^ { 2} + \ operatorname {MSE} ({\ bar {\ theta}})}}}$

Demonstrasjon

Per definisjon av den objektive estimatoren, derav . ${\ displaystyle \ mathbb {E} ({\ bar {\ theta}}) = \ theta}$ ${\ displaystyle \ operatorname {Var} ({\ bar {\ theta}}) = \ operatorname {MSE} ({\ bar {\ theta}})}$

La derfor: ${\ displaystyle {\ hat {\ theta}} _ {\ alpha} = \ alpha {\ bar {\ theta}}}$

ved linearitet av forventning , ; ${\ displaystyle \ mathbb {E} ({\ hat {\ theta}} _ {\ alpha}) = \ mathbb {E} (\ alpha {\ bar {\ theta}}) = \ alpha \ mathbb {E} ( {\ bar {\ theta}}) = \ alpha \ theta}$
av homogeniteten av varians , ; ${\ displaystyle \ operatorname {Var} ({\ hat {\ theta}} _ {\ alpha}) = \ operatorname {Var} (\ alpha {\ bar {\ theta}}) = \ alpha ^ {2} \ operatorname {Var} ({\ bar {\ theta}}) = \ alpha ^ {2} \ operatorname {MSE} ({\ bar {\ theta}})}$

hvorfra . ${\ displaystyle \ operatorname {MSE} ({\ hat {\ theta}} _ {\ alpha}) = (\ alpha \ theta - \ theta) ^ {2} + \ alpha ^ {2} \ operatorname {MSE} ( {\ bar {\ theta}}) = (\ alpha -1) ^ {2} \ theta ^ {2} + \ alpha ^ {2} \ operatorname {MSE} ({\ bar {\ theta}})}$

Ved å drive med hensyn til , finner vi . $\ alfa$ ${\ displaystyle \ operatorname {MSE} '({\ hat {\ theta}} _ {\ alpha}) = 2 (\ alpha -1) \ theta ^ {2} +2 \ alpha \ operatorname {MSE} ({\ bar {\ theta}}) = 2 \ left (\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}}) \ right) \ alpha -2 \ theta ^ {2}}$

Som det ble antatt er dette derivatet en lineær funksjon av direktørkoeffisient som er strengt positiv, så den avbryter , er strengt negativ og er positiv for , så er minimal . ${\ displaystyle \ operatorname {MSE} ({\ bar {\ theta}})> 0}$ ${\ displaystyle \ alpha _ {0} = {\ frac {\ theta ^ {2}} {\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}})}}$ ${\ displaystyle \ alpha <\ alpha _ {0}}$ ${\ displaystyle \ alpha> \ alpha _ {0}}$ ${\ displaystyle \ alpha _ {0}}$ ${\ displaystyle \ operatorname {MSE} ({\ hat {\ theta}} _ {\ alpha})}$

Den gjennomsnittlige kvadratfeilen er derfor minimal for .

{\ displaystyle {\ hat {\ theta}} _ {\ alpha _ {0}} = {\ frac {\ theta ^ {2}} {\ theta ^ {2} + \ operatorname {MSE} ({\ bar { \ theta}})}} {\ bar {\ theta}} \, {\ overset {\ text {def}} {=}} \, {\ check {\ theta}}}

Dette minimumet er verdt:

{\ displaystyle {\ begin {align} \ operatorname {MSE} ({\ check {\ theta}}) & = \ operatorname {MSE} ({\ hat {\ theta}} _ {\ alpha _ {0}}) \\ & = (\ alpha _ {0} -1) ^ {2} \ theta ^ {2} + \ alpha _ {0} ^ {2} \ operatorname {MSE} ({\ bar {\ theta}}) \\ & = \ left (- {\ frac {\ operatorname {MSE} ({\ bar {\ theta}})} {\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}} )}} \ høyre) ^ {2} \ theta ^ {2} + \ left ({\ frac {\ theta ^ {2}} {\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}})}} \ right) ^ {2} \ operatorname {MSE} ({\ bar {\ theta}}) \\ & = {\ frac {\ theta ^ {2} \ operatorname {MSE} ({\ bar {\ theta}}) ^ {2} + \ theta ^ {4} \ operatorname {MSE} ({\ bar {\ theta}})} {\ left (\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}} \ høyre) ^ {2}}} \\ & = {\ frac {\ left (\ theta ^ {2} \ operatorname {MSE} ({\ bar {\ theta}} ) \ høyre) \ venstre (\ operatorname {MSE} ({\ bar {\ theta}}) + \ theta ^ {2} \ right)} {\ left (\ theta ^ {2} + \ operatorname {MSE} ( {\ bar {\ theta}}) til høyre) ^ {2}}} \\ & = {\ frac {\ theta ^ {2} \ operatorname {MSE} ({\ bar {\ theta}})} {\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}})}} end {aligned}}}

Merk: verdien av å være ukjent av natur (ellers vil vi ikke se etter en estimator), denne formelen er kun av praktisk interesse hvis koeffisienten forenkler til en konstant uavhengig av , det vil si om og bare hvis er proporsjonal med ( se eksempel nedenfor). $\ theta$ ${\ displaystyle {\ tfrac {\ theta ^ {2}} {\ theta ^ {2} + \ operatorname {MSE} ({\ bar {\ theta}})}}}$ $\ theta$ ${\ displaystyle \ operatorname {MSE} ({\ bar {\ theta}})}$ ${\ displaystyle \ theta ^ {2}}$

Nytte

Sammenligning av estimatorer

Hvis de to estimatorene som skal sammenlignes er upartiske, er den mer effektive estimatoren ganske enkelt den med den minste variansen. På samme måte, hvis en estimator har både en større skjevhet (i absolutt verdi) og en større avvik enn en annen estimator, er sistnevnte åpenbart bedre.

Imidlertid, hvis en estimator har en større skjevhet (i absolutt verdi), men en mindre varians, er sammenligningen ikke lenger umiddelbar: den gjennomsnittlige kvadratfeilen gjør det mulig å bestemme.

Eksempel:

La oss sammenligne de to vanligste variansestimatørene:

{\ displaystyle s_ {n-1} ^ {2} \, {\ overset {\ text {def}} {=}} \, {\ frac {1} {n-1}} \ sum _ {i = 1 } ^ {n} \ left (y_ {i} - {\ overline {y}} \ right) ^ {2}}

{\ displaystyle s_ {n} ^ {2} \, {\ oversett {\ text {def}} {=}} \, {\ frac {1} {n}} \ sum _ {i = 1} ^ {n } \ left (y_ {i} - {\ overline {y}} \ right) ^ {2} = {\ frac {n-1} {n}} s_ {n-1} ^ {2}}

For en trekning med utskiftning og en sannsynlighet lov hvis normalisert kurtosis er antatt å være lik null ( for eksempel det normale lov ), viser beregningene at (se Greene, avsnitt C.5.1):

{\ displaystyle \ mathbb {E} (s_ {n-1} ^ {2}) = \ sigma ^ {2}}

hvorfra ,

{\ displaystyle \ operatorname {Bias} (s_ {n-1} ^ {2}) = 0}

{\ displaystyle \ operatorname {Var} (s_ {n-1} ^ {2}) = {\ frac {2 \ sigma ^ {4}} {n-1}}}

hvorfra ;

{\ displaystyle \ operatorname {MSE} (s_ {n-1} ^ {2}) = {\ frac {2 \ sigma ^ {4}} {n-1}}}

{\ displaystyle \ mathbb {E} (s_ {n} ^ {2}) = {\ frac {n-1} {n}} \ mathbb {E} (s_ {n-1} ^ {2}) = { \ frac {n-1} {n}} \ sigma ^ {2}}

hvorfra ,

{\ displaystyle \ operatorname {Bias} (s_ {n} ^ {2}) = - {\ frac {\ sigma ^ {2}} {n}}}

{\ displaystyle \ operatorname {Var} (s_ {n} ^ {2}) = \ left ({\ frac {n-1} {n}} \ right) ^ {2} \ operatorname {Var} (s_ {n -1} ^ {2}) = \ left ({\ frac {n-1} {n}} \ right) ^ {2} {\ frac {2 \ sigma ^ {4}} {n-1}} = {\ frac {2 (n-1) \ sigma ^ {4}} {n ^ {2}}}}

hvorfra .

{\ displaystyle \ operatorname {MSE} (s_ {n} ^ {2}) = {\ frac {(2n-1) \ sigma ^ {4}} {n ^ {2}}}}

Estimatoren er upartisk, men har større varians (lavere effektivitet) enn estimatoren . ${\ displaystyle s_ {n-1} ^ {2}}$ ${\ displaystyle s_ {n} ^ {2}}$

Sammenligningen av de gjennomsnittlige kvadratiske feilene gir:

{\ displaystyle \ operatorname {MSE} (s_ {n} ^ {2}) - \ operatorname {MSE} (s_ {n-1} ^ {2}) = \ sigma ^ {4} \ left ({\ frac { 2n-1} {n ^ {2}}} - {\ frac {2} {n-1}} \ right) = - {\ frac {(3n-1) \ sigma ^ {4}} {n ^ { 2} (n-1)}} <0}

Den partiske estimatoren er derfor bedre når det gjelder gjennomsnittlig kvadratfeil. ${\ displaystyle s_ {n} ^ {2}}$

Fortsatt når det gjelder uavgjort med erstatning og null kurtose, ved å bruke minimeringssatsen gitt ovenfor til den objektive estimatoren , finner vi at estimatoren er estimatoren som minimerer den gjennomsnittlige kvadratiske feilen, den siste er gyldig da . ${\ displaystyle s_ {n-1} ^ {2}}$ ${\ displaystyle s_ {n + 1} ^ {2} = {\ frac {n} {n + 1}} s_ {n} ^ {2} = {\ frac {n-1} {n + 1}} s_ {n-1} ^ {2}}$ ${\ displaystyle {\ frac {2 \ sigma ^ {4}} {n + 1}}}$

Estimatorens konvergens

Det er mulig å bestemme om en estimator er konvergent i sannsynlighet fra sin gjennomsnittlige kvadratiske feil, vi har faktisk:

Teorem - ${\ displaystyle \ left [\ left (\ lim _ {n \ to \ infty} \ mathbb {E} ({\ hat {\ theta}}) = \ theta \ quad \ mathbf {and} \ quad \ lim _ { n \ to \ infty} \ operatorname {Var} ({\ hat {\ theta}}) = 0 \ right) \ Leftrightarrow \ lim _ {n \ to \ infty} \ operatorname {MSE} ({\ hat {\ theta }}) = 0 \ høyre] \ Rightarrow {\ hat {\ theta}} {\ xrightarrow {p}} \ theta}$

Demonstrasjonen er laget på sidekonvergens av tilfeldige variabler .

Generalisering

I en mer generell ramme for en multiparametrisk modell hvor man søker å estimere flere parametere eller for å estimere en funksjon av en eller flere parametere, den midlere kvadratfeil for en estimator av er definert ved: $f (\ theta)$ $\ delta$ $f (\ theta)$

Definisjon - ${\ displaystyle \ mathbb {E} \ left [^ {t} (\ delta -f (\ theta)) A (\ delta -f (\ theta)) \ right]}$

hvor A er en positiv bestemt symmetrisk matrise (som definerer derfor et dot produkt ).

Merknader og referanser

Merknader

Mer generelt alltid for prøvetaking med erstatning , har vi: . ${\ displaystyle \ operatorname {Var} (s_ {n-1} ^ {2}) = \ left ({\ frac {\ gamma _ {2}} {n}} + {\ frac {2} {n-1 }} \ høyre) \ sigma ^ {4}}$

Referanser

Se også

Bibliografi

(no) William H Greene , Econometrics , Paris, Pearson Education,2005, 5 th ed. , 943 s. ( ISBN 978-2-7440-7097-6 ) , s. 2

Relaterte artikler