Underklasse | Borde |
---|---|
Oppfinner | Karl Pearson |
En beredskapstabell er en metode for å representere data som følge av en telling som gjør det mulig å estimere avhengigheten mellom to tegn. Den består i å krysse to tegn i en populasjon (for eksempel en aldersklasse og en poengsum) ved å telle tallet som tilsvarer sammenhengen "tegn 1" og "tegn 2".
Deltallene samles i en dobbel oppføringstabell, etter linje for det første tegnet og etter kolonne i henhold til det andre tegnet: dette er "beredskapstabellen".
Dette enkle verktøyet svarer på et avgjørende problem i statistikken: oppdagelsen av mulige avhengigheter mellom kvalitetene som er notert på individene i en befolkning. Eksistensen av betingede avhengigheter antyder faktisk muligheten for å lagre resultatene av en undersøkelse på en mer fortettet måte.
Begrepet pivottabell , foreslått av regneark , er en generalisering av den klassiske beredskapstabellen.
Begrepet beredskapstabell ble introdusert av den britiske statistikeren Karl Pearson i et essay med tittelen On Theory of Contingency and Its Relation to Association and Normal Correlation , i 1904.
Studier utføres på flere tegn, og prøver deretter å avgjøre om det er noen sammenheng mellom dem. For det studerer vi individene som identifiserer flere tegn samtidig.
Er for eksempel alder og hvor ofte blir du syk?
Alder / pasient | 0 ganger | 1 gang | 2 ganger | 3 ganger | Fire ganger |
---|---|---|---|---|---|
20 ≤ alder <30 år | 4 personer | 2 personer | 2 personer | 1 person | 1 person |
30 ≤ alder <40 år | 4 | 3 | 3 | 1 | 1 |
40 ≤ alder <50 år | 7 | 2 | 1 | 0 | 0 |
50 ≤ alder <60 år | 3 | 2 | 1 | 1 | 1 |
alder ≥ 60 år | 0 | 0 | 0 | 1 | 1 |
Beredskapstabellen fører naturlig til forestillingen om betinget sannsynlighet i det diskrete tilfellet.
Med en tabell med p- rader og q- kolonner, hvis vi betegner n ij tallet i skjæringspunktet mellom den i-raden (med p-rader) og den j-th-kolonnen, er det totale antallet sorterte individer etter tabellen:
På samme måte kan vi beregne totalene etter rad og kolonne:
Den delvise arbeidsstyrken n ij representerer en prosentandel f ij av den totale arbeidsstyrken:
Vi kan se på denne prosentandelen som en sannsynlighet (siden ): det er felles sannsynlighet for at et individ av den studerte befolkningen samtidig oppfyller kriteriet assosiert med rad i ( L i ) og med kolonne j ( C j ).
er sannsynligheten for at et individ svarer på betingelsen L i . er en betinget sannsynlighet: det er sannsynligheten for at et individ svarer på tilstanden L i å vite at han respekterer tilstanden C j .
og på samme måte:
Så vi har:
som er Bayes 'formel .
Med forrige eksempel, n = 42, og vi har for eksempel følgende resultater: