Kanonisk analyse av sammenhenger

Den kanoniske korrelasjonsanalysen , noen ganger kalt kanonisk korrelasjonsanalyse ( kanonisk korrelasjonsanalyse - engelsk), sammenligner to kvantitative variabelgrupper som brukes begge på de samme individene. Målet med kanonisk analyse er å sammenligne disse to gruppene av variabler for å finne ut om de beskriver det samme fenomenet, i så fall kan man klare seg uten en av de to gruppene av variabler.

Et talende eksempel er det av de medisinske analysene som er utført på de samme prøvene av to forskjellige laboratorier. Kanonisk analyse generaliserer metoder så forskjellige som multippel lineær regresjon , diskriminerende analyse og faktoriell korrespondanseanalyse .

Matematisk definisjon

Er to kolonnevektorer X og Y med respektive dimensjoner n og m : og av tilfeldige variabler som har et øyeblikk av ordre to ferdig. Vi kan definere den tverr kovarians som matriks av størrelsen n x m hvis element ( i , j ) er kovariansen til x i og y j . I praksis er dette ofte kovariansen beregnet fra en prøve av X og Y, det vil si, etter to matriser hver kolonne som er en utførelsesform av X og Y . ${\ displaystyle X = (x_ {1}, \ prikker, x_ {n}) ^ {\ mathrm {T}}}$ ${\ displaystyle Y = (y_ {1}, \ prikker, y_ {m}) ^ {\ mathrm {T}}}$ ${\ displaystyle \ Sigma _ {XY} = \ operatorname {cov} (X, Y)}$

Kanonisk korrelasjonsanalyse ser etter to vektorer a og b med respektive dimensjoner n og m som maksimerer korrelasjonen mellom punktproduktene ( a · X) og ( b · Y) . Med andre ord:

${\ displaystyle (a ^ {*}, b ^ {*}) = {\ undersett {(a, b)} {\ operatorname {argmax}}} \ operatorname {corr} (a ^ {\ mathrm {T}} X, b ^ {\ mathrm {T}} Y)}$

De tilfeldige variablene U = a · X og V = b · Y er det første paret av kanoniske variabler . Vi kan deretter gjenta prosedyren for å oppnå et andre par variabler som ikke er knyttet til den første.

Merknader og referanser

Merknader

Referanser

Spesialiserte bøker

Saporta 2006 , s. 189-190

Artikler publisert på internett

[PDF] Frédéric Bertran, " kanonisk analyse " ,2005(åpnet 15. november 2011 )
[PDF] (en) Ignacio Gonzalez, Sébastien Déjean, Pascal GP Martin, Alain Baccini, " " CCA: An R Package to Extend Canonical Correlation Analysis " " ,2008(åpnet 19. november 2011 )

Se også

Bibliografi

(fr) Gilbert Saporta , Sannsynlighet, Dataanalyse og statistikk , Paris, Editions Technip,2006, 622 s. ( ISBN 978-2-7108-0814-5 , les online ).

Relaterte artikler

Eksterne linker

FactoMineR, et bibliotek med R-funksjoner for dataanalyse
Dataanalysekurs gitt ved Paris Institute of Political Studies