Den kanoniske korrelasjonsanalysen , noen ganger kalt kanonisk korrelasjonsanalyse ( kanonisk korrelasjonsanalyse - engelsk), sammenligner to kvantitative variabelgrupper som brukes begge på de samme individene. Målet med kanonisk analyse er å sammenligne disse to gruppene av variabler for å finne ut om de beskriver det samme fenomenet, i så fall kan man klare seg uten en av de to gruppene av variabler.
Et talende eksempel er det av de medisinske analysene som er utført på de samme prøvene av to forskjellige laboratorier. Kanonisk analyse generaliserer metoder så forskjellige som multippel lineær regresjon , diskriminerende analyse og faktoriell korrespondanseanalyse .
Er to kolonnevektorer X og Y med respektive dimensjoner n og m : og av tilfeldige variabler som har et øyeblikk av ordre to ferdig. Vi kan definere den tverr kovarians som matriks av størrelsen n x m hvis element ( i , j ) er kovariansen til x i og y j . I praksis er dette ofte kovariansen beregnet fra en prøve av X og Y, det vil si, etter to matriser hver kolonne som er en utførelsesform av X og Y .
Kanonisk korrelasjonsanalyse ser etter to vektorer a og b med respektive dimensjoner n og m som maksimerer korrelasjonen mellom punktproduktene ( a · X) og ( b · Y) . Med andre ord:
De tilfeldige variablene U = a · X og V = b · Y er det første paret av kanoniske variabler . Vi kan deretter gjenta prosedyren for å oppnå et andre par variabler som ikke er knyttet til den første.