Kullback-Leibler divergens

I sannsynlighetsteori og informasjonsteori er Kullback-Leibler (eller KL-divergens , eller relativ entropi ) et mål på ulikhet mellom to fordelinger av sannsynligheter. Det skylder navnet sitt til Solomon Kullback og Richard Leibler , to amerikanske kryptanalytikere. I følge NSA , var det i løpet av 1950-tallet, mens de jobbet for dette byrået, at Kullback og Leibler oppfant dette tiltaket. Det ville også ha tjent NSA i sitt kryptanalysearbeid for Venona-prosjektet .

Introduksjon og bakgrunn

Tenk på to sannsynlighetsfordelinger P og Q. Vanligvis representerer P data, observasjoner eller en nøyaktig beregnet sannsynlighetsfordeling. Fordeling Q representerer typisk en teori, en modell, en beskrivelse eller en tilnærming til P . Kullback-Leibler-divergensen tolkes som den gjennomsnittlige forskjellen i antall biter som trengs for å kode eksempler på P ved hjelp av en kode optimalisert for Q i stedet for koden optimalisert for P .

Definisjon

Det er flere definisjoner avhengig av antakelsene om sannsynlighetsfordelingene.

Første definisjoner

For to diskrete sannsynlighetsfordelinger P og Q er Kullback-Leibler-divergensen av P med hensyn til Q definert av

.

For kontinuerlige P- og Q- fordelinger bruker vi en integral

hvor p og q er de respektive tettheter av P og Q .

Med andre ord er Kullback-Leibler-divergensen forventningen om forskjellen mellom logaritmene til P og Q, og tar sannsynligheten P for å beregne forventningen.

Generelle definisjoner

Vi kan generalisere de to spesifikke tilfellene ovenfor ved å vurdere P og Q to mål definert på et sett X , absolutt kontinuerlig med hensyn til et mål  : Radon-Nikodym-Lebesgue-setningen sikrer eksistensen av tetthetene p og q med og vi deretter spørre

forutsatt at riktig mengde eksisterer. Hvis P er absolutt kontinuerlig med hensyn til Q , (som er nødvendig hvis det er endelig), er da Radon-Nikodym-derivatet av P med hensyn til Q, og vi får

,

hvor man erkjenner entropien av P med hensyn til Q .

Tilsvarende, hvis Q er absolutt kontinuerlig med hensyn til P , har vi det

I begge tilfeller ser vi at Kullback-Leibler-avviket ikke avhenger av tiltaket

Når logaritmene til disse formlene er tatt i base 2, blir informasjonen målt i bits ; når basen er null , er enheten nat .

Eksempel

Kullback gir følgende eksempel (tabell 2.1, eksempel 2.1). La P og Q være fordelingen gitt i tabellen og figuren. P er fordelingen på venstre side av figuren, det er en binomialfordeling med N = 2 og p = 0,4. Q er fordelingen av høyre side av figuren, en diskret uniform fordeling med tre verdier x = 0, 1 eller 2, hver med sannsynlighet p = 1/3.

To distribusjoner for å illustrere Kullback - Leibler divergens

0 1 2
Fordeling P 0,36 0,48 0,16
Q-fordeling 0,333 0,333 0,333

KL-avviket beregnes som følger. Vi bruker den naturlige logaritmen.

Eiendommer

Bevis (diskret sak)

Nå er logaritmen strengt konkav, og bruker Jensens ulikhet :

Med likhet er iff konstant nesten overalt . (på grunn av den strenge konkaviteten) I dette tilfellet kan konstanten bare være lik 1 siden de to funksjonene P og Q er sannsynligheter. Derav egenskapene.

Diskusjon

Selv om den ofte oppfattes som en avstand , oppfyller den ikke betingelsene: den er ikke symmetrisk og respekterer ikke den trekantede ulikheten.

Kullback-Leibler-avviket faller inn i den større kategorien av f- avvik, introdusert uavhengig av Csiszár i 1967 og av Ali og Silvey i 1966. Ved å tilhøre denne familien respekterer den egenskapene til bevaring av informasjon: invarians, monotonisitet.

Utfyllende er Kullback-Leibler-divergensen også en Bregman-divergens , assosiert med den potensielle funksjonen . Konsekvensen er at dette avvik ved Legendre transformasjon av er forbundet med en dobbelt dreiemoment koordinatsystem for å representere fordelinger av den eksponentielle familien .

Merknader og referanser

  1. Kullback og Leibler 1951 .
  2. Kullback 1959 .
  3. S. Kullback , informasjonsteori og statistikk , John Wiley & Sons ,1959. Gjenutgitt av Dover Publications i 1968; omtrykket i 1978: ( ISBN  0-8446-5625-9 ) .
  4. Amari og Nagaoka 2000 .
  5. Csiszár 1967 .
  6. Ali og Silvey 1967 .
  7. Amari 2010 .
  8. Bregman 1967 .

Vedlegg

Bibliografi

Se også

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">