Eksponentiaalinen perhe

Eksponentiaalista perhe on matemaattinen esine, jonka on vuonna todennäköisyys ja tilastot , luokan ja jakaumat , joiden yleinen muoto saadaan:

missä on satunnaismuuttuja, parametri ja sen luonnollinen parametri.

Algebralliset ominaisuudet

Eksponentiaalisilla perheillä on tiettyjä huomattavia algebrallisia ominaisuuksia.

Eksponentiaalisen perhejakauman luonnehdinta mahdollistaa uudelleenjaon muotoilun käyttämällä ns. Luonnollisia parametreja .

Yleisissä tilastoissa ne helpottavat otantatilastojen , toisin sanoen perheen luonnollisten riittävien tilastojen saamista , jotka tiivistävät otoksen tiedoista käyttämällä pienempää määrää arvoja.

Vuonna Bayes tilastot , heillä konjugaatti priores jotka helpottavat ajantasaistamista niin sanottu "subjektiivinen" jakaumat.

Lisäksi eksponentiaalisen perheen satunnaismuuttujan a posteriori ennakoiva jakauma (konjugaattiprioriteetilla) voidaan aina kirjoittaa suljetussa muodossa (edellyttäen, että eksponentiaalisen perheen normalisointikerroin voidaan itse kirjoittaa läheiseen muotoon). On kuitenkin huomattava, että usein nämä jakaumat eivät itse ole eksponentiaalisia perheitä . Yleisiä esimerkkejä: laki t Opiskelija , beeta-binominen jakauma tai Dirichlet- monikokoinen.

Eksponentiaaliset perheet esiintyvät luonnollisesti etsittäessä jakaumia tilastollisten sovellusten aikana, erityisesti Bayesin menetelmissä .

Eksponentiaalinen perhe sisältää monia yleisimpiä jakaumia: normaali , eksponentiaalinen , gamma , χ 2 , beeta , Dirichlet, Bernoulli , Bernoulli-monikokoinen, Poisson , Wishart , käänteinen Wishart jne. Muut yleiset jakaumat muodostavat eksponentiaaliperheen vain, jos tietyt parametrit ovat kiinteitä ja tunnetun arvon, kuten binomi- ja multinomijakaumat (kiinteän lukumäärän kohdalla molemmissa tapauksissa) ja negatiiviset binomiaaliset (useiden epäonnistumisten tapauksessa). . Niistä yleisessä käytössä olevista jakeluista, jotka eivät ole eksponentiaalisia perheitä, voidaan mainita Studentin t- laki , useimmat seokset , samoin kuin perhe, jossa yhtenäiset jakaumat ovat kiinnittämättömiä rajoja.

Alkuperä ja terminologia

Georges Darmois , EJG Pitman ja Bernard Koopman kehittivät käsitteen eksponentiaalisesta perheestä vuosina 1935/36 .
Termiä eksponentiaaliluokka käytetään joskus samassa merkityksessä.

Tarkkaan ottaen jakauma määritellään sen muotoilussa käytettyjen vakioiden erityisarvojen avulla: esimerkiksi normaalijakauma antaa normaalijakauman keskiarvolla ja keskihajonnalla . Jakaumien "perhe" määritellään yhdellä tai useammalla muuttujaparametrilla: esimerkiksi Poisson-perheillä . Tätä perhettä voidaan pitää eksponentiaalisena, kun tiheys- / todennäköisyysfunktio saa tietyn algebrallisen muodon satunnaismuuttujan ja parametrien välillä: tekijöiden erottaminen.

Käytännössä kuitenkin puhutaan eksponentiaalinen perhe, jossa meidän täytyy mainita eksponentiaalinen perheiden aivan kuten puhumme jakelusta sanomaan "jakeluperhe". Siksi sanomme tavallisesti normaalijakauman viittaavan normaalijakaumien perheeseen, jonka keskiarvo ja varianssi ovat tuntemattomat .

  1. Jos molemmat n ja p saivat tietyn arvon (esim. N = 20, p = 0,1), on ainutlaatuinen binomijakauma.
  2. Jos n on saanut tietyn arvon ( n = 20), mutta p voi vaihdella, se on binomijakaumaperhe, jolle on tunnusomaista parametri p . n on vakio eikä parametri.
  3. Jos n ja p voivat molemmat vapaasti vaihdella, se on suurempi binomijakaumaperhe, parametreilla n ja p .

Kolme tilannetta kutsutaan yleensä "binomijakaumaksi", mutta vain toinen muodostaa eksponentiaalisen perheen.

Määritelmä

Eksponentiaalinen perhe on joukko jakaumia, joiden todennäköisyyslaki (diskreetti tai jatkuva) voidaan kirjoittaa erotettavissa olevien tekijöiden muodossa:

missä , , ja on määritelty.

Usein tiheys kirjoitetaan vaihtoehtoisessa muodossa

tai jopa

Arvo on perheparametri .

Satunnaismuuttuja voi edustaa useiden mittojen vektoria. Tässä tapauksessa on useiden muuttujien funktio. Olipa skalaari tai vektori, ja vaikka siinä olisi yksi parametri, toimii ja voi olla vektorien muoto.

Kanoninen muoto

Eksponentiaalisen perheen sanotaan olevan kanonisessa (tai luonnollisessa ) muodossa, kun . Eksponentiaalinen perhe voidaan aina muuntaa kanoniseksi muodoksi määrittämällä muunnettu parametri  :

Arvo η on perheen luonnollinen parametri .

Kanoninen muoto ei ole ainutlaatuinen, koska se voidaan kertoa nollasta poikkeavalla vakiolla edellyttäen, että se kerrotaan käänteisellä vakiolla.

Toiminto (vaihtoehtoisesti ) määritetään automaattisesti muiden toimintojen valinnalla: se varmistaa, että jakauma normalisoidaan (kaikkien arvojen summa tai integraali antaa todennäköisyyden, joka on yhtä suuri kuin 1). Huomaa, että nämä kaksi toimintoa ovat aina . Tämä tarkoittaa, että jos se ei ole bijektiivinen , ts. Jos useat arvot antavat saman arvon , niin kaikilla arvoilla, joilla on sama kuva , on sama arvo tai .

Vector eksponentiaalinen perhe

Vaikka yllä oleva määritelmä ilmaistaan ​​ensi silmäyksellä skalaariparametrina, se pysyy voimassa reaalilukujen vektoriparametrille . Jakauman sanotaan olevan vektorieksponenttiperhettä, jos tiheys (tai todennäköisyys, diskreetti) -funktio kirjoitetaan:

tai kompaktissa muodossa:

Summa kirjoitetaan vektoritoimintojen pistetulona ja .

Voimme myös tavata tyypin vaihtoehtoisen muodon:

Kuten aikaisemmin, eksponentiaalinen perhe on kanonisessa muodossa, jos kaikesta huolimatta .

Käyrävektorin eksponentiaalinen perhe

Vektori eksponentiaalinen perhe kutsutaan käyrän jos mitta parametrivektorin on pienempi kuin mitta vektorin , määrä toimintoja parametrin vektorin tekijöihin edustus.

Huomaa, että yleisimmät eksponentiaaliset perhejakaumat eivät ole kaarevia, joten monet eksponentiaalista perhettä varten suunnitellut algoritmit olettavat implisiittisesti tai nimenomaisesti, että jakauma ei ole kaareva.

Normalisointitoiminto tai voidaan aina kirjoittaa funktiona riippumatta en muunnoksista . Seuraava eksponentiaalinen perhe on "luonnollisessa muodossa" (parametrisoitu sen luonnollisella parametrilla):

tai:

Vektorimuuttuja

Aivan kuten skalaariparametri voidaan yleistää vektoriparametriksi, yksinkertainen satunnaismuuttuja (skalaari) voidaan yleistää satunnaismuuttujien vektorin yhteisjakaumaksi: jokainen skalaarimerkintä korvataan sitten vektorilla . On huomattava, että satunnaisvektorin mitat eivät välttämättä vastaa parametrivektorin ulottuvuutta eivätkä (kaarevan eksponentiaalisen funktion osalta) luonnollisen parametrin ulottuvuutta ja riittävää tilastoa .

Jakelu kirjoitetaan sitten:

tai:

Ominaisuudet

Määritelmissä esiintyvät funktiot T ( x ) , η ( θ ) ja A ( η ) eivät ole täysin mielivaltaisia. Niillä on tärkeä rooli tilastollisessa analyysissä.

T ( x ): n ulottuvuus on yhtä suuri kuin η : n parametrien lukumäärä .

Riippumaton ja identtisesti jaetun tiedon ( iid ) kokoelman riittävä tilasto on riittävien yksittäisten tilastojen summa. Bayesin arviossa se sisältää kaikki tarvittavat tiedot parametrien takajakauman laskemiseksi , riippuen havainnoista. Klassisessa arvioinnissa riittää, kun muodostetaan estimaattori parametreista.

tai Funktion A hyödyllisyys ilmestyy, kun on tarpeen laskea riittävän tilaston T ( x ) keskiarvo , varianssi ja muut momentit  : riittää erottamaan A ( η ) . Haluamme esimerkiksi laskea satunnaismuuttujan Gamma logaritmin odotuksen. Koska ln ( x ) on osa riittävää gammajakauman tilastoa , odotus voidaan helposti laskea johtamalla .

Factoring

Yksi tapa kuvata eksponentiaalista perhettä on jakaa se termien tulokseen, joista kukin sisältää yhden tyyppisen muuttujan, parametrin tai satunnaismuuttujan. Nämä tekijät esiintyvät joko suoraan tai eksponentissa (perus- tai eksponentti). Yleensä kertoimilla kerrottuna tekijöillä on siis oltava jokin seuraavista muodoista:

jossa f ( x ) ja h ( x ) ovat kaikki toiminnot x , g ( θ ) ja j ( θ ) ovat kaikki toimintoja θ  ; ja c on mielivaltainen termi "vakio" (ts. jolla ei ole x eikä θ ).

Lomake on hyväksyttävä, koska se otetaan huomioon eksponentissa. Sama .

Näiden tekijöiden määrä on kuitenkin rajallinen. Esimerkiksi lauseke on sama kuin kahden "sallitun" tekijän tulo. Kuitenkin sen laskettu muoto

ei ole vaadittua lomaketta. (Toisaalta tällainen ilmaisu muodostaa kaarevan eksponentiaalisen perheen , joka sallii useiden eksponenttiin sisältyvien termien.)

Kahta muuttujatyyppiä, kuten esimerkiksi tekijä [1+ f ( x ) g ( θ )] sisältävä summa ei aina sovellu tekijöihin. Tämä on syy, miksi esimerkiksi Cauchyn laki ja Studentin t eivät ole eksponentiaalista perhettä.

Esimerkkejä jaottelusta

Parametrien ja vakioiden välinen ero on olennainen määritettäessä, kuuluuko "jakauma" eksponentiaaliseen perheeseen vai ei.

Skalaariparametri

Normaalilla satunnaismuuttujalla , jonka keskiarvo μ ei ole tiedossa, mutta vaihteluväli σ 2, on tiheysfunktio

Kysymällä

näemme, että se on eksponentiaalinen perhe, jolla on yksi parametri μ .

Jos σ = 1 , se on kanonisessa muodossa, koska silloin η ( μ ) = μ .

Vector-parametri

Tuntematon keskiarvo μ ja tuntematon varianssi σ 2 ovat tiheysfunktio

on eksponentiaalinen perhe vektoriparametrilla ( μ , σ ), joka kirjoitetaan kanonisessa muodossa asettamalla

Diskreetti jakelu

Binomijakaumasta kanssa vakio määrä kiinnittää n on esimerkki erillisen eksponentiaalisen perhe. Sen todennäköisyystiheys

otetaan huomioon

.

Sen luonnollinen parametri on

kutsutaan logit- funktioksi .

Joukko eksponentiaalisia perheitä

Tämä taulukko näyttää valikoiman nykyisiä jakaumia ja niiden uudelleenkirjoittamista eksponentiaalisessa perheessä, jolla on luonnolliset parametrit, yleinen muoto

Suosimme funktionaalista muotoa log-osiointitoiminnolla A ( η ) , koska riittävän tilaston momentit voidaan helposti laskea johtamalla tämä viimeinen funktio. Olemme myös antaneet funktion A ( θ ) .

Pääsääntöisesti määritelmän tai tuen alue pysyy vakiona eksponentiaalisen perheen kaikkien jakaumien joukossa. Tämä selittää, miksi yllä kiinnitettyjen parametrien vaihtelu (kuten binomi, jossa on vaihteleva lukumäärä) tekee perheestä ei-eksponentiaalisen - kyseinen parametri vaikuttaa tukeen (tässä tapauksessa se muuttaa pienintä tai suurinta mahdollista arvoa). Samasta syystä myöskään Uniform-perhe ei ole eksponentiaalinen.

Weibull muoto parametri k sarja on eksponentiaalinen perhe. Muoto-parametri ei kuitenkaan muuta väliainetta. Tässä tapauksessa sen tiheysfunktion erityinen muoto ( k esiintyy eksponentin eksponentissa) estää Weibull-kertoimen, jos k vaihtelee.

  • Eivät ole eksponentiaalisen perheenjäsen: F jakaumat Fisher-Snedecor , Cauchyn , Hypergeometrinen ja logistinen . Samoin suurin osa jakautumisista, jotka johtuvat jakaumien äärellisestä tai äärettömästä seoksesta , eivät ole eksponentiaalisia perheitä: Gaussin seokset, "ison hännän" jakaumat, jotka muodostetaan koostumuksella, kuten Studentin t (normaalijakauman koostumus gammalain mukaan), Beeta-binomi ja Dirichlet-multinomi.


Jakelu parametri θ luonnollinen parametri η käänteisfunktio θ ( η ) perusmitta
b ( x )
riittävä tilasto T ( x ) loki-osio A ( η ) A ( θ )
Bernoulli s

( logit- toiminto )

( logistiikkatoiminto )

1 x
binomi
( vakio n )
s x
Kalastaa λ x λ
Negatiivinen binomi
( vakio r )
s ln ( p ) x - r ln (1– p )
Eksponentiaalinen λ –Λ 1 x
Pareto
(vähintään x m vakio)
a 1 ln ( x )
   

   
Weibull
( k vakio)
λ –Λ k x k
Laplace
( μ- vakio)
b 1 ln (2 b )
Chi-neliö v ln ( x )

  

   
Normaali
(vakio varianssi)
μ σ η
Normaali μ , σ 2
Loki-normaali μ , σ 2
Käänteinen normaali μ , λ
Gamma-Normaali α , β , μ , λ
  

  


      

Gamma r , λ 1

  
k , θ
Käänteinen gamma r , λ 1

  
Käänteinen chi-neliö ν , σ 2 1

  

      

Beeta α , β

  


  
Dirichlet α 1 , ..., α k 1
  

      

Monimuuttuja normaali μ , Σ

      


      

Wishart V , n 1

      


      


  

  • A ( η ) annetaan kolmessa muodossa momenttien laskemisen helpottamiseksi.
  • HUOMAUTUS : Muista, että Tr ( A'B ) = vec ( A ) • vec ( B )  ; eli jälki on matriisi tuote on kuin piste tuote . Matriisiparametreja pidetään eksponentiaalisessa vektorissa. Lisäksi V ja X ovat symmetrisiä.
Käänteinen toivelista Ψ , m 1

   


 


  

monikokoinen
( vakio n )
(= Multi-Bernoulli,
jos n = 1),
versio 1
p 1 , ..., p k

ja


0 0
Moninominen
( vakio n ) versio 2
p 1 , ..., s k -1

kanssa

Multinomiaalimuunnos johtuu siitä, että parametreja p i rajoittaa . Siksi on vain k -1 riippumatonta parametria.

  • Versiossa 1 näemme k luonnollista parametria ja yksinkertaisen suhteen tavallisten ja luonnollisten parametrien välillä. Kuitenkin vain luonnolliset parametrit k -1 ovat riippumattomia, ja yhtäkkiä k luonnollisten parametrien joukko on tunnistamaton. Normaalien parametrien rajoitus siirtyy samalla tavalla luonnollisiin parametreihin.

Huomaa, että versio 1 ei ole tavallinen eksponentiaalinen perhe. Se on kaareva eksponentiaalinen perhe, koska k- ulotteiseen avaruuteen sisällytetään k -1 riippumatonta parametria . Eksponentiaalisten perheiden perusominaisuudet eivät koske kaarevia eksponentiaalisia perheitä. Esimerkiksi näemme, että loki-osiointitoiminnolla A ( x ) on arvo 0.

  • Versio 2 näyttää yksinkertaisen tavan tehdä parametrit tunnistettaviksi asettamalla p k . Tämä pakottaa viimeksi luonnollinen parametrin vakioarvo 0. muita kaavoja on kirjoitettu siten, ettei käytön p k , niin että malli on vain k -1 parametrit, sekä normaali- muodossa ja kanonisessa muodossa.

Sovellukset

Tilastollinen päätelmä

Klassinen arvio: täydellisyys

Lause Pitman -Koopman- Darmois osoittaa, että yksi perheiden jakaumien joiden verkkotunnus on riippumaton parametri arvioidaan, vain eksponentiaalinen perheet tarjota riittävä tilasto, jonka ulottuvuus on edelleen rajoittuu kun näyte koko kasvaa.

Konkreettisesti olkoon X k , (missä k = 1, 2, 3, ... n ) riippumaton , identtisesti jakautunut satunnaismuuttuja . Niiden jakauman on oltava eksponentiaaliperhettä, jotta on olemassa riittävä tilasto T ( X 1 , ..., X n ), jonka skalaarikomponenttien määrä ei kasva otoksen koon n kanssa  : sen ulottuvuus ei muutu, kun keräämme lisää tietoja.

Bayesin arvio: konjugaattijakaumat

In Bayes-päättely , a priori jakauma parametrin, joka arvioidaan kerrotaan uskottavuuden funktio (normalisoidaan sitten) ja johtaa siihen, että jälkikäteen jakelu .

Konjugaatti prioritar on a priori jakauma , joka yhdistämisen jälkeen kanssa uskottavuuden funktio, antaa jälkikäteen jakauma samaa tyyppiä, mikä tekee siitä erityisen helppo laskea posterior. Esimerkiksi binomijakauman onnistumisen todennäköisyyden p arvioimiseksi, jos otamme prioriteetiksi beetajakauman, takaosa on toinen beetajakauma. Samoin Poisson-parametrin arvio gamma-prioriteetilla antaa posteriorisen gamman. Konjugaattiprioriteetit ovat usein erittäin käytännöllisiä joustavuutensa vuoksi.

Kun todennäköisyysfunktiolla on eksponentiaalinen perhe, on konjugaattiprioriteetti, jolla on yleensä myös eksponentiaalinen perhe. Pääsääntöisesti todennäköisyysfunktio ei ole eksponentiaalista perhettä, eikä siksi tule olemaan konjugaattiprioriteettia. Takapuoli on laskettava numeerisilla menetelmillä.

Konjugaattiprioriteetti π (" priorille ") eksponentiaalisen perheen parametrille η saadaan

tai

  • ν > 0 edustaa prioressin antamaa havaintojen virtuaalimäärää.
  • ( s on η: n ulottuvuus ) edustaa näiden näennäishavaintojen osuutta riittävässä tilastossa, joka koostuu kaikista havainnoista ja näennäishavainnoista.

χ ja ν ovat hyperparametreja (parametreja ohjaavat parametrit).

  • f ( χ , ν ) on muiden funktioiden automaattisesti määrittämä normalisointivakio, joka varmistaa, että π ( η | χ , ν ) on tiheysfunktio.
  • A ( η ) (tai A ( η ) ) ovat samat toiminnot kuin jakaumassa p ( x | χ ) , jolle π on konjugaattiprioriteetti.


Jos haluat nähdä, että tämä a priori -jakauma on konjugaattiprioriteetti, lasketaan takaosa.

Antaa olla tiheys (tai todennäköisyys) funktio havainto, eksponentiaalinen perhe, kirjoitettu luonnollisena parametrina:

Datan todennäköisyys X = ( x 1 , ..., x n ) saadaan seuraavasti:

Siksi soveltamalla yllä olevaa a priori -jakaumaa :

johdamme takaosan:

Siten takaosalla on sama muoto kuin etupuolella:

Huomaa, että huomautukset X syötä kaava vain kautta , toisin sanoen riittävä tilasto havaintojen. Tämä vahvistaa, että riittävän tilaston arvo määrittää täysin takajakauman . Havaintojen yksittäisiä arvoja ei vaadita; mikä tahansa tietojoukko, jolla on sama arvo riittävälle tilastolle, tuottaa saman jakauman. Muistakaamme nyt, että riittävän tilastotiedon ulottuvuus ei kasva otoksen koon mukaan: sillä on korkeintaan η : n komponenttien määrä (nimittäin yhden peruspisteen jakauman parametrien määrä).

Uudet hyperparametrit ovat


Bayesin päivitys edellyttää vain havaintojen määrän ja tietojen riittävän tilastollisen arvon tuntemista.

Hypoteesitestit: tasaisemmin tehokkaat testit

Eksponentiaaliselle perheelle, jolla on yksi parametri θ , jos η ( θ ) ei vähene, todennäköisyyssuhde on riittävän tilaston T ( x ) monotoninen funktio, joka ei vähene . Näin ollen, on olemassa "tasaisesti tehokkaampi" hypoteesi testi testi H 0  : ie ≥ ie 0 vastaanH 1  : θ < θ 0 .

Yleistetty lineaarinen malli

Eksponentiaalinen perhe on jakelutoimintojen perusta yleisessä lineaarisessa mallissa , joka sisältää suurimman osan regressiomalleista tilastossa ja ekonometriassa .

Hetket ja kumulatiiviset tilastot

T-kumulanttien laskeminen erilaistamalla

Momenttifunktio on T ( x ) on määritelty

Näin ollen, K ( u | r | ) = ( r | + u ) - ( r | ) on cumulant generoiva funktio ja T .

Huom. Luonnollisessa eksponentiaalisessa alaryhmässä (missä T ( x ) = x ) se on x: n momenttien generaattoritoiminto .

Määrittelemällä kumulanttien generaattoritoiminto,

Korkeammat tilaukset ja kumulantit saadaan korkeammilla johdannaisilla. Tämä tekniikka on erityisen hyödyllinen, kun T on monimutkainen toiminto, jonka momentteja on vaikea laskea integroimalla.

Tämä tulos voidaan osoittaa käyttämättä kumulatiivista teoriaa .

Esimerkki: joko

.

Normalisointirajoituksella

.

Johdetaan molemmat puolet verrattuna η  :

Siksi,

Esimerkkejä Gammalaki

Gammajakauma määritetään tiheysfunktion avulla

Yllä oleva taulukko antaa luonnollisen parametrin

joiden vastavuoroisuus on

Riittävät tilastot ovat (ln x , x ) ja loki-osio-funktio on

Etsimme riittävän tilaston keskiarvoa. For η 1  :

missä ψ ( x ) on digammafunktio (johdettu log-gammasta).

Vastaavasti η 2  : lle:

X: n varianssin löytämiseksi meidän on erotettava toisistaan:

Kaikki nämä laskelmat voidaan tehdä integroimalla, aloittaen gammafunktiosta , mutta tämä vaatii enemmän vaivaa.

Epäsymmetrinen logistiikkalaki

Antaa olla todellinen satunnaismuuttuja X, jolla on epäsymmetrinen logistinen jakauma .

missä θ > 0 on muodon parametri. Tämä tiheys otetaan huomioon seuraavasti:

Siksi se on eksponentiaalinen luonnonparametri η = - θ , joten riittävä tilasto on T = log (1 + e - x ) , ja log-osiointitoiminto on arvoltaan A ( η ) = –log ( θ ) = - Loki (- η ) .

Ensimmäisellä yhtälöllä

ja toisella,

Tässä esimerkissä menetelmän käyttö yksinkertaistaa laskelmia, suora lähestymistapa lisää huomattavasti tasa-arvoja.

Wishartin laki

Wishart jakauma on asetettu satunnaisesti matriiseja. Tämä viimeinen esimerkki koskee tapausta, jossa integraatio olisi erityisen vaikeaa. Huom. Johdanto itsessään on vaikeaa, koska se vaatii matriisilaskennan , mutta integraatio on huonompi.

Taulukko antaa luonnollisen parametrin

jonka vastavuoroinen muutos on

.

Riittävät tilastot ovat ( X , ln | X |) .

Loki-osio-funktio annetaan eri muodoissa erilaistumisen ja muunnosten helpottamiseksi. Käytämme seuraavia lomakkeita:

X: n odotus (liittyy η 1: een )

Johdannainen suhteessa η 1 perustuu tasa- arvomatriisin laskemiseen  :

Siitä lähtien :

koska V on symmetrinen.

Toivottavasti ln | X | (liittyy η 2: een )

Ensinnäkin kehitämme loki-osion osan, joka sisältää monivaiheisen gammafunktion  :

Esittelemme digamma-toiminnon .

Siitä lähtien :

Nämä kaksi odotukset ovat tarpeen johtaa variational mukauttaminen yhtälöt Bayes-verkon , joka on Wishart jakauma (joka on konjugaatti prioritar on monimuuttuja normaali ).

Suurin entropia

Suurin entropian todennäköisyysjakauma  (tuumaa)

Etsimme jakelua suurimmalla entropialla, ehdollisesti sarjaan odotuksia koskevia rajoituksia. Vastaus on eksponentiaalinen perhe.

Kattava entropia todennäköisyysjakauman dF ( x ) lasketaan suhteessa toiseen todennäköisyysjakauman (tai, yleisemmin, positiivinen toimenpide), siten, että molemmat toimenpiteet ovat keskenään täysin jatkuva . Anna pohja toimenpide dH ( x ) on sama tukea dF ( x ).

DF ( x ): n entropia suhteessa dH ( x ): een määritellään seuraavasti

missä dF / dH ja dH / dF ovat Radon-Nikodym-johdannaisia .

Huomaa, että tavanomainen määritelmä entropia diskreetti jakelu joukko Y , eli , oletetaan implisiittisesti, että toimenpide dH valitusta on laskenta toimenpide on Y . Samoin jatkuvalle jakaumalle H ( x ) = x antaa


Antaa olla otos havaittavista suuruuksista (satunnaismuuttujat) T j . Suurin entropia
jakauma dF suhteen dH , ehdollisesti että odotusarvo T j on yhtä suuri kuin t -j , on jäsen eksponentiaalisen perhe ottaa dH sen pohja toimenpide ja ( T 1 , ..., T n ) ja riittävä tilasto (t).

Tämä tulos on päätelty, että laskennassa muunnelmia käyttäen Lagrangen kertoimet . Normalisointi on taattu asettamalla rajoitus T 0 = 1. luonnollinen jakauman parametrit ovat Lagrangen kertoimet liittyvät t j ja normalisointikerroin on Lagrangen kertoimet liittyvät T 0 .

Huomautuksia ja viitteitä

  1. G. Darmois , "  Todennäköisyyden laeista tyhjentävän estimoinnin avulla  ", CR Acad. Sci. Paris , voi.  200,1935, s.  1265–1266.
  2. (julkaisussa) E. Pitman ja J. Wishart , "  riittävät tilastotiedot ja sisäinen tarkkuus  " , Cambridge Philosophical Societyn matemaattiset julkaisut , voi.  32, n o  4,1936, s.  567–579 ( DOI  10.1017 / S0305004100019307 ).
  3. (sisään) B Koopman , "  We Admitting distribution riittävä tilasto  " , Transaction of the American Mathematical Society , voi.  39, n o  3,1936, s.  399–409 ( DOI  10.2307 / 1989758 , JSTOR  1989758 , Math Reviews  1501854 ).
  4. Kupperman, M. (1958) "Hypoteesien todennäköisyydet ja informaatiotilastot otannassa eksponentiaaliluokan populaatioista", Annals of Mathematical Statistics , 9 (2), 571–575 JSTOR : 2237349 .
  5. (in) Erling etersen , riittävyys ja eksponentiaaliset perheet erillisille näytetiloille  " , Journal of the American Statistics Association , voi.  65, n o  331,Syyskuu 1970, s.  1248–1255 ( DOI  10.2307 / 2284291 , JSTOR  2284291 , Math Reviews  268992 ).

Katso myös

Bibliografia

  • (en) EL Lehmann , Casella, G., piste-estimoinnin teoria ,1998, 2. painos, Sec. 1.5  Sivumäärä
  • (en) Robert W. Keener , Tilastoteoria: Muistiinpanoja teoreettisen tilastotieteen kurssille , Springer,2006, 27–28, 32–33  Sivumäärä
  • (en) Ludwig Fahrmeier , Tutz, G., Yleismuotoisiin lineaarisiin malleihin perustuva monen muuttujan tilastollinen mallinnus , Springer,1994, 18–22, 345–349  Sivumäärä

Ulkoiset linkit


<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">