Rajoitettu Boltzmann-kone

Vuonna koneoppimisen The Boltzmannin kone rajoitettu on eräänlainen keinotekoinen hermoverkko varten ohjaamaton oppiminen . Sitä käytetään yleisesti arvioimaan tietojoukon todennäköisyysjakauma . Sen keksi alun perin nimellä Harmonium vuonna 1986 Paul Smolenski.

Kuvaus

Yksinkertaisimmassa muodossaan Boltzmann-kone koostuu kerroksesta hermosoluja, jotka saavat syötteen, sekä piilotetusta neuronikerroksesta. Jos oletetaan, että saman kerroksen neuronit ovat toisistaan riippumattomia, kutsumme tätä kokoonpanoa rajoitetuksi Boltzmann-koneeksi (RBM).

Määritämme aktivoidun energian rajoitetulle Boltzmann-koneelle seuraavasti:

${\ displaystyle E = - \ left (\ summa _ {i, j} w_ {ij} \, x_ {i} \, h_ {j} + \ summa _ {i} b_ {i} \, x_ {i} + \ summa _ {j} c_ {j} h_ {j} \ oikea)}$

Kanssa:

$w _ {{ij}}$ on hermosolun ja neuronin välinen paino ; $j$ $i$
$x_ {i}$ on näkyvän hermosolun tila ; $x_ {i} \ sisään \ {0,1 \}$ $i$
${\ textstyle h_ {j}}$ on piilotetun neuronin tila ; ${\ textstyle j}$
$bi}$ ja ovat vastaavasti neuronien ja . $c_ {j}$ $x_ {i}$ $h_ {j}$

Yhteinen todennäköisyys, jonka muoto on tällöin ${\ displaystyle (x_ {i}, h_ {j})}$

${\ displaystyle P (x_ {i}, h_ {j}) = \ exp (-E (x_ {i}, h_ {j})) / Z}$

Kanssa:

$E$ edellä määritelty energiatoiminto;
$Z$ normalisointitoiminto, joka saa kaikkien todennäköisyyksien summan olemaan 1.

Oppiminen

Boltzmannin kone harjoittaa valvomatonta oppimista. Yritämme minimoida lokin todennäköisyyden . Loki-todennäköisyyden johdannainen antaa seuraavan lausekkeen:

${\ displaystyle {\ frac {\ osittainen \ vasen [- \ loki (p (x ^ {(t)})) \ oikea]} {\ osittainen \ theta}} = \ mathbb {E} _ {h} \ vasen [{\ frac {\ osittainen E (x ^ {(t)}, h)} {\ osittainen \ theta}} | x ^ {(t)} \ oikea] - \ mathbb {E} _ {x, y} \ vasen [{\ frac {\ osittainen E (x, h)} {\ osittainen \ theta}} \ oikea]}$

Kanssa:

$\ theta$ järjestelmämuuttujat (painot tai esijännitykset);
${\ displaystyle \ mathbb {E} _ {x, y}}$ matemaattinen odotus satunnaismuuttujien ja ; $x$ $y$
${\ displaystyle x ^ {(t)}}$ tietojoukon arvo ;
${\ displaystyle E (x, h)}$ edellä määritelty energia.

Huomaamme, että tässä lausekkeessa on kaksi termiä, nimeltään positiivinen vaihe ja negatiivinen vaihe. Positiivinen vaihe lasketaan helposti esijännitykselle ja painomatriisille.

Sitten saamme:

${\ displaystyle \ mathbb {E} _ {h} \ vasen [{\ frac {\ osittainen E (x ^ {(t)}, h)} {\ osittainen W_ {ij}}} | x ^ {(t) } \ right] = - h (x ^ {(t)}) * {x ^ {(t)}} ^ {\ mathsf {T}}}$

Kun h (x) on piilotetun kerroksen tila, joka tietää kaavan antaman x: n

${\ displaystyle h (x) = sigm (W * x + b)}$

Monimutkaisin osa on laskea niin kutsuttu negatiivinen vaihe . Emme voi laskea sitä suoraan, koska emme tiedä järjestelmän normalisointitoimintoa. Kaltevuuden laskeutumisen suorittamiseksi lasketaan ns . Merkinnän rekonstruktio . Itse asiassa järjestelmän symmetriaominaisuudet mahdollistavat mallin arvioiman tulon laskemisen, riittää, että käytetään kaavaa: ${\ displaystyle x ^ {(t)}}$

${\ displaystyle x_ {rec} = W ^ {\ mathsf {T}} * h (x) + c}$

kanssa esijännitteen piilotettu kerros neuronien . $vs.$ $H$

Samoin piilotetun kerroksen tila voidaan laskea uudelleen toistamalla prosessi. Lopuksi voimme tiivistää gradientin laskeutumisalgoritmin seuraavasti (puhumme Contrastive Divergence -algoritmista , joka on yleisesti lyhennetty CD-k)

x <= x(t) h <= W*x + b phasePositive <= -h*Transpose(x) Pour i allant de 1 à k: x = Transpose(W) * h(x) + c h = W*x + b phaseNegative <= -h*transpose(x) gradient <= phasePositive-phaseNegative W <= W + alpha*gradient c <= c + alpha*(x(t)-x) b <= b + alpha*(h(x(t)) - h)

Laajennus

Rajoitettu Boltzmann-kone on itse asiassa Boltzmann-koneen erityistapaus, jossa saman kerroksen neuronit ovat toisistaan riippumattomia. Tämä likiarviointi helpottaa suuresti laskelmia, mutta saadut tulokset ovat vähemmän hyvät.

Aiheeseen liittyvät artikkelit

Huomautuksia ja viitteitä

(sisään) Paul Smolensky , David E. Rumelhart ( ohjaaja ) ja James L. McClelland ( toim. ), Parallel Distributed Processing : Explorations in the Microstructure of Cognition, Volume 1: Foundations , MIT Press ,1986, 194–281 Sivumäärä ( ISBN 0-262-68053-X , lue verkossa ) , "Luku 6: Tietojenkäsittely dynaamisissa järjestelmissä: harmonian teorian perusteet"
Ruslan Salakhutdinov ja Geoffrey Hinton, "Deep Boltzmann Machines" , julkaisussa AISTATS 2009 , 2009( lue verkossa ).
http://image.diku.dk/igel/paper/AItRBM-proof.pdf
http://www.cs.toronto.edu/~tijmen/pcd/pcd.pdf