Wardin menetelmä

Luonto	Datan osioinnin algoritmi ( d )

In tilastoja , ja erityisemmin arvojärjestyksen , Ward menetelmä on algoritmi, joka mahdollistaa kaksi luokkaa osion kootaan yhteen, jotta saadaan enemmän yhteen osioon.

Määritelmät

Inertia

jos on joukko yksilöitä, painopisteen , jaetaan k luokkiin numeroita , että me kutsumme joka on yhtä painopistettä sitten $G = \ {e_ {i} ~: ~ i = \ {1: n \} \}$ $g ~$ $n_ {1}, ~ n_ {2}, ~ .., ~ n_ {k}$ $G_ {1}, ~ G_ {2}, ~ .., ~ G_ {k}$ $g_ {1}, ~ g_ {2}, ~ .., ~ g_ {k}$

pilven kokonaishitaus on yhtä suuri kuin: missä d on etäisyys

{\ displaystyle I_ {t} = {\ frac {1} {n}} \ summa _ {i = 1} ^ {n} d (e_ {i}, g) ^ {2} ~}

luokkien välinen inertia on yhtä suuri kuin:

{\ displaystyle I_ {e} = {\ frac {1} {n}} \ summa _ {i = 1} ^ {k} n_ {i} \ kertaa d (g_ {i}, g) ^ {2}}

luokan sisäinen inertia on yhtä suuri kuin:

{\ displaystyle I_ {a} = {\ frac {1} {n}} \ summa _ {i = 1} ^ {k} \ summa _ {j = 1} ^ {n_ {i}} d (e_ {j }, g_ {i}) ^ {2}}

Menetelmä

Wardin menetelmä koostuu luokkien ryhmittelemisestä siten, että luokkien välisen inertian kasvu on suurin tai, mikä on sama Huygensin lauseen mukaan , niin että luokan sisäisen inertian kasvu on minimaalista.

Huomautuksia ja viitteitä

Huomautuksia

Viitteet

Erikoistuneet kirjat

Saporta 2006 , s. 258.

Internetissä julkaistut artikkelit

[PDF] Mireille Summa-Gettler, Catherine Pardoux, “ La Classification Automatic ” (käytetty 26. marraskuuta 2011 ) .

Katso myös

Bibliografia

fr) Gilbert Saporta , todennäköisyys, tietojen analysointi ja tilastot , Pariisi, Éditions Technip,2006, 622 Sivumäärä ( ISBN 978-2-7108-0814-5 , lue verkossa ).

Aiheeseen liittyvät artikkelit

Sisäiset linkit

Ulkoiset linkit

Tietojen analysointikurssi Pariisin poliittisen instituutin instituutissa