Wardin menetelmä
Wardin menetelmä
Luonto |
Datan osioinnin algoritmi ( d )
|
---|
In tilastoja , ja erityisemmin arvojärjestyksen , Ward menetelmä on algoritmi, joka mahdollistaa kaksi luokkaa osion kootaan yhteen, jotta saadaan enemmän yhteen osioon.
Määritelmät
Inertia
jos on joukko yksilöitä, painopisteen , jaetaan k luokkiin numeroita , että me kutsumme joka on yhtä painopistettä sittenG={ei : i={1:ei}}{\ displaystyle G = \ {e_ {i} ~: ~ i = \ {1: n \} \}}g {\ displaystyle g ~}ei1, ei2, .., eik{\ displaystyle n_ {1}, ~ n_ {2}, ~ .., ~ n_ {k}}G1, G2, .., Gk{\ displaystyle G_ {1}, ~ G_ {2}, ~ .., ~ G_ {k}}g1, g2, .., gk{\ displaystyle g_ {1}, ~ g_ {2}, ~ .., ~ g_ {k}}
pilven kokonaishitaus on yhtä suuri kuin: missä d on etäisyys
Minät=1ei∑i=1eid(ei,g)2 {\ displaystyle I_ {t} = {\ frac {1} {n}} \ summa _ {i = 1} ^ {n} d (e_ {i}, g) ^ {2} ~}
luokkien välinen inertia on yhtä suuri kuin:
Minäe=1ei∑i=1keii×d(gi,g)2{\ displaystyle I_ {e} = {\ frac {1} {n}} \ summa _ {i = 1} ^ {k} n_ {i} \ kertaa d (g_ {i}, g) ^ {2}}
luokan sisäinen inertia on yhtä suuri kuin:
Minäklo=1ei∑i=1k∑j=1eiid(ej,gi)2{\ displaystyle I_ {a} = {\ frac {1} {n}} \ summa _ {i = 1} ^ {k} \ summa _ {j = 1} ^ {n_ {i}} d (e_ {j }, g_ {i}) ^ {2}}
Menetelmä
Wardin menetelmä koostuu luokkien ryhmittelemisestä siten, että luokkien välisen inertian kasvu on suurin tai, mikä on sama Huygensin lauseen mukaan , niin että luokan sisäisen inertian kasvu on minimaalista.
Huomautuksia ja viitteitä
Huomautuksia
Viitteet
Erikoistuneet kirjat
-
Saporta 2006 , s. 258.
Internetissä julkaistut artikkelit
-
[PDF] Mireille Summa-Gettler, Catherine Pardoux, “ La Classification Automatic ” (käytetty 26. marraskuuta 2011 ) .
Katso myös
Bibliografia
-
fr) Gilbert Saporta , todennäköisyys, tietojen analysointi ja tilastot , Pariisi, Éditions Technip,2006, 622 Sivumäärä ( ISBN 978-2-7108-0814-5 , lue verkossa ).
Aiheeseen liittyvät artikkelit
Sisäiset linkit
Ulkoiset linkit