Mediaani (tilastot)

In todennäköisyys teoria ja tilastoja , mediaani on arvo, joka erottaa pohjan puoli ylhäältä puoli joukko ( näyte , populaatio , todennäköisyysjakauma ). Mediaani on siis intuitiivisesti kokonaisuuden keskipiste. Se on sarjan keskeinen suuntausindikaattori . Voimme määrittää mediaanin joukolle ei-numeerisia arvoja, kunhan voimme valita kriteerin näiden arvojen järjestykselle.

Laskentamenetelmä

Yleinen lähestymistapa

Arvoryhmän mediaanin määrittämiseksi riittää, kun järjestät arvot kasvavaan luetteloon ja valitset tämän luettelon keskellä olevan arvon. Järjestetylle n elementin luettelolle, jossa n on pariton, elementin arvo sijainnissa (n + 1) / 2 on mediaani. Jos alkioiden lukumäärä n on parillinen, mikä tahansa arvo elementtien välillä paikoissa (n-1) / 2 ja (n + 1) / 2 on mediaani; käytännössä numeroluettelon tapauksessa useimmiten käytetään näiden kahden keskeisen arvon aritmeettista keskiarvoa .

Monimutkaisuus algoritmin mediaanin laskemiseksi on siis monimutkaisuus lajittelualgoritmi käyttää, nimittäin O ( n log n ) on paras .

Esimerkkejä

Muu lähestymistapa

Arvoryhmän mediaanin määrittämiseksi riittää laskea kasvavat kumulatiiviset prosenttiosuudet ja otamme sarjan ensimmäisen arvon, jonka kumulatiivinen prosenttiosuus ylittää 50%.

Tämä menetelmä on käytännöllisempi, kun sinulla on suuri määrä arvoja.

Algoritmien tehokkuus

On olemassa lineaarisen monimutkaisuuden algoritmeja (O ( n ): ssä), joten tehokkaampia. Nämä ovat algoritmeja, jotka yleensä tekevät mahdolliseksi määrittää n elementin luettelon k- s elementti (katso Valinta-algoritmi ); k = n / 2 mediaanille. Nämä ovat lajittelualgoritmien mukautuksia, mutta ne ovat tehokkaampia, koska kaikki arvot eivät kiinnosta meitä. Esimerkiksi voimme jakaa ja hallita -algoritmia käyttää vain O ( n ) -operaatioissa; tapauksessa algoritmi QuickSelect- , muutos nopeasti lajitella ( quicksort ), joka on yleensä O ( n ), mutta voi olla O ( n 2 ) pahimmassa tapauksessa.

Käytännössä, jos etsimme n kokonaislukulistan mediaania ja jos onnekas havaita, että maksimiarvo m on pienempi kuin n 2 (tämä havainto maksaa O ( n )), niin laskulajittelu , toteutus erittäin helppoa ja kustannukset, joka on, tässä tapauksessa, O ( m ) toiminnan avulla, jotta saadaan mediaani vähemmän kuin O ( n 2 ) toimintaa. Tämä tapaus koskee erityisesti arvosanoja 20: stä (ilman desimaaleja) luokassa, jossa on enemmän kuin 5 oppilasta (5 neliötä on suurempi kuin 20).

Tilastollinen dispersiomittaus

Kun mediaania käytetään arvojen paikantamiseen kuvailevissa tilastoissa, vaihtelevuuden ilmaisulle on olemassa erilaisia ​​mahdollisuuksia: alue , kvartiilien välinen ja absoluuttinen alue . Koska mediaani on sama arvo kuin toinen kvartiili , sen laskenta on yksityiskohtainen artikkelissa kvartileja .

Mediaanit todennäköisyysjakaumissa

Kaikilla todellisilla todennäköisyysjakaumilla mediaani m täyttää yhtälön:

ts . jakelutoiminnon suhteen  :

Joten diffuusille todennäköisyysjakaumalle (jatkuva jakautumistoiminto):

Joidenkin jakaumien mediaanit

Kaikkien symmetristen jakaumien mediaani on yhtä suuri kuin odotukset.

Mediaanit kuvailevissa tilastoissa

Mediaania käytetään pääasiassa vinoon jakautumiseen, koska se edustaa niitä paremmin kuin aritmeettinen keskiarvo. Harkitse joukkoa {1, 2, 2, 2, 3, 9}. Mediaani on 2, samoin kuin moodi, joka on parempi mitta keskitaipumuksesta kuin aritmeettinen keskiarvo 3,166….

Mediaanin laskenta tehdään yleensä edustamaan erilaisia ​​jakaumia, ja se on helppo ymmärtää ja laskea. Se on myös keskimääräistä vahvempi äärimmäisten arvojen läsnä ollessa.

Teoreettiset ominaisuudet

Optimaalinen ominaisuus

Mediaani on myös keskeinen arvo, joka minimoi absoluuttisten poikkeamien keskiarvon. Aiemmin annetussa sarjassa {1, 2, 2, 2, 3, 9} tämä olisi (1 + 0 + 0 + 0 + 1 + 7) / 6 = 1,5 eikä 1,944 keskiarvosta, mikä puolestaan ​​minimoi asteen poikkeamat. Todennäköisyysteoriassa arvo c, joka minimoi

on satunnaismuuttujan X todennäköisyysjakauman mediaani .

Eriarvoisuus, johon liittyy keinoja ja mediaaneja

Jatkuvissa todennäköisyysjakaumissa mediaanin ja odotuksen välinen ero on korkeintaan yksi keskihajonta .

Huomautuksia ja viitteitä

  1. "Mediaanin laskeminen" , Kanadan tilasto .
  2. Fabrice Mazerolle, "  mediaani  " ,2012(käytetty 13. helmikuuta 2012 ) .
  3. [ (en)  Valinta (deterministinen ja satunnaistettu): mediaanin löytäminen lineaarisessa ajassa ]

Katso myös

Aiheeseen liittyvät artikkelit

Ulkoiset linkit