In todennäköisyys teoria ja tilastoja , mediaani on arvo, joka erottaa pohjan puoli ylhäältä puoli joukko ( näyte , populaatio , todennäköisyysjakauma ). Mediaani on siis intuitiivisesti kokonaisuuden keskipiste. Se on sarjan keskeinen suuntausindikaattori . Voimme määrittää mediaanin joukolle ei-numeerisia arvoja, kunhan voimme valita kriteerin näiden arvojen järjestykselle.
Arvoryhmän mediaanin määrittämiseksi riittää, kun järjestät arvot kasvavaan luetteloon ja valitset tämän luettelon keskellä olevan arvon. Järjestetylle n elementin luettelolle, jossa n on pariton, elementin arvo sijainnissa (n + 1) / 2 on mediaani. Jos alkioiden lukumäärä n on parillinen, mikä tahansa arvo elementtien välillä paikoissa (n-1) / 2 ja (n + 1) / 2 on mediaani; käytännössä numeroluettelon tapauksessa useimmiten käytetään näiden kahden keskeisen arvon aritmeettista keskiarvoa .
Monimutkaisuus algoritmin mediaanin laskemiseksi on siis monimutkaisuus lajittelualgoritmi käyttää, nimittäin O ( n log n ) on paras .
Esimerkkejä
Arvoryhmän mediaanin määrittämiseksi riittää laskea kasvavat kumulatiiviset prosenttiosuudet ja otamme sarjan ensimmäisen arvon, jonka kumulatiivinen prosenttiosuus ylittää 50%.
Tämä menetelmä on käytännöllisempi, kun sinulla on suuri määrä arvoja.
On olemassa lineaarisen monimutkaisuuden algoritmeja (O ( n ): ssä), joten tehokkaampia. Nämä ovat algoritmeja, jotka yleensä tekevät mahdolliseksi määrittää n elementin luettelon k- s elementti (katso Valinta-algoritmi ); k = n / 2 mediaanille. Nämä ovat lajittelualgoritmien mukautuksia, mutta ne ovat tehokkaampia, koska kaikki arvot eivät kiinnosta meitä. Esimerkiksi voimme jakaa ja hallita -algoritmia käyttää vain O ( n ) -operaatioissa; tapauksessa algoritmi QuickSelect- , muutos nopeasti lajitella ( quicksort ), joka on yleensä O ( n ), mutta voi olla O ( n 2 ) pahimmassa tapauksessa.
Käytännössä, jos etsimme n kokonaislukulistan mediaania ja jos onnekas havaita, että maksimiarvo m on pienempi kuin n 2 (tämä havainto maksaa O ( n )), niin laskulajittelu , toteutus erittäin helppoa ja kustannukset, joka on, tässä tapauksessa, O ( m ) toiminnan avulla, jotta saadaan mediaani vähemmän kuin O ( n 2 ) toimintaa. Tämä tapaus koskee erityisesti arvosanoja 20: stä (ilman desimaaleja) luokassa, jossa on enemmän kuin 5 oppilasta (5 neliötä on suurempi kuin 20).
Kun mediaania käytetään arvojen paikantamiseen kuvailevissa tilastoissa, vaihtelevuuden ilmaisulle on olemassa erilaisia mahdollisuuksia: alue , kvartiilien välinen ja absoluuttinen alue . Koska mediaani on sama arvo kuin toinen kvartiili , sen laskenta on yksityiskohtainen artikkelissa kvartileja .
Kaikilla todellisilla todennäköisyysjakaumilla mediaani m täyttää yhtälön:
ts . jakelutoiminnon suhteen :
Joten diffuusille todennäköisyysjakaumalle (jatkuva jakautumistoiminto):
Kaikkien symmetristen jakaumien mediaani on yhtä suuri kuin odotukset.
Mediaania käytetään pääasiassa vinoon jakautumiseen, koska se edustaa niitä paremmin kuin aritmeettinen keskiarvo. Harkitse joukkoa {1, 2, 2, 2, 3, 9}. Mediaani on 2, samoin kuin moodi, joka on parempi mitta keskitaipumuksesta kuin aritmeettinen keskiarvo 3,166….
Mediaanin laskenta tehdään yleensä edustamaan erilaisia jakaumia, ja se on helppo ymmärtää ja laskea. Se on myös keskimääräistä vahvempi äärimmäisten arvojen läsnä ollessa.
Mediaani on myös keskeinen arvo, joka minimoi absoluuttisten poikkeamien keskiarvon. Aiemmin annetussa sarjassa {1, 2, 2, 2, 3, 9} tämä olisi (1 + 0 + 0 + 0 + 1 + 7) / 6 = 1,5 eikä 1,944 keskiarvosta, mikä puolestaan minimoi asteen poikkeamat. Todennäköisyysteoriassa arvo c, joka minimoi
on satunnaismuuttujan X todennäköisyysjakauman mediaani .
Jatkuvissa todennäköisyysjakaumissa mediaanin ja odotuksen välinen ero on korkeintaan yksi keskihajonta .