Diskretna uniformna raspodela

(преусмерено са Uniform distribution (discrete))

U teoriji verovatnoće i statistici, diskretna uniformna raspodela je simetrična raspodela verovatnoće pri čemu je za konačni broj vrednosti podjednako verovatno da budu uočene; svaka od n vrednosti ima jednaku verovatnoću 1/n. Drugim rečima „diskretna uniformna distribucija” je „poznati, konačni broj ishoda koji su podjednako verovatni da se dogode”.

Diskretna uniformna raspodela
Funkcija verovatnoće
Discrete uniform probability mass function for n = 5
n = 5 gde je n = b − a + 1
Funkcija kumulativne raspodele
Discrete uniform cumulative distribution function for n = 5
Notacija ili
Parametri

Nositelj
pmf
CDF
Prosek
Medijana
ModusN/A
Varijansa
Koef. asimetrije
Kurtoza
Entropija
MGF
CF

Jednostavan primer diskretne uniformne distribucije je bacanje kocke. Moguće vrednosti su 1, 2, 3, 4, 5, 6, i svaki put kada se baci kocka verovatnoća datih rezultata je 1/6. Ako se bacaju dve kocke i dodaju njihove vrednosti, rezultirajuća raspodjela više nije uniformna, jer svi zbirovi nemaju jednaku verovatnoću.

Sama diskretna uniformna raspodela je inherentno neparametarska. Prikladno je, međutim, prikazati njene vrednosti generalno svim celim brojevima u intervalu [a,b], tako da a i b postaju glavni parametri distribucije (često se jednostavno razmatra interval [1, n] sa jednim parametrom n). Ovim konvencijama može se izraziti funkcija kumulativne distribucije (engl. cumulative distribution function - CDF) diskretne uniformne distribucije za bilo koje k ∈ [a,b], kao

Procena maksimuma

уреди

Uzorak k opažanja dobijen je iz uniformne distribucije celih brojeva  , s ciljem procene nepoznatog maksimuma N. Ovaj problem je opšte poznat kao nemački tenkovski problem, po primeni maksimalne procene na procenu nemačke proizvodnje tenkova tokom Drugog svetskog rata.[1][2][3][4][5]

Nepristrasni procenjivač uniformne minimalne varijanse (engl. Uniformly minimum variance unbiased estimator - UMVU) za maksimum je dat sa[6][7]

 

gde je m maksimum uzorka i k je veličina uzorka, uzorkovanog bez zamene.[8] Ovo se može smatrati veoma jednostavnim slučajem procenе maksimalnog razmaka.

To ima varijansu od[8]

 

tako da je standardna devijacija približno  , (populaciona) prosečna veličina razmaka između uzoraka; uporedite sa   iznad.

Maksimum uzorka je procenjivač maksimalne verovatnoće za populacioni maksimum, mada, kao što je gore diskutovano, on je pristrasan.

Ako uzorci nisu numerisani, već su prepoznatljivi ili markirani, umesto toga se može proceniti veličina populacije metodom označavanja i ponovnog hvatanja.[9][10]

Derivacija

уреди

Za neki ceo broj m takav da je k ≤ m ≤ N, verovatnoća da će maksimalni uzorak biti jednak m može se izračunati na sledeći način. Broj različitih grupa od k tenkova koji se mogu načiniti od ukupno N tenkova dat je binomnim koeficijentom  . Pošto se u ovom načinu brojanja permutacija tenkova broji samo jednom, mogu se urediti serijski brojevi i uzeti u obzir maksimum svakog uzorka. Da bi se izračunala verovatnoća, mora se odrediti broj poređanih uzoraka koji se može formirati sa poslednjim elementom jednakim m, i svi ostali k-1 tenkovi manji ili jednaki m-1. Broj uzoraka sa k-1 tenkova koji se mogu napraviti od ukupno m-1 tenkova dat je binomnim koeficijentom  , tako da je verovatnoća da je maksimum m jednaka  .

Ako je dat ukupn broj N i veličina uzorka k, očekivana vrednost maksimuma uzorka je

 

gde je korišten identitet hokejaškog štapa  .

Iz ove jednačine, nepoznati kvantitet N se može izraziti u obliku očekivanja i veličine uzorka kao

 

Iz linearnosti očekivanja se dobija da je

 

i stoga se nepristrasni procenjivač od N dobija zamenjivanjem očekivanja opservacijom,

 

Osim što je nepristrasan ovaj procenjivač takođe dostiže minimalnu varijansu. Da bi se to pokazalo, prvo treba napomenuti da je maksimalan uzorak dovoljna statistička za maksimum populacije, jer je verovatnoća P(m;N) izražena samo kao funkcija od m. Zatim se mora pokazati da su statistike za m takođe kompletne statistike, i posebna vrsta dovoljne statistike. Zatim Lehman-Šefeova teorema implicira da je   minimalna procena nepristrasne varijanse od N.[11]

Varijansa procenjivača izračunava se iz varijance maksimuma uzorka

 

Varijanse maksimuma se zatim izračunava iz očekivanih vrednosti od   i  . Izračunavanje očekivane vrednosti od   je,

 

gde je drugi član očekivana vrednost od  . Prvi član se može izraziti tako da zavisi od k i N,

 

pri čemu je napravljena zamena   i korišten je identitet hokejaškog štapa. Zamenjujući ovaj rezultat i očekivanje od   u jednačini od  ,

 

Variansa od   se zatim dobija,

 

Konačno varijansa procenjivača   se može izračunati,

 

Vidi još

уреди

Reference

уреди
  1. ^ „Gavyn Davies does the maths – How a statistical formula won the war”. The Guardian. 20. 7. 2006. Приступљено 6. 7. 2014. 
  2. ^ Matthews, Robert (23. 5. 1998), „Data sleuths go to war, sidebar in feature "Hidden truths", New Scientist, Архивирано из оригинала 18. 4. 2001. г. 
  3. ^ Bob Carruthers (1. 3. 2012). Panther V in Combat. Coda Books Ltd. стр. 94—. ISBN 978-1-908538-15-4. 
  4. ^ Johnson, Roger (2006), „Estimating the Size of a Population”, Getting the Best from Teaching Statistics, Архивирано из оригинала (PDF) 20. 11. 2008. г. 
  5. ^ Joyce, Smart. „German Tank Problem”. Logan High School. Архивирано из оригинала 24. 4. 2012. г. Приступљено 8. 7. 2014. 
  6. ^ Keener, Robert W. (2006). Statistical Theory: Notes for a Course in Theoretical Statistics. Springer. стр. 47—48, 57—58. 
  7. ^ Voinov V. G., Nikulin M.S. (1993). Unbiased estimators and their applications, Vol.1: Univariate case. Kluwer Academic Publishers. стр. 521p. 
  8. ^ а б Johnson, Roger (1994), „Estimating the Size of a Population”, Teaching Statistics, 16 (2 (Summer)), doi:10.1111/j.1467-9639.1994.tb00688.x 
  9. ^ Krebs, Charles J. (2009). Ecology (6th изд.). стр. 119. ISBN 978-0-321-50743-3. 
  10. ^ Chao, A.; Tsay, P. K.; Lin, S. H.; Shau, W. Y.; Chao, D. Y. (2001). „The applications of capture-recapture models to epidemiological data”. Statistics in Medicine. 20 (20): 3123—3157. PMID 11590637. doi:10.1002/sim.996. 
  11. ^ G. A. Young and R. L Smith (2005) Essentials of Statistical Inference, Cambridge University Press, Cambridge, UK, p. 95

Literatura

уреди

Spoljašnje veze

уреди