Statistička populacija
U statistici, populacija je skup sličnih objekata posmatranja koji dele bar jedno zajedničko svojstvo koje je predmet statističke analize.[1] Na primer, populacija nekog naroda, između ostalih obeležja, deli zajedničko geografsko poreklo, jezik, književnost i genetičku osnovu, što ih razlikuje od ljudi drugih nacionalnosti. Primer može biti i galaksija Mlečni put, koja se sastoji populacije zvezda, ili hipotetična i potencijalno beskonačna grupa objekata zamišljena kao generalizacija iz iskustva (npr. skup svih mogućih deljenja u igri pokera).[2] Zajednički cilj statističke analize je da se dobiju informacije o nekoj izabranoj populaciji.[3] Nasuprot tome, statistički uzorak je posmatrani podskup izdvojen iz populacije da bi je predstavljao u statističkoj analizi. Ako je uzorak verodostojno odabran, tj. slučajno i bez pristrasnosti, karakteristike celokupne populacije iz koje potiče, po zakonu verovatnoće mogu biti predstavljene karakteristikama tog uzorka.[4] Odnos veličine ovog statističkog uzorka prema veličini populacije naziva se frakcija uzorkovanja.[5] Tada je moguće proceniti populacione parametre koristeći odgovarajuću statistiku uzorka.[6][7]
Statistički i biološki pojmovi populacije se međusobno bitno razlikuju.
Srednja vrednost
уредиSrednja vrednost populacije, ili očekivana vrednost populacije,[8][9][10] je mera centralne tendencije bilo distribucije verovatnoće ili slučajne promenljive koju karakteriše ta distribucija.[11] U diskretnoj raspodeli verovatnoće slučajne promenljive X, srednja vrednost je jednaka zbiru svake moguće vrednosti ponderisane verovatnoćom te vrednosti; to jest, izračunava se uzimanjem proizvoda svake moguće vrednosti x oд X i njene verovatnoće p(x), a zatim sabiranjem svih ovih proizvoda, dajući .[12][13] Analogna formula važi za slučaj neprekidne raspodele verovatnoće. Nema svaka raspodela verovatnoće definisanu srednju vrednost (pogledajte Košijevu distribuciju za primer). Štaviše, srednja vrednost može biti beskonačna za neke distribucije.
Za konačnu populaciju, populacijska sredina svojstva je jednaka aritmetičkoj sredini datog svojstva, uzimajući u obzir svakog člana populacije. Na primer, srednja visina populacije jednaka je zbiru visina svake individue – podeljeno sa ukupnim brojem pojedinaca. Srednja vrednost uzorka može se razlikovati od srednje vrednosti populacije, posebno za male uzorke. Zakon velikih brojeva novodi da što je veća veličina uzorka, veća je verovatnoća da će srednja vrednost uzorka biti bliska srednjoj vrednosti populacije.[14]
Subpopulacija
уредиSubpopulacija je podskup populacije, ako dele jedno ili više dodatnih svojstva. Na primer, ako je sveukupna populacija jedan narod, subpopulacija mogu biti njegove polne kategorije, ili ako su populacija sve apoteke u svetu, subpopulacija su sve apoteke u Egiptu. Nasuprot tome, podskup populacije koji nema dodatno prisustvo bilo kojeg zajedničkog dodatnog svojstva zove se uzorak. Primer mogu biti 30 nasumično odabranih osoba posmatranog uzorka ili karata iz datog kompleta.
Opisna (deskriptivna) statistika može dati različite rezultate za različite subpopulacije. Na primer, određeni lekovi mogu imati različite efekte na različite subpopulacije, a ovi efekti mogu biti zasenjeni ili odbačeni ako takve posebne subpopulacija nisu identifikovane i ispitane u izolaciji. Isto tako, parametri se često mogu preciznije proceniti ako se subpopulacije odvoje: distribuciju telesne visine ljudi je bolje modelovati prema muškaracima i ženama kao zasebnim subpopulacijama, na primer.
Populacije koje se sastoje od subpopulacija mogu se modelovati pomoću mešovitih modela,[15] kombinovanjem distribucije unutar subpopulacija u ukupnoj distribuciji populacije.[16] Čak i kada su subpopulacije dobro modelovane po jednostavnom modelu, sveukupna populacija može biti loše prilagođena, što može biti dokaz za postojanje subpopulacija. Na primer, u dve jednake subpopulacije, obe normalno distribuirane, ako imaju iste standardne devijacije a različite srednje vrednosti, ukupne distribucije će ispoljavati nisku sličnost u odnosu na normalnu distribuciju. Srednja vrednost subpopulacija će pasti na račun ukupne distribucije. Ako su dovoljno razdvojene, formiraju bimodalnu distribuciju,[17][18] a bez toga, na grafičkom prikazu imaju jednostavan i širok vrhunac. Nadalje, ispoljavaće nadvišavanje disperzije,[19] u odnosu na jedinstvenu normalnu distribuciju date varijacije. Alternativno, ako su subpopulacije sa istom srednjom vrednošću i različitim standardnim devijacijacijama, ukupna populacija će ispoljavati visoku sličnost, s oštrijm vrhom i težim krajevima (i shodno tome plićim prelaznim kategorijama) nego kod jednostavne distribucije.
Vidi još
уредиReference
уреди- ^ „Glossary of statistical terms: Population”. Statistics.com. Архивирано из оригинала 03. 03. 2016. г. Приступљено 22. 2. 2016.
- ^ Weisstein, Eric W. „Statistička populacija”. MathWorld.
- ^ Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd изд.). New York: Freeman. ISBN 978-0-7167-4773-4. Архивирано из оригинала 9. 2. 2005. г.
- ^ Mosteller, F.; Tukey, J. W. (1987) [1968]. „Data Analysis, including Statistics”. The Collected Works of John W. Tukey: Philosophy and Principles of Data Analysis 1965–1986. 4. CRC Press. стр. 601–720 [p. 633]. ISBN 0-534-05101-4 — преко Google Books.
- ^ Dodge, Yadolah (2003). The Oxford Dictionary of Statistical Terms. Oxford: Oxford University Press. ISBN 0-19-920613-9.
- ^ Bain, Lee J.; Engelhardt, Max (1992). Introduction to probability and mathematical statistics (2nd изд.). Boston: PWS-KENT Pub. ISBN 0534929303. OCLC 24142279.
- ^ Scheaffer, Richard L.; Mendenhall, William; Ott, Lyman (2006). Elementary survey sampling (6th изд.). Southbank, Vic.: Thomson Brooks/Cole. ISBN 0495018627. OCLC 58425200.
- ^ „Expectation | Mean | Average”. www.probabilitycourse.com. Приступљено 2020-09-11.
- ^ Hansen, Bruce. „PROBABILITY AND STATISTICS FOR ECONOMISTS” (PDF). Архивирано из оригинала (PDF) 19. 01. 2022. г. Приступљено 2021-07-20.
- ^ Wasserman, Larry (децембар 2010). All of Statistics: a concise course in statistical inference. Springer texts in statistics. стр. 47. ISBN 9781441923226.
- ^ Feller, William (1950). Introduction to Probability Theory and its Applications, Vol I. Wiley. стр. 221. ISBN 0471257087.
- ^ Elementary Statistics by Robert R. Johnson and Patricia J. Kuby, p. 279
- ^ Weisstein, Eric W. „Population Mean”. mathworld.wolfram.com (на језику: енглески). Приступљено 2020-08-21.
- ^ Schaum's Outline of Theory and Problems of Probability by Seymour Lipschutz and Marc Lipson, p. 141
- ^ Everitt, B.S.; Hand, D.J. (1981). Finite mixture distributions. Chapman & Hall. ISBN 978-0-412-22420-1.
- ^ Dinov, ID. "Expectation Maximization and Mixture Modeling Tutorial". California Digital Library, Statistics Online Computational Resource, Paper EM_MM, http://repositories.cdlib.org/socr/EM_MM, December 9, 2008
- ^ Hassan, MY; Hijazi, RH (2010). „A bimodal exponential power distribution”. Pakistan Journal of Statistics. 26 (2): 379—396.
- ^ Holzmann, Hajo; Vollmer, Sebastian (2008). „A likelihood ratio test for bimodality in two-component mixtures with application to regional income distribution in the EU”. AStA Advances in Statistical Analysis. 2 (1): 57—69. doi:10.1007/s10182-008-0057-2.
- ^ Lindsey, J. K.; Altham, P. M. E. (1998). „Analysis of the Human Sex Ratio by using Overdispersion Models”. Journal of the Royal Statistical Society, Series C. 47 (1): 149—157. doi:10.1111/1467-9876.00103.
Literatura
уреди- Illowsky, Barbara; Dean, Susan (2014). Introductory Statistics. OpenStax CNX. ISBN 9781938168208.
- David W. Stockburger, Introductory Statistics: Concepts, Models, and Applications Архивирано на сајту Wayback Machine (28. мај 2020), 3rd Web Ed. Missouri State University.
- OpenIntro Statistics, 3rd edition by Diez, Barr, and Cetinkaya-Rundel
- Cohen, J. (1990). "Things I have learned (so far)". American Psychologist, 45, 1304–1312.
- Gigerenzer, G. (2004). "Mindless statistics". Journal of Socio-Economics, 33, 587–606. . doi:10.1016/j.socec.2004.09.033. Недостаје или је празан параметар
|title=
(помоћ) - Ioannidis, J.P.A. (2005). "Why most published research findings are false". PLoS Medicine, 2, 696–701. . doi:10.1371/journal.pmed.0040168. Недостаје или је празан параметар
|title=
(помоћ) - Bol'shev, Login Nikolaevich (2001) [1994], „Statistical Estimator”, Ур.: Hazewinkel, Michiel, Encyclopedia of Mathematics, Springer Science+Business Media B.V. / Kluwer Academic Publishers, ISBN 978-1-55608-010-4.
- Jaynes, E. T. (2007), Probability Theory: The logic of science (5 изд.), Cambridge University Press, ISBN 978-0-521-59271-0.
- Kosorok, Michael (2008). Introduction to Empirical Processes and Semiparametric Inference. Springer Series in Statistics. Springer. ISBN 978-0-387-74978-5. doi:10.1007/978-0-387-74978-5.
- Lehmann, E. L.; Casella, G. (1998). Theory of Point Estimation (2nd изд.). Springer. ISBN 0-387-98502-6.
- Shao, Jun (1998), Mathematical Statistics, Springer, ISBN 0-387-98674-X
- History of Probability and Statistics and Their Applications before 1750. Wiley Series in Probability and Statistics (на језику: енглески). 1990. ISBN 9780471725169. doi:10.1002/0471725161.
- Edwards, A.W.F (2002). Pascal's arithmetical triangle: the story of a mathematical idea (2nd изд.). JHU Press. ISBN 0-8018-6946-3.
- Huygens, Christiaan (1657). De ratiociniis in ludo aleæ (English translation, published in 1714).
- Billingsley, Patrick (1995). Probability and measure. Wiley Series in Probability and Mathematical Statistics (Third edition of 1979 original изд.). New York: John Wiley & Sons, Inc. ISBN 0-471-00710-2. MR 1324786.
- Casella, George; Berger, Roger L. (2001). Statistical inference. Duxbury Advanced Series (Second edition of 1990 original изд.). Pacific Grove, CA: Duxbury. ISBN 0-534-11958-1.
- Feller, William (1968). An introduction to probability theory and its applications. Volume I (Third edition of 1950 original изд.). New York–London–Sydney: John Wiley & Sons, Inc. MR 0228020.
- Feller, William (1971). An introduction to probability theory and its applications. Volume II (Second edition of 1966 original изд.). New York–London–Sydney: John Wiley & Sons, Inc. MR 0270403.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, N. (1994). Continuous univariate distributions. Volume 1. Wiley Series in Probability and Mathematical Statistics (Second edition of 1970 original изд.). New York: John Wiley & Sons, Inc. ISBN 0-471-58495-9. MR 1299979.
- Papoulis, Athanasios; Pillai, S. Unnikrishna (2002). Probability, random variables, and stochastic processes (Fourth edition of 1965 original изд.). New York: McGraw-Hill. ISBN 0-07-366011-6.
- Ross, Sheldon M. (2019). Introduction to probability models (Twelfth edition of 1972 original изд.). London: Academic Press. ISBN 978-0-12-814346-9. MR 3931305. doi:10.1016/C2017-0-01324-1.
- Lindsay, B. G. (1995). Mixture Models: Theory, Geometry, and Applications. NSF-CBMS Regional Conference Series in Probability and Statistics. 5. Hayward: Institute of Mathematical Statistics.
- Marin, J.M.; Mengersen, K.; Robert, C. P. (2011). „Bayesian modelling and inference on mixtures of distributions” (PDF). Ур.: Dey, D.; Rao, C.R. Essential Bayesian models. Handbook of statistics: Bayesian thinking - modeling and computation. 25. Elsevier. ISBN 9780444537324.
- McLachlan, G.J.; Peel, D. (2000). Finite Mixture Models . Wiley. ISBN 978-0-471-00626-8.
- Press, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). „Section 16.1. Gaussian Mixture Models and k-Means Clustering”. Numerical Recipes: The Art of Scientific Computing (3rd изд.). New York: Cambridge University Press. ISBN 978-0-521-88068-8.
- Titterington, D.; Smith, A.; Makov, U. (1985). Statistical Analysis of Finite Mixture Distributions. Wiley. ISBN 978-0-471-90763-3.
Spoljašnje veze
уреди- Statistical Terms Made Simple
- Fundamentals on Estimation Theory Архивирано на сајту Wayback Machine (12. фебруар 2020)