Статистичка популација
У статистици, популација је скуп сличних објеката посматрања који деле бар једно заједничко својство које је предмет статистичке анализе.[1] На пример, популација неког народа, између осталих обележја, дели заједничко географско порекло, језик, књижевност и генетичку основу, што их разликује од људи других националности. Пример може бити и галаксија Млечни пут, која се састоји популације звезда, или хипотетична и потенцијално бесконачна група објеката замишљена као генерализација из искуства (нпр. скуп свих могућих дељења у игри покера).[2] Заједнички циљ статистичке анализе је да се добију информације о некој изабраној популацији.[3] Насупрот томе, статистички узорак је посматрани подскуп издвојен из популације да би је представљао у статистичкој анализи. Ако је узорак веродостојно одабран, тј. случајно и без пристрасности, карактеристике целокупне популације из које потиче, по закону вероватноће могу бити представљене карактеристикама тог узорка.[4] Однос величине овог статистичког узорка према величини популације назива се фракција узорковања.[5] Тада је могуће проценити популационе параметре користећи одговарајућу статистику узорка.[6][7]
Статистички и биолошки појмови популације се међусобно битно разликују.
Средња вредност
уредиСредња вредност популације, или очекивана вредност популације,[8][9][10] је мера централне тенденције било дистрибуције вероватноће или случајне променљиве коју карактерише та дистрибуција.[11] У дискретној расподели вероватноће случајне променљиве X, средња вредност је једнака збиру сваке могуће вредности пондерисане вероватноћом те вредности; то јест, израчунава се узимањем производа сваке могуће вредности x од X и њене вероватноће п(x), а затим сабирањем свих ових производа, дајући .[12][13] Аналогна формула важи за случај непрекидне расподеле вероватноће. Нема свака расподела вероватноће дефинисану средњу вредност (погледајте Кошијеву дистрибуцију за пример). Штавише, средња вредност може бити бесконачна за неке дистрибуције.
За коначну популацију, популацијска средина својства је једнака аритметичкој средини датог својства, узимајући у обзир сваког члана популације. На пример, средња висина популације једнака је збиру висина сваке индивидуе – подељено са укупним бројем појединаца. Средња вредност узорка може се разликовати од средње вредности популације, посебно за мале узорке. Закон великих бројева новоди да што је већа величина узорка, већа је вероватноћа да ће средња вредност узорка бити блиска средњој вредности популације.[14]
Субпопулација
уредиСубпопулација је подскуп популације, ако деле једно или више додатних својства. На пример, ако је свеукупна популација један народ, субпопулација могу бити његове полне категорије, или ако су популација све апотеке у свету, субпопулација су све апотеке у Египту. Насупрот томе, подскуп популације који нема додатно присуство било којег заједничког додатног својства зове се узорак. Пример могу бити 30 насумично одабраних особа посматраног узорка или карата из датог комплета.
Описна (дескриптивна) статистика може дати различите резултате за различите субпопулације. На пример, одређени лекови могу имати различите ефекте на различите субпопулације, а ови ефекти могу бити засењени или одбачени ако такве посебне субпопулација нису идентификоване и испитане у изолацији. Исто тако, параметри се често могу прецизније проценити ако се субпопулације одвоје: дистрибуцију телесне висине људи је боље моделовати према мушкарацима и женама као засебним субпопулацијама, на пример.
Популације које се састоје од субпопулација могу се моделовати помоћу мешовитих модела,[15] комбиновањем дистрибуције унутар субпопулација у укупној дистрибуцији популације.[16] Чак и када су субпопулације добро моделоване по једноставном моделу, свеукупна популација може бити лоше прилагођена, што може бити доказ за постојање субпопулација. На пример, у две једнаке субпопулације, обе нормално дистрибуиране, ако имају исте стандардне девијације а различите средње вредности, укупне дистрибуције ће испољавати ниску сличност у односу на нормалну дистрибуцију. Средња вредност субпопулација ће пасти на рачун укупне дистрибуције. Ако су довољно раздвојене, формирају бимодалну дистрибуцију,[17][18] а без тога, на графичком приказу имају једноставан и широк врхунац. Надаље, испољаваће надвишавање дисперзије,[19] у односу на јединствену нормалну дистрибуцију дате варијације. Алтернативно, ако су субпопулације са истом средњом вредношћу и различитим стандардним девијацијацијама, укупна популација ће испољавати високу сличност, с оштријм врхом и тежим крајевима (и сходно томе плићим прелазним категоријама) него код једноставне дистрибуције.
Види још
уредиРеференце
уреди- ^ „Глоссарy оф статистицал термс: Популатион”. Статистицс.цом. Архивирано из оригинала 03. 03. 2016. г. Приступљено 22. 2. 2016.
- ^ Wеисстеин, Ериц W. „Статистичка популација”. МатхWорлд.
- ^ Yатес, Даниел С.; Мооре, Давид С; Старнес, Дарен С. (2003). Тхе Працтице оф Статистицс (2нд изд.). Неw Yорк: Фрееман. ИСБН 978-0-7167-4773-4. Архивирано из оригинала 9. 2. 2005. г.
- ^ Мостеллер, Ф.; Тукеy, Ј. W. (1987) [1968]. „Дата Аналyсис, инцлудинг Статистицс”. Тхе Цоллецтед Wоркс оф Јохн W. Тукеy: Пхилосопхy анд Принциплес оф Дата Аналyсис 1965–1986. 4. ЦРЦ Пресс. стр. 601–720 [п. 633]. ИСБН 0-534-05101-4 — преко Гоогле Боокс.
- ^ Додге, Yадолах (2003). Тхе Оxфорд Дицтионарy оф Статистицал Термс. Оxфорд: Оxфорд Университy Пресс. ИСБН 0-19-920613-9.
- ^ Баин, Лее Ј.; Енгелхардт, Маx (1992). Интродуцтион то пробабилитy анд матхематицал статистицс (2нд изд.). Бостон: ПWС-КЕНТ Пуб. ИСБН 0534929303. ОЦЛЦ 24142279.
- ^ Сцхеаффер, Рицхард L.; Менденхалл, Wиллиам; Отт, Лyман (2006). Елементарy сурвеy самплинг (6тх изд.). Соутхбанк, Виц.: Тхомсон Броокс/Цоле. ИСБН 0495018627. ОЦЛЦ 58425200.
- ^ „Еxпецтатион | Меан | Авераге”. www.пробабилитyцоурсе.цом. Приступљено 2020-09-11.
- ^ Хансен, Бруце. „ПРОБАБИЛИТY АНД СТАТИСТИЦС ФОР ЕЦОНОМИСТС” (ПДФ). Архивирано из оригинала (ПДФ) 19. 01. 2022. г. Приступљено 2021-07-20.
- ^ Wассерман, Ларрy (децембар 2010). Алл оф Статистицс: а цонцисе цоурсе ин статистицал инференце. Спрингер теxтс ин статистицс. стр. 47. ИСБН 9781441923226.
- ^ Феллер, Wиллиам (1950). Интродуцтион то Пробабилитy Тхеорy анд итс Апплицатионс, Вол I. Wилеy. стр. 221. ИСБН 0471257087.
- ^ Елементарy Статистицс бy Роберт Р. Јохнсон анд Патрициа Ј. Кубy, п. 279
- ^ Wеисстеин, Ериц W. „Популатион Меан”. матхwорлд.wолфрам.цом (на језику: енглески). Приступљено 2020-08-21.
- ^ Сцхаум'с Оутлине оф Тхеорy анд Проблемс оф Пробабилитy бy Сеyмоур Липсцхутз анд Марц Липсон, п. 141
- ^ Еверитт, Б.С.; Ханд, D.Ј. (1981). Фините миxтуре дистрибутионс. Цхапман & Халл. ИСБН 978-0-412-22420-1.
- ^ Динов, ИД. "Еxпецтатион Маxимизатион анд Миxтуре Моделинг Туториал". Цалифорниа Дигитал Либрарy, Статистицс Онлине Цомпутатионал Ресоурце, Папер ЕМ_ММ, http://repositories.cdlib.org/socr/EM_MM, Децембер 9, 2008
- ^ Хассан, МY; Хијази, РХ (2010). „А бимодал еxпонентиал поwер дистрибутион”. Пакистан Јоурнал оф Статистицс. 26 (2): 379—396.
- ^ Холзманн, Хајо; Воллмер, Себастиан (2008). „А ликелихоод ратио тест фор бимодалитy ин тwо-цомпонент миxтурес wитх апплицатион то регионал инцоме дистрибутион ин тхе ЕУ”. АСтА Адванцес ин Статистицал Аналyсис. 2 (1): 57—69. дои:10.1007/с10182-008-0057-2.
- ^ Линдсеy, Ј. К.; Алтхам, П. M. Е. (1998). „Аналyсис оф тхе Хуман Сеx Ратио бy усинг Овердисперсион Моделс”. Јоурнал оф тхе Роyал Статистицал Социетy, Сериес C. 47 (1): 149—157. дои:10.1111/1467-9876.00103.
Литература
уреди- Иллоwскy, Барбара; Деан, Сусан (2014). Интродуцторy Статистицс. ОпенСтаx ЦНX. ИСБН 9781938168208.
- Давид W. Стоцкбургер, Интродуцторy Статистицс: Цонцептс, Моделс, анд Апплицатионс Архивирано на сајту Wayback Machine (28. мај 2020), 3rd Web Ed. Missouri State University.
- OpenIntro Statistics, 3rd edition by Diez, Barr, and Cetinkaya-Rundel
- Cohen, J. (1990). "Things I have learned (so far)". American Psychologist, 45, 1304–1312.
- Gigerenzer, G. (2004). "Mindless statistics". Journal of Socio-Economics, 33, 587–606. . doi:10.1016/j.socec.2004.09.033. Недостаје или је празан параметар
|title=
(помоћ) - Ioannidis, J.P.A. (2005). "Why most published research findings are false". PLoS Medicine, 2, 696–701. . doi:10.1371/journal.pmed.0040168. Недостаје или је празан параметар
|title=
(помоћ) - Bol'shev, Login Nikolaevich (2001) [1994], „Statistical Estimator”, Ур.: Hazewinkel, Michiel, Encyclopedia of Mathematics, Springer Science+Business Media B.V. / Kluwer Academic Publishers, ISBN 978-1-55608-010-4.
- Jaynes, E. T. (2007), Probability Theory: The logic of science (5 изд.), Cambridge University Press, ISBN 978-0-521-59271-0.
- Kosorok, Michael (2008). Introduction to Empirical Processes and Semiparametric Inference. Springer Series in Statistics. Springer. ISBN 978-0-387-74978-5. doi:10.1007/978-0-387-74978-5.
- Lehmann, E. L.; Casella, G. (1998). Theory of Point Estimation (2nd изд.). Springer. ISBN 0-387-98502-6.
- Shao, Jun (1998), Mathematical Statistics, Springer, ISBN 0-387-98674-X
- History of Probability and Statistics and Their Applications before 1750. Wiley Series in Probability and Statistics (на језику: енглески). 1990. ISBN 9780471725169. doi:10.1002/0471725161.
- Edwards, A.W.F (2002). Pascal's arithmetical triangle: the story of a mathematical idea (2nd изд.). JHU Press. ISBN 0-8018-6946-3.
- Huygens, Christiaan (1657). De ratiociniis in ludo aleæ (English translation, published in 1714).
- Billingsley, Patrick (1995). Probability and measure. Wiley Series in Probability and Mathematical Statistics (Third edition of 1979 original изд.). New York: John Wiley & Sons, Inc. ISBN 0-471-00710-2. MR 1324786.
- Casella, George; Berger, Roger L. (2001). Statistical inference. Duxbury Advanced Series (Second edition of 1990 original изд.). Pacific Grove, CA: Duxbury. ISBN 0-534-11958-1.
- Feller, William (1968). An introduction to probability theory and its applications. Volume I (Third edition of 1950 original изд.). New York–London–Sydney: John Wiley & Sons, Inc. MR 0228020.
- Feller, William (1971). An introduction to probability theory and its applications. Volume II (Second edition of 1966 original изд.). New York–London–Sydney: John Wiley & Sons, Inc. MR 0270403.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, N. (1994). Continuous univariate distributions. Volume 1. Wiley Series in Probability and Mathematical Statistics (Second edition of 1970 original изд.). New York: John Wiley & Sons, Inc. ISBN 0-471-58495-9. MR 1299979.
- Papoulis, Athanasios; Pillai, S. Unnikrishna (2002). Probability, random variables, and stochastic processes (Fourth edition of 1965 original изд.). New York: McGraw-Hill. ISBN 0-07-366011-6.
- Ross, Sheldon M. (2019). Introduction to probability models (Twelfth edition of 1972 original изд.). London: Academic Press. ISBN 978-0-12-814346-9. MR 3931305. doi:10.1016/C2017-0-01324-1.
- Lindsay, B. G. (1995). Mixture Models: Theory, Geometry, and Applications. NSF-CBMS Regional Conference Series in Probability and Statistics. 5. Hayward: Institute of Mathematical Statistics.
- Marin, J.M.; Mengersen, K.; Robert, C. P. (2011). „Bayesian modelling and inference on mixtures of distributions” (PDF). Ур.: Dey, D.; Rao, C.R. Essential Bayesian models. Handbook of statistics: Bayesian thinking - modeling and computation. 25. Elsevier. ISBN 9780444537324.
- McLachlan, G.J.; Peel, D. (2000). Finite Mixture Models . Wiley. ISBN 978-0-471-00626-8.
- Press, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). „Section 16.1. Gaussian Mixture Models and k-Means Clustering”. Numerical Recipes: The Art of Scientific Computing (3rd изд.). New York: Cambridge University Press. ISBN 978-0-521-88068-8.
- Titterington, D.; Smith, A.; Makov, U. (1985). Statistical Analysis of Finite Mixture Distributions. Wiley. ISBN 978-0-471-90763-3.
Spoljašnje veze
уреди- Statistical Terms Made Simple
- Fundamentals on Estimation Theory Архивирано на сајту Wayback Machine (12. фебруар 2020)