Статистичка популација

комплетан сет ставки које деле најмање једно својство као заједничко који је предмет статистичке анализе

У статистици, популација је скуп сличних објеката посматрања који деле бар једно заједничко својство које је предмет статистичке анализе.[1] На пример, популација неког народа, између осталих обележја, дели заједничко географско порекло, језик, књижевност и генетичку основу, што их разликује од људи других националности. Пример може бити и галаксија Млечни пут, која се састоји популације звезда, или хипотетична и потенцијално бесконачна група објеката замишљена као генерализација из искуства (нпр. скуп свих могућих дељења у игри покера).[2] Заједнички циљ статистичке анализе је да се добију информације о некој изабраној популацији.[3] Насупрот томе, статистички узорак је посматрани подскуп издвојен из популације да би је представљао у статистичкој анализи. Ако је узорак веродостојно одабран, тј. случајно и без пристрасности, карактеристике целокупне популације из које потиче, по закону вероватноће могу бити представљене карактеристикама тог узорка.[4] Однос величине овог статистичког узорка према величини популације назива се фракција узорковања.[5] Тада је могуће проценити популационе параметре користећи одговарајућу статистику узорка.[6][7]

Статистички и биолошки појмови популације се међусобно битно разликују.

Средња вредност

уреди

Средња вредност популације, или очекивана вредност популације,[8][9][10] је мера централне тенденције било дистрибуције вероватноће или случајне променљиве коју карактерише та дистрибуција.[11] У дискретној расподели вероватноће случајне променљиве X, средња вредност је једнака збиру сваке могуће вредности пондерисане вероватноћом те вредности; то јест, израчунава се узимањем производа сваке могуће вредности x од X и њене вероватноће п(x), а затим сабирањем свих ових производа, дајући  .[12][13] Аналогна формула важи за случај непрекидне расподеле вероватноће. Нема свака расподела вероватноће дефинисану средњу вредност (погледајте Кошијеву дистрибуцију за пример). Штавише, средња вредност може бити бесконачна за неке дистрибуције.

За коначну популацију, популацијска средина својства је једнака аритметичкој средини датог својства, узимајући у обзир сваког члана популације. На пример, средња висина популације једнака је збиру висина сваке индивидуе – подељено са укупним бројем појединаца. Средња вредност узорка може се разликовати од средње вредности популације, посебно за мале узорке. Закон великих бројева новоди да што је већа величина узорка, већа је вероватноћа да ће средња вредност узорка бити блиска средњој вредности популације.[14]

Субпопулација

уреди

Субпопулација је подскуп популације, ако деле једно или више додатних својства. На пример, ако је свеукупна популација један народ, субпопулација могу бити његове полне категорије, или ако су популација све апотеке у свету, субпопулација су све апотеке у Египту. Насупрот томе, подскуп популације који нема додатно присуство било којег заједничког додатног својства зове се узорак. Пример могу бити 30 насумично одабраних особа посматраног узорка или карата из датог комплета.

Описна (дескриптивна) статистика може дати различите резултате за различите субпопулације. На пример, одређени лекови могу имати различите ефекте на различите субпопулације, а ови ефекти могу бити засењени или одбачени ако такве посебне субпопулација нису идентификоване и испитане у изолацији. Исто тако, параметри се често могу прецизније проценити ако се субпопулације одвоје: дистрибуцију телесне висине људи је боље моделовати према мушкарацима и женама као засебним субпопулацијама, на пример.

Популације које се састоје од субпопулација могу се моделовати помоћу мешовитих модела,[15] комбиновањем дистрибуције унутар субпопулација у укупној дистрибуцији популације.[16] Чак и када су субпопулације добро моделоване по једноставном моделу, свеукупна популација може бити лоше прилагођена, што може бити доказ за постојање субпопулација. На пример, у две једнаке субпопулације, обе нормално дистрибуиране, ако имају исте стандардне девијације а различите средње вредности, укупне дистрибуције ће испољавати ниску сличност у односу на нормалну дистрибуцију. Средња вредност субпопулација ће пасти на рачун укупне дистрибуције. Ако су довољно раздвојене, формирају бимодалну дистрибуцију,[17][18] а без тога, на графичком приказу имају једноставан и широк врхунац. Надаље, испољаваће надвишавање дисперзије,[19] у односу на јединствену нормалну дистрибуцију дате варијације. Алтернативно, ако су субпопулације са истом средњом вредношћу и различитим стандардним девијацијацијама, укупна популација ће испољавати високу сличност, с оштријм врхом и тежим крајевима (и сходно томе плићим прелазним категоријама) него код једноставне дистрибуције.

Види још

уреди

Референце

уреди
  1. ^ „Глоссарy оф статистицал термс: Популатион”. Статистицс.цом. Архивирано из оригинала 03. 03. 2016. г. Приступљено 22. 2. 2016. 
  2. ^ Wеисстеин, Ериц W. „Статистичка популација”. МатхWорлд. 
  3. ^ Yатес, Даниел С.; Мооре, Давид С; Старнес, Дарен С. (2003). Тхе Працтице оф Статистицс (2нд изд.). Неw Yорк: Фрееман. ИСБН 978-0-7167-4773-4. Архивирано из оригинала 9. 2. 2005. г. 
  4. ^ Мостеллер, Ф.; Тукеy, Ј. W. (1987) [1968]. „Дата Аналyсис, инцлудинг Статистицс”. Тхе Цоллецтед Wоркс оф Јохн W. Тукеy: Пхилосопхy анд Принциплес оф Дата Аналyсис 1965–1986. 4. ЦРЦ Пресс. стр. 601–720 [п. 633]. ИСБН 0-534-05101-4 — преко Гоогле Боокс. 
  5. ^ Додге, Yадолах (2003). Тхе Оxфорд Дицтионарy оф Статистицал Термс. Оxфорд: Оxфорд Университy Пресс. ИСБН 0-19-920613-9. 
  6. ^ Баин, Лее Ј.; Енгелхардт, Маx (1992). Интродуцтион то пробабилитy анд матхематицал статистицс (2нд изд.). Бостон: ПWС-КЕНТ Пуб. ИСБН 0534929303. ОЦЛЦ 24142279. 
  7. ^ Сцхеаффер, Рицхард L.; Менденхалл, Wиллиам; Отт, Лyман (2006). Елементарy сурвеy самплинг (6тх изд.). Соутхбанк, Виц.: Тхомсон Броокс/Цоле. ИСБН 0495018627. ОЦЛЦ 58425200. 
  8. ^ „Еxпецтатион | Меан | Авераге”. www.пробабилитyцоурсе.цом. Приступљено 2020-09-11. 
  9. ^ Хансен, Бруце. „ПРОБАБИЛИТY АНД СТАТИСТИЦС ФОР ЕЦОНОМИСТС” (ПДФ). Архивирано из оригинала (ПДФ) 19. 01. 2022. г. Приступљено 2021-07-20. 
  10. ^ Wассерман, Ларрy (децембар 2010). Алл оф Статистицс: а цонцисе цоурсе ин статистицал инференце. Спрингер теxтс ин статистицс. стр. 47. ИСБН 9781441923226. 
  11. ^ Феллер, Wиллиам (1950). Интродуцтион то Пробабилитy Тхеорy анд итс Апплицатионс, Вол I. Wилеy. стр. 221. ИСБН 0471257087. 
  12. ^ Елементарy Статистицс бy Роберт Р. Јохнсон анд Патрициа Ј. Кубy, п. 279
  13. ^ Wеисстеин, Ериц W. „Популатион Меан”. матхwорлд.wолфрам.цом (на језику: енглески). Приступљено 2020-08-21. 
  14. ^ Сцхаум'с Оутлине оф Тхеорy анд Проблемс оф Пробабилитy бy Сеyмоур Липсцхутз анд Марц Липсон, п. 141
  15. ^ Еверитт, Б.С.; Ханд, D.Ј. (1981). Фините миxтуре дистрибутионс. Цхапман & Халл. ИСБН 978-0-412-22420-1. 
  16. ^ Динов, ИД. "Еxпецтатион Маxимизатион анд Миxтуре Моделинг Туториал". Цалифорниа Дигитал Либрарy, Статистицс Онлине Цомпутатионал Ресоурце, Папер ЕМ_ММ, http://repositories.cdlib.org/socr/EM_MM, Децембер 9, 2008
  17. ^ Хассан, МY; Хијази, РХ (2010). „А бимодал еxпонентиал поwер дистрибутион”. Пакистан Јоурнал оф Статистицс. 26 (2): 379—396. 
  18. ^ Холзманн, Хајо; Воллмер, Себастиан (2008). „А ликелихоод ратио тест фор бимодалитy ин тwо-цомпонент миxтурес wитх апплицатион то регионал инцоме дистрибутион ин тхе ЕУ”. АСтА Адванцес ин Статистицал Аналyсис. 2 (1): 57—69. дои:10.1007/с10182-008-0057-2. 
  19. ^ Линдсеy, Ј. К.; Алтхам, П. M. Е. (1998). „Аналyсис оф тхе Хуман Сеx Ратио бy усинг Овердисперсион Моделс”. Јоурнал оф тхе Роyал Статистицал Социетy, Сериес C. 47 (1): 149—157. дои:10.1111/1467-9876.00103. 

Литература

уреди

Spoljašnje veze

уреди