Hi-kvadratna raspodela

(преусмерено са Hi-kvadratna distribucija)

U teoriji verovatnoće i statistici, hi-kvadratna raspodela (takođe hi-kvadrat ili χ2-raspodela) sa k stepena slobode je distribucija sume kvadrata k nezavisnih standardno normalnih randomnih promenljivih. Hi-kvadratna distribucija je specijalni slučaj gama distribucije i jedna je od od najšire korištenih distribucija verovatnoće u inferencijskoj statistici, naročito u testiranju hipoteza ili u konstrukciji intervala pouzdanosti.[2][3][4][5] Kada se pravi razlika od opštije necentralne hi-kvadratne raspodele, ova distribucija se ponekad naziva centralnom hi-kvadratnom raspodelom.

Hi-kvadrat
Funkcija gustine verovatnoće
Funkcija kumulativne raspodele
Notacija ili
Parametri (poznati kao „stepeni sloboda”)
Nositelj ako je , inače
PDF
CDF
Prosek
Medijana
Modus
Varijansa
Koef. asimetrije
Kurtoza
Entropija
MGF
CF      [1]
PGF

Hi-kvadratna raspodela se koristi u uobičajenim hi-kvadratnim testovima[6][7] za adekvatnost uklapanja posmatrane distribucije u teorijski očekivanu, nezavisnost dva kriterijuma klasifikacije kvalitativnih podataka, i procenu intervala pouzdanosti za populaciju standardnih devijacija normalne distribucije iz standardne devijacije uzorka. Mnogi drugi statistički testovi takođe koriste ovu distribuciju, kao što je Fridmanova analiza varijanse po rangovima.

Definicija

уреди

Ako su Z1, ..., Zk nezavisnе, standardno normalne randomne promenljive, onda je suma njihovih kvadrata,

 

distribuirana u skladu sa hi-kvadratnom distribucijom sa k stepeni slobode. Ovo se obično označava sa

 

Hi-kvadratna distribucija ima jedan parametar: k, pozitivni integer koji specificira broj stepeni slobode (broj Zi vrednosti).

Tabela χ2 vrednosti vs p-vrednosti

уреди

p-vrednost je verovatnoća opservacije statističkog testa bar kao ekstrema u hi-kvadratnoj distribuciji. Shodno tome, pošto kumulativna funkcija raspodele (CDF) za odgovarajuće stepene slobode (df) daje verovatnoću da je dobijena vrednost manje ekstremna od ove tačke, oduzimanje CDF vrednosti od 1 daje p-vrednost. Mala p-vrednost, ispod izabranog nivoa značaja, ukazuje na statistički značaj, tj. dovoljan dokaz da se odbaci nulta hipoteza. Nivo značaja od 0,05 se često koristi kao granica između značajnih i neznačajnih rezultata.

Donja tabela daje broj p-vrednosti koje odgovaraju sa χ2 za prvih 10 stepeni slobode.

Stepeni slobode (df) χ2 vrednost[8]
1 0,004 0,02 0,06 0,15 0,46 1,07 1,64 2,71 3,84 6,63 10,83
2 0,10 0,21 0,45 0,71 1,39 2,41 3,22 4,61 5,99 9,21 13,82
3 0,35 0,58 1,01 1,42 2,37 3,66 4,64 6,25 7,81 11,34 16,27
4 0,71 1,06 1,65 2,20 3,36 4,88 5,99 7,78 9,49 13,28 18,47
5 1,14 1,61 2,34 3,00 4,35 6,06 7,29 9,24 11,07 15,09 20,52
6 1,63 2,20 3,07 3,83 5,35 7,23 8,56 10,64 12,59 16,81 22,46
7 2,17 2,83 3,82 4,67 6,35 8,38 9,80 12,02 14,07 18,48 24,32
8 2,73 3,49 4,59 5,53 7,34 9,52 11,03 13,36 15,51 20,09 26,12
9 3,32 4,17 5,38 6,39 8,34 10,66 12,24 14,68 16,92 21,67 27,88
10 3,94 4,87 6,18 7,27 9,34 11,78 13,44 15,99 18,31 23,21 29,59
P vrednost (verovatnoća) 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,01 0,001

Ove vrednosti se mogu izračunati procenom funkcije kvantila (takođe poznate kao „inverzni CDF” ili „ICDF”) raspodele hi-kvadrata;[9] e. g., χ2 ICDF za p = 0,05 i df = 7 daje 14,06714 ≈ 14,07 kao u gornjoj tabeli.

Reference

уреди
  1. ^ M.A. Sanders. „Characteristic function of the central chi-square distribution” (PDF). Архивирано из оригинала (PDF) 2011-07-15. г. Приступљено 2009-03-06. 
  2. ^ Abramowitz, Milton; Stegun, Irene Ann, ур. (1983) [јун 1964]. „поглавље 26”. Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first изд.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. стр. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253. 
  3. ^ NIST (2006). Engineering Statistics Handbook – Chi-Squared Distribution
  4. ^ Johnson, N. L.; Kotz, S.; Balakrishnan, N. (1994). „Chi-Square Distributions including Chi and Rayleigh”. Continuous Univariate Distributions. 1 (Second изд.). John Wiley and Sons. стр. 415—493. ISBN 978-0-471-58495-7. 
  5. ^ Mood, Alexander; Graybill, Franklin A.; Boes, Duane C. (1974). Introduction to the Theory of Statistics (Third изд.). McGraw-Hill. стр. 241–246. ISBN 978-0-07-042864-5. 
  6. ^ „Chi-Square - Sociology 3112 - Department of Sociology - The University of utah”. soc.utah.edu. Приступљено 2022-11-12. 
  7. ^ Pearson, Karl (1900). „On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling” (PDF). Philosophical Magazine. Series 5. 50 (302): 157—175. doi:10.1080/14786440009463897. 
  8. ^ Chi-Squared Test Архивирано на сајту Wayback Machine (18. новембар 2013) Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. In turn citing: R. A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Two values have been corrected, 7.82 with 7.81 and 4.60 with 4.61
  9. ^ R Tutorial: Chi-squared Distribution

Literatura

уреди

Spoljašnje veze

уреди