Sobivuse statistika. Kokkuleppe kriteerium. Mida me saadud materjaliga ette võtame?

Kuna kõik konkreetse jaotuse olemuse eeldused on hüpoteesid, mitte kategoorilised väited, tuleks neid loomulikult statistiliselt testida niinimetatud sobivuse testide abil.

Kehtestatud jaotusseadusel põhinevad sobivuse kriteeriumid võimaldavad kindlaks teha, millal tuleks teoreetilise ja empiirilise sageduse erinevusi pidada ebaoluliseks (juhuslikuks) ja millal - oluliseks (mitte juhuslikuks). Seega võimaldavad sobivuse kriteeriumid seeria joondamisel esitatud hüpoteesi tagasi lükata või kinnitada

umbes jaotuse olemuse kohta empiirilises seerias ja anda vastus, kas antud empiirilise jaotuse korral on võimalik aktsepteerida mudeli, mida väljendab mõni teoreetiline jaotuse seadus.

Nõusoleku saamiseks on mitmeid kriteeriume. Teistest sagedamini kasutatakse Pearsoni, Romanovski ja Kolmogorovi kriteeriume. Vaatleme neid.

Pearsoni sobivuse test% 2 (chi-ruut) on üks peamisi sobivuse testid. Selle kriteeriumi pakkus välja inglise matemaatik Karl Pearson (1857–1936), et hinnata empiirilise ja teoreetilise jaotuse sageduste erinevuste juhuslikkust (olulisust). Pearsoni kriteerium, kus k

rühmade arv, milleks empiiriline jaotus jaguneb;

tunnuse täheldatud sagedus i-ndas rühmas; eeldatavast jaotusest arvutatud teoreetiline sagedus. Y) jaotuse jaoks koostatakse tabelid, mis näitavad kokkuleppejärgmise kriteeriumi kriitilist väärtust valitud olulisustaseme a ja antud arvu vabadusastmete V korral (vt 4. lisa).

Tähtsustase a on pakutud hüpoteesi eksliku tagasilükkamise tõenäosus, s.t. õige hüpoteesi tagasilükkamise tõenäosus. Statistilistes uuringutes kasutatakse sõltuvalt lahendatavate ülesannete olulisusest ja vastutusest järgmisi kolme olulisuse taset: 1)

a \u003d 0,10, siis P \u003d 0,90; 2)

a \u003d 0,05, siis P \u003d 0,95; 3)

a \u003d 0,01, siis P \u003d 0,99.

Näiteks tähendab tõenäosus 0,01, et õige hüpoteesi saab ühel juhul 100-st tagasi lükata. Majandusuuringutes peetakse vea tõenäosust 0,05 praktiliselt vastuvõetavaks, s.o. 5 juhul 100st võib õige hüpoteesi tagasi lükata.

Lisaks sõltub tabelist määratud% 2 kriteerium ka vabadusastmete arvust. Vabadusaste V arv on defineeritud kui rühmade arv jaotusseerias k, millest lahutatakse V-ga seotud sidemete arv

Ühenduste arvu all mõistetakse teoreetiliste sageduste arvutamisel kasutatud empiiriliste seeriate indikaatorite arvu, s.o. empiirilist ja teoreetilist ühendavad näitajad

sagedused

Nii et normaaljaotuskõvera piki joondamist on kolm seost:

x ~ x "" SU \u003d a "* x W \u003d Y

EMF teooria 'EMF TheOr\u003e ^ 1EMF ^ / teooria *

Seetõttu määratakse normaaljaotuskõvera piki joondumist vabadusastmete arv V \u003d k - 3, kus k on reas olevate rühmade arv.

Poissoni kõvera joondamisel V \u003d k - 2, kuna sageduste ehitamisel kasutatakse kahte piiravat piirangut: x, 1tr /

Olulisuse hindamiseks võrreldakse arvutatud% 2 arvutatud väärtust tabeliga% 2tab.

Kui teoreetiline ja empiiriline jaotus langevad täielikult kokku, siis% 2 \u003d 0, vastasel juhul% 2\u003e 0.

Kui Xcalc\u003e Xtabl 'T0 antud olulisuse taseme a ja vabadusastmete arvu V korral, lükkame ümber hüpoteesi, mille kohaselt lahknevused on ebaolulised (juhuslikud).

Kui% 2acc ^ X2tabL 'järeldame, et empiiriline seeria on eeldatava jaotuse hüpoteesiga ja tõenäosusega (1 - a) kooskõlas, võib väita, et teoreetilise ja empiirilise sageduse erinevus on juhuslik.

Lepingu? 2 kriteeriumi kasutades peavad olema täidetud järgmised tingimused: 1)

uuritud populatsiooni maht peaks olema piisavalt suur (UU\u003e 50), samas kui iga rühma sagedus või suurus peaks olema vähemalt 5.

Kui seda tingimust rikutakse, on vaja kõigepealt ühendada väikesed sagedused; 2)

empiiriline jaotus tuleks valida juhuslikult, s.t. nad peavad olema sõltumatud.

Kui empiirilises reas on jaotus antud sageduste / \\ m abil.

siis y) tuleks arvutada valemi abil

Romanovski kriteerium Kp põhineb Pearsoni kriteeriumil% 2, s.o. juba leitud väärtused% 2 ja vabadusastmete arv v:

See on üsna mugav, kui% 2 jaoks pole ühtegi tabelit.

Kui Cr 3, siis mitte juhuslikult

ja järelikult ei saa teoreetiline jaotus olla uuritud empiirilise jaotuse mudeliks.

Kolmogorovi kriteerium X põhineb akumuleeritud sageduste või empiirilise ja teoreetilise jaotuse sageduste maksimaalse erinevuse kindlaksmääramisel:

X \u003d -2 \u003d või X \u003d, iN

kus Dud on akumuleerunud sageduste (F - F) ja akumuleerunud sageduste maksimaalne erinevus

jaotuse empiiriliste ja teoreetiliste seeriate nimisagedused (p - p);

N on ühiku arv ühikus.

Pärast tabeli P (k) (vt 6. liide) X väärtuse arvutamist määrake tõenäosus, mille abil saab väita, et empiiriliste sageduste kõrvalekalded teoreetilistest on juhuslikud. Tõenäosus P (k) võib varieeruda vahemikus 0 kuni 1. Kui P (k) \u003d 1 on täielik sageduste kokkulangevus, kui P (k) \u003d 0 - täielik lahknemine. Kui A võtab väärtused kuni 0,3, siis P (k) \u003d 1.

Kolmogorovi kriteeriumi kasutamise peamine tingimus on piisavalt suur arv vaatlusi.

Näide. Tabelis olevate andmete kasutamine. 5.17, et kontrollida ringkonna värvatud töötajate jaotuse kohta normaaljaotuse seaduse alusel esitatud hüpoteesi õigsust. Sobivuse kriteeriumi arvutamiseks vajalikud väärtused on esitatud tabelis. 5.19.

Tabel 5.19

Koguste arvutamine Pearsoni x2 ja Kolmogorovi X kokkuleppekriteeriumide määramiseks Kõrgus, cm Jaotussarja sagedused (/ n - t ") 2 t" FF "cr, \\" A 1 2 3 4 5 6 156-160 8 5 1 , 8 8 5 3 161-165 17 16 0,1 25 21 4 166-170 42 40 0,1 67 61 6 171-175 54 65 1,9 121 126 5 176-180 73 73 0 194 199 5 181-185 57 57 0 251 256 5 186-190 38 30 2,1 289 286 3 191-195 11 11 0 300 297 3 X 300 297 6,0 Kõigepealt arvutage Pearsoni kriteerium

Seejärel valime olulisuse taseme a \u003d 0,05 ja määrame vabadusastmete arvu V. Selles jaotuses on 8 rühma ja ühenduste (parameetrite) arv on 3, seega V \u003d 8 - 3 \u003d 5. Vastavalt 4. lisa tabelile leiame, et a \u003d 0, 05 ja V \u003d 5 Pearsoni test% 2 \u003d 11,07.

Kuna arvutatud% 2, kontrollime esitatud hüpoteesi, kasutades Romanovski kriteeriumi:

I X2 - V I 16,0 - 5 I 1

cr \u003d] G \u003d ^ \u003d 1 \u003d - r \u003d 0,3.

Kuna Kp Romanovsky kriteerium kinnitab ka seda, et empiiriliste ja teoreetiliste sageduste erinevused on ebaolulised.

Mõelgem nüüd Kolmogorovi kriteeriumi A kohaldamisele,. Nagu tabelist näha. 5.19, on kumulatiivsete sageduste maksimaalne erinevus 6, s.t. B \u003d shah! / 1 - P "\\ \u003d 6. Seetõttu Kolmogorovi kriteerium

X \u003d -? \u003d \u003d \u003d 0,35.

6. liites esitatud tabeli kohaselt leiame tõenäosusväärtuse X \u003d 0,35: P (X) \u003d 0,9997. See tähendab, et tõenäosusega, mis on lähedane ühtsusele, võib väita, et normaaljaotuse hüpoteesi ei lükata ümber ning empiirilise ja teoreetilise jaotuse erinevused on juhuslikud.

Nüüd, kui on teada hüpoteesi õigsus, kasutades teadaolevaid sobivuse headuse kriteeriume, on võimalik levitamistulemusi kasutada praktiliste tegevuste jaoks.

Näide. Tabelis olevate andmete kasutamine. 5.18, et testida hüpoteesi, et autode rikete arv jaotus vastab Poissoni seadusele.

Algandmed ja sobivuse kriteeriumide kindlaksmääramiseks vajalike väärtuste arvutused on esitatud tabelis. 5.20.

Arvutame väärtuse% 2: 2

Dfasch ^ / 9

(vt tabel 5.20). xXtabl \u003d 9\u003e 49

(vt 4. lisa).

Kuna arvutatud% 2. Seega ei lükata hüpoteesi autode rikete jaotuse kohta Poissoni seaduse kohaselt ümber.

Sissejuhatus

Selle teema olulisus seisneb selles, et biostatistika põhialuste uurimisel eeldasime, et elanikkonna jaotusseadus on teada. Mis saab aga siis, kui jaotusseadus pole teada, kuid on alust eeldada, et sellel on teatud vorm (nimetagem seda A-ks), siis testitakse nullhüpoteesi: üldpopulatsioon jaotatakse vastavalt seadusele A. Seda hüpoteesi testitakse spetsiaalselt valitud juhusliku muutuja - sobivuse testi - abil.

Sobivuse testid on hüpoteeside testid empiirilise jaotuse ja teoreetilise tõenäosusjaotuse vastavuse kohta. Need kriteeriumid jagunevad kahte klassi:

  • III Üldised sobivuse kriteeriumid kehtivad hüpoteesi kõige üldisemale sõnastusele, nimelt hüpoteesile, et vaadeldud tulemused vastavad eeldatava tõenäosusjaotuse eeldatavale jaotusele.
  • III Spetsiaalsed sobivuse testid hõlmavad spetsiaalseid nullhüpoteese, mis vastavad tõenäosusjaotuse teatud kujule.

Nõusoleku kriteerium

Kõige tavalisemad sobivuse kriteeriumid on oomega-ruut, chi-ruut, Kolmogorov ja Kolmogorov-Smirnov.

Kolmogorovi, Smirnovi ja oomega ruudu mitteparameetrilisi headuse teste kasutatakse laialdaselt. Neid seostatakse statistiliste meetodite rakendamisel levinud vigadega.

Asi on selles, et loetletud kriteeriumid olid kavandatud testima kokkulepet täielikult teada oleva teoreetilise jaotusega. Arvutusvalemid, jaotustabelid ja kriitilised väärtused on laialt levinud. Kolmogorovi, oomega ruudu jms kriteeriumide peamine idee on mõõta empiirilise jaotusfunktsiooni ja teoreetilise jaotusfunktsiooni vahelist kaugust. Need kriteeriumid erinevad jaotusfunktsioonide ruumis vahemaade kujul.

Pearsoni ch2 headuse test lihtsa hüpoteesi jaoks

K. Pearsoni teoreem viitab sõltumatutele uuringutele, millel on piiratud arv tulemusi, s.o. Bernoulli testidele (mõnevõrra laiendatud tähenduses). See võimaldab teil otsustada, kas paljude uuringute vaatlused vastavad nende tulemuste sagedusele nende eeldatavate tõenäosustega.

Paljude praktiliste probleemide korral pole täpne turustusseadus teada. Seetõttu püstitatakse hüpotees olemasoleva vaatluste põhjal üles ehitatud empiirilise seaduse vastavuse kohta mõnele teoreetilisele. See hüpotees nõuab statistilist testimist, mille tulemused kinnitatakse või lükatakse ümber.

Olgu X uuritav juhuslik muutuja. On vaja testida hüpoteesi H0, et see juhuslik muutuja vastab jaotuse seadusele F (x). Selleks on vaja teha n sõltumatute vaatluste valim ja kasutada seda empiirilise jaotuse seaduse F moodustamiseks (x). Empiiriliste ja hüpoteetiliste seaduste võrdlemiseks kasutatakse reeglit, mida nimetatakse sobivuse kriteeriumiks. Üks populaarsemaid on K. Pearsoni chi-square headuse test. arvutatakse chi-ruudu statistika:

kus N on empiirilise jaotuse seaduse konstrueerimiseks kasutatud intervallide arv (vastava histogrammi veergude arv), i on intervalli arv, pt i on teoreetilise jaotuse seaduse i-ndasse intervalli langeva juhusliku muutuja väärtuse tõenäosus, pe i on juhusliku muutuja väärtuse tõenäosus empiirilise jaotuse seaduse i-ndas intervallis. See peab järgima chi-ruutjaotust.

Kui arvutatud statistika ületab k-p-1 vabadusastmega antud olulisusastme jaoks chi-ruutjaotuse kvantiili, lükatakse hüpotees H0 tagasi. Muidu aktsepteeritakse seda antud olulisuse tasemel. Siin k on vaatluste arv, p on jaotusseaduse hinnanguliste parameetrite arv.

Mõelge statistikale:

P2 statistikat nimetatakse lihtsa hüpoteesi korral Pearsoni chi-ruut statistikaks.

On selge, et h2 on kahe r-mõõtmelise vektori teatud vahemaa ruut: suhteliste sageduste vektor (mi / n,…, mr / n) ja tõenäosuste vektor (pi,…, pr). See vahemaa erineb Eukleidese vahemaast ainult selle poolest, et erinevad koordinaadid sisestavad selle erineva raskusega.

Arutleme statistika h2 käitumise üle juhul, kui hüpotees H on tõene, ja juhul, kui H on vale. Kui H vastab tõele, siis on h2 asümptootiline käitumine n\u003e korral? osutab K. Pearsoni teoreem. Et mõista, mis juhtub punktiga 2.2, kui Н on vale, tuleb märkida, et suurte arvude seaduse kohaselt on mi / n\u003e pi n\u003e? Jaoks, kui i \u003d 1,…, r. Seetõttu n\u003e ?:

See väärtus on 0. Seega, kui H on vale, siis h2\u003e? (n\u003e? jaoks).

Öeldu põhjal järeldub, et H tuleks tagasi lükata, kui katses saadud h2 väärtus on liiga suur. Nagu alati, tähendavad sõnad “liiga suur”, et h2 täheldatud väärtus ületab kriitilise väärtuse, mille võib sel juhul võtta chi-ruudu jaotustabelitest. Teisisõnu, tõenäosus P (h2 npi h2) on väike väärtus ja seetõttu pole tõenäoline, et see saab kogemata sama, mis katses, või veelgi suurem erinevus sageduste vektori ja tõenäosuste vektori vahel.

Selle reegli aluseks oleva K. Pearsoni teoreemi asümptootilisus nõuab selle praktilises kasutamises ettevaatust. Sellele saab loota ainult suurte n-ide korral. Tuleb otsustada, kas n on piisavalt suur, võttes arvesse tõenäosusi pi,…, pr. Seetõttu ei saa näiteks öelda, et piisab sajast vaatlusest, kuna mitte ainult n ei tohiks olla suur, vaid ka korrutis npi, ..., npr (eeldatavad sagedused) ei tohiks olla väikesed. Seetõttu osutus keeruliseks h2 (pideva jaotuse) lähendamine statistikale h2, mille jaotus on diskreetne. Teoreetiliste ja eksperimentaalsete argumentide kombinatsioon pani uskuma, et see lähendamine on rakendatav, kui kõik eeldatavad sagedused npi\u003e 10. kui arv r (erinevate tulemuste arv) suureneb, vähendatakse piirmäära (5-ni või isegi 3-ni, kui r on mitmekümne suurusjärgus). Nende nõuete täitmiseks on praktikas mõnikord vaja ühendada mitu tulemust, s.t. minge Bernoulli skeemi juurde väiksema r-ga.

Kirjeldatud kokkuleppe kontrollimise meetodit saab kasutada mitte ainult Bernoulli testide, vaid ka juhuslike proovide jaoks. Varem tuleb nende tähelepanekud muuta rühmitamise teel Bernoulli katseteks. Seda tehakse järgmisel viisil: vaatlusruum jagatakse lõplikuks arvuks eraldatud piirkondadeks ja seejärel arvutatakse iga piirkonna jaoks vaadeldud sagedus ja hüpoteetiline tõenäosus.

Sel juhul lisandub eelnevalt loetletud lähenemisraskustele veel üks raskus - algse ruumi mõistliku jaotuse valik. Samal ajal tuleb hoolitseda selle eest, et üldiselt oleks valimi esialgse jaotuse hüpoteesi testimise reegel võimalike alternatiivide suhtes piisavalt tundlik. Lõpetuseks märgin, et Bernoulli skeemi taandamisel põhinevad statistilised testid ei ole reeglina kõigi alternatiivide suhtes järjepidevad. Seega on see nõusoleku kontrollimise meetod piiratud väärtusega.

Kolmogorovi - Smirnovi headuse test on selle klassikalisel kujul võimsam kui ch2 kriteerium ja seda saab kasutada hüpoteesi kontrollimiseks empiirilise jaotuse vastavuse kohta teoreetilisele pidevale jaotusele F (x) varem teadaolevate parameetritega. Viimane asjaolu seab mehaaniliste katsete tulemuste analüüsimisel selle kriteeriumi laiaulatusliku praktilise rakendamise võimaluse piirangutele, kuna mehaaniliste omaduste omaduste jaotusfunktsiooni parameetreid hinnatakse reeglina proovi enda andmete põhjal.

Kolmogorovi - Smirnovi kriteeriumi kasutatakse grupeerimata andmete või grupeeritud andmete korral väikese intervallilaiuse korral (näiteks võrdne jõudumõõturi skaalajaotise väärtusega, koormustsükli loenduriga jne). Olgu n näidiseeria katsetamise tulemus mehaaniliste omaduste karakteristikute variatsiooniseeria

x1? x2? ...? xi? ...? xn. (3,93)

Vajalik on kontrollida nullhüpoteesi, et valimi jaotus (3.93) kuulub teoreetilisse seadusesse F (x).

Kolmogorovi - Smirnovi kriteerium põhineb akumuleerunud elemendi maksimaalse hälbe jaotusfunktsiooni väärtusel. Selle kasutamisel arvutatakse statistika

mis on Kolmogorovi testi statistika. Kui ebavõrdsus

Dnvn? laup (3.97)

suurte proovide korral (n\u003e 35) või

Dn (vn + 0,12 + 0,11 / vn)? laup (3.98)

n jaoks? 35, nullhüpoteesi ei lükata tagasi.

Kui ebavõrdsused (3.97) ja (3.98) ei ole rahul, võetakse vastu alternatiivne hüpotees, et valim (3.93) kuulub tundmatusse jaotusse.

Otsmiku kriitilised väärtused on: l0,1 \u003d 1,22; 10,05 \u003d 1,36; l0,01 \u003d 1,63.

Kui funktsiooni F (x) parameetreid ei ole ette teada, kuid neid hinnatakse valimi andmete põhjal, kaotab Kolmogorovi - Smirnovi test oma universaalsuse ja seda saab kasutada ainult katseandmete vastavuse kontrollimiseks ainult mõne konkreetse jaotusfunktsiooni suhtes.

Kui eksperimentaalsed andmed kuuluvad normaaljaotusesse või logaritmiliselt normaaljaotusesse, arvutatakse statistika nullhüpoteesina:

kus Ц (zi) on funktsiooni Laplace väärtus

Ц (zi) \u003d (xi - xср) / s Kolmogorovi - Smirnovi kriteerium mis tahes valimi suuruse n korral on kirjutatud kujul

Otsmiku kriitilised väärtused on sel juhul järgmised: l0,1 \u003d 0,82; l0,05 \u003d 0,89; 10,01 \u003d 1,04.

Kui kontrollitakse hüpoteesi valimi *** vastavuse kohta eksponentsiaalsele jaotusele, mille parameetrit hinnatakse katseandmete põhjal, arvutatakse sarnane statistika:

empiiriline tõenäosuskatse

ja moodustavad Kolmogorovi - Smirnovi kriteeriumi.

Otsmiku kriitilised väärtused sel juhul: l0,1 \u003d 0,99; l0,05 \u003d 1,09; l0,01 \u003d 1,31.

Ühenduse tiheduse hindamiseks kasutatakse variatsiooninäitajaid:

1. Totaalne dispersioon efektiivne omadus - kajastab tegurite kumulatiivset mõju:

2. Faktorite erinevus efektiivne tunnus - peegeldab variatsiooni ainult uuritud teguri mõjust x:

Iseloomustab joondatud väärtuste varieeruvust y xkogu keskmisest.

3. Jääkvariatsioon kuvab tegeliku tunnuse variatsiooni kellkõigist teistest, v.a. xtegurid:

Faktoriaalse ja koguarvu suhe peegeldab suhete tihedat taset x ja kell.

määramisindeks - faktoriaalse dispersiooni osatähtsus kogu dispersioonis. Kui see väljend esitatakse kujul, siis Rsaab olema korrelatsiooniindeks .

Põhineb dispersioonide liitmise reeglil (\u003d + korrelatsiooniindeksit saab esitada järgmiselt: või. Korrelatsiooniindeksit kasutatakse suhete tiheduse hindamiseks kõigi suhtlusvormide korral.

Liiniühenduse tiheduse mõõtmiseks lineaarne korrelatsioonikordaja:

Näitajate vaheliste suhete läheduse kvalitatiivne hinnang antakse Chaddocki skaala abil:

Mõelgem tingimusliku näite kasutamisele paarikorrelatsiooni seose regressioonkorrelatsiooni analüüsi rakendamisel. 8 hotelli töö kohta on valikuline teave, kuna hotellitoa keskmine täituvus aastas on erinev ja nende tegevuse tasuvus erinev. Regressioon-korrelatsioonianalüüsi tulemusel on äärmiselt oluline kindlaks teha, kas hotellitubade hõivatuse vahel on otsene seos ja kui see on olemas, kui lähedane see on:

N lk Täituvus (%%) x Kasumlikkus (%%) x 2 kell 2 hu Tasandatud (teoreetiline) y x
8,2 7,0 9,3 8,1 9,5 10,5 7,5 6,3 67,24 49,00 86,49 65,61 90,25 110,25 56,25 39,69 492,0 364,0 669,6 526,5 712,5 840,0 420,0 315,0 7,61 6,65 9,05 8,21 9,41 10,01 7,13 6,41
66,4 564,78 4339,6 64,48

Määrame kindlaks lineaarse paari regressioonivõrrandi parameetrid:

Meie paarisuunaline regressioonivõrrand näeb välja järgmine: Asendage selle võrrandiga x empiirilised väärtused ja arvutage teoreetilised väärtused 7,61 jne.

Nüüd määrame kindlaks hotellide hõivatuse ja nende tegevuse kasumlikkuse vaheliste suhete läheduse:

Analüüsi tulemusel leiti, et hotellide täitmise ja nende tegevuse kasumlikkuse vahel on väga kõrge otsene seos.

Praktikas on sageli äärmiselt oluline hinnata empiiriliste sageduste lähedust teoreetilistele. Sellise hinnangu andmiseks võib kasutada läheduskriteeriume, mida nimetatakse nõusoleku kriteeriumid. Kõige sagedamini kasutatakse nendel eesmärkidel - pearsoni sobivuse test (ʼʼHiʼʼ-ruut), mis arvutatakse järgmise valemi abil:

kus f -empiirilised sagedused,

Teoreetilised sagedused.

Hinnang empiiriliste sageduste lähedusele teoreetilistele on määratud saavutamise tõenäosusega sellest väärtusest R ( ) juhuslike sagedushälvetega. Juhul kui tõenäosus R ( ) erineb oluliselt nullist (suurem kui 0,05), siis võib empiiriliste sageduste kõrvalekaldeid teoreetilistest sagedusteks lugeda juhuslikeks. Kui R ( )< 0,05, siis ei saa hälbeid pidada juhuslikeks ning empiiriliseks ja teoreetiliseks jaotuseks on üksteisest põhimõtteliselt erinevad.

Kogus sõltub mitte ainult tegelike sageduste kõrvalekalletest teoreetilistest, vaid ka rühmade arvust, kuhu populatsioon jaguneb, sellega seoses kriitiliste väärtuste tabelid arvutatud empiiriliste sageduste erineva vabaduse astmete jaoks (lisa). Peaks ütlema, et normaalse jaotuse korral vabadusastmete arv K \u003d n-3kus n Kas rühmade arv P ( , mis ületab oluliselt 0,05. See tähendab, et tegelike sageduste kõrvalekaldeid empiirilistest võib pidada juhuslikuks ja piletite realiseerimise jaotus ise on normaaljaotusele lähedane.

1. lisa

Nõusoleku kriteeriumid - kontseptsioon ja tüübid. Kategooria "Lepingukriteeriumid" klassifikatsioon ja omadused 2017, 2018.

Käesolevas numbris käsitleme ühte hüpoteeside tõenäosuse testimisega seotud küsimust, nimelt teoreetilise ja statistilise jaotuse järjepidevuse küsimust.

Oletame, et antud statistiline jaotus on mõne teoreetilise kõvera abil lamestatud f (x)(joonis 7.6.1). Ükskõik kui hästi teoreetiline kõver sobib, on mõned erinevused selle ja statistilise jaotuse vahel vältimatud. Loomulikult kerkib küsimus: kas neid lahknevusi seletavad ainult juhuslikud asjaolud, mis on seotud piiratud arvu vaatlustega, või on need olulised ja seotud asjaoluga, et meie paigaldatud kõver ei lamenda antud statistilist jaotust. Sellele küsimusele vastamiseks kasutatakse nn nõusolekukriteeriume.

RANDOMVÄÄRTUSTE JAOTAMISE SEADUSED



Sobivuse kriteeriumide kohaldamise idee on järgmine.

Selle statistilise materjali põhjal peame kontrollima hüpoteesi H,koosneb asjaolust, et juhuslik muutuja Xjärgib mõnda kindlat turustusseadust. Seda seadust saab täpsustada ühel või teisel kujul: näiteks jaotusfunktsiooni vormis F (x)või jaotustiheduse vormis f (x),või tõenäosuste kogumina p t,kus p ton tõenäosus, et kogus Xjäävad sisse ma midagiheakskiidu andmine.

Kuna nendest moodustub jaotusfunktsioon F (x)on kõige üldisem ja määratleb kõik muud, sõnastame hüpoteesi H,seisneb selles, et kogus Xomab jaotusfunktsiooni ^ (q :).

Hüpoteesi aktsepteerimiseks või ümberlükkamiseks H,kaaluge mõnda kogust U,iseloomustab lahknevuse astet teoreetilise ja statistilise jaotuse vahel. Kogus Usaab valida mitmel viisil; näiteks kui Uvõite võtta teoreetiliste tõenäosuste kõrvalekallete ruutude summa p tvastavatelt sagedustelt r *või mõne "koefitsiendiga (" kaalu ") ruutude summa või statistilise jaotuse funktsiooni maksimaalne hälve F * (x)teoreetilisest F (x)ja nii edasi. Oletame, et kogus Uvalitud ühel või teisel viisil. Ilmselt on see mõni juhuslik väärtus.Selle juhusliku muutuja jaotusseadus sõltub juhusliku muutuja jaotusseadusest X,mille alusel katseid tehti, ja katsete arvu kohta lk.Kui hüpotees Hon tõsi, siis koguse jaotamise seadus Uon määratud koguse jaotusseadusega X(funktsioon F (x))ja number lk.

Oletagem, et teame seda levitamisseadust. Selle katseseeria tulemusel leiti, et valitud mõõt



LEPINGU KRITEERIUMID


erinevused Uvõttis teatava tähtsuse ja.Küsimus on selles, kas seda saab seletada juhuslike põhjustega või on see erinevus liiga suur ja kas see näitab olulist erinevust teoreetilise ja statistilise jaotuse vahel ning sellest tulenevalt hüpoteesi sobimatust H?Sellele küsimusele vastamiseks eeldage, et hüpotees Hon õige ja arvutame selle eelduse põhjal tõenäosuse, et juhuslikel põhjustel, mis on seotud eksperimentaalse materjali ebapiisava mahuga, on lahknevuse mõõt Uon vähemalt väärtus, mida oleme kogemuste põhjal täheldanud jasee tähendab, et arvutame sündmuse tõenäosuse:

Kui see tõenäosus on väga väike, siis hüpotees Htuleks tagasi lükata kui ebatõenäoline; kui see tõenäosus on oluline, tuleks tõdeda, et eksperimentaalsed andmed ei ole hüpoteesiga vastuolus N.

Tekib küsimus, kuidas tuleks valida lahknevuse mõõt £ /? Selgub, et mõne selle valimise meetodi puhul on koguse jaotamise seadus Uomab väga lihtsaid omadusi ja piisavalt suure lkfunktsioonist praktiliselt sõltumatu F (x).Neid lahknevuse mõõtmeid kasutatakse matemaatilises statistikas sobivuse kriteeriumina.

Mõelge ühele kõige sagedamini kasutatavale sobivuse testile, nn testile u? "Pearson.

Oletame, et oleme läbi viinud hektarit sõltumatuid katseid, millest igas juhuslik muutuja Xvõttis teatud tähenduse. Katsete tulemused on kokkuvõtlikult esitatud knumbrit ja vormindatakse statistilise seeriana.

Null (peamine) nimetatakse hüpoteesiks, mis on esitatud tundmatu jaotuse vormi või teadaolevate jaotuste parameetrite kohta. Võistlevad (alternatiiv) nimetatakse hüpoteesiks, mis on vastuolus nulliga.

Näiteks kui nullhüpotees koosneb eeldusest, et juhuslik muutuja X levitatakse vastavalt seadusele, siis võib konkureeriv hüpotees seisneda eelduses, et juhuslik muutuja X levitatakse erineva seaduse kohaselt.

Statistiline kriteerium (või lihtsalt kriteerium) kutsuda mõni juhuslik muutuja TO, mis on mõeldud nullhüpoteesi testimiseks.

Pärast teatud kriteeriumi, näiteks kriteeriumi valimist jagatakse kõigi selle võimalike väärtuste kogum kaheks eraldiseisvaks alamhulgaks: üks neist sisaldab selle kriteeriumi väärtusi, mille jaoks nullhüpotees lükatakse tagasi, ja teine, mille jaoks see aktsepteeritakse.

Kriitiline piirkond nimetatakse kriteeriumi väärtuste kogumit, mille korral lükatakse tagasi nullhüpotees. Hüpoteesi aktsepteerimise piirkond nimetatakse kriteeriumide väärtuste kogumit, mille alusel hüpoteesi aktsepteeritakse. Kriitilised punktid on punktid, mis eraldavad kriitilise piirkonna nullhüpoteesi aktsepteerimispiirkonnast.

Meie näite korral, kui väärtus, siis valimist arvutatud väärtus vastab hüpoteesi aktsepteerimisalale: juhuslik muutuja jaotatakse vastavalt seadusele. Kui arvutatud väärtus, siis langeb see kriitilisse piirkonda, see tähendab, et hüpotees juhusliku muutuja jaotuse kohta vastavalt seadusele lükatakse tagasi.

Jaotuse korral määratakse kriitiline piirkond ebavõrdsusega ja nullhüpoteesi aktsepteerimise piirkond määratakse ebavõrdsusega.

2.6.3. Nõusoleku kriteerium Pearson.

Zootehnika ja veterinaargeneetika üheks ülesandeks on vajalike omadustega uute tõugude ja liikide väljaarendamine. Näiteks suurenenud immuunsus, haiguskindlus või karusnaha värvus.

Praktikas selgub tulemuste analüüsimisel väga sageli, et tegelikud tulemused vastavad suuremal või vähemal määral mingile teoreetilisele jaotuse seadusele. Vajalik on hinnata tegelike (empiiriliste) andmete ja teoreetilise (hüpoteetilise) vastavuse astet. Selleks püstitatakse nullhüpotees: saadud populatsioon jaotatakse vastavalt seadusele "A". Eeldatava jaotusseaduse hüpoteesi testitakse spetsiaalselt valitud juhusliku muutuja abil - sobivuse testiga.

Nõusoleku kriteeriumnimetatakse tundmatu jaotuse eeldatava seaduse hüpoteesi testimise kriteeriumiks.

Kokkuleppel on mitu kriteeriumi: Pearson, Kolmogorov, Smirnov jne. Kõige sagedamini kasutatakse Pearsoni sobivuse testi.

Vaatleme Pearsoni kriteeriumi rakendamist hüpoteesi testimise näitel üldpopulatsiooni normaalse jaotuse kohta. Selleks võrdleme empiirilisi ja teoreetilisi (arvutatud normaaljaotuse jätkudes) sagedusi.

Teoreetiliste ja empiiriliste sageduste vahel on tavaliselt erinevus. näiteks:

Empiirilised sagedused 7 15 41 93 113 84 25 13 5

Teoreetilised sagedused 5 13 36 89 114 91 29 14 6

Vaatleme kahte juhtumit:

Teoreetilise ja empiirilise sageduse erinevus on juhuslik (ebaoluline), s.t. saate teha ettepaneku empiiriliste sageduste jaotuse kohta vastavalt tavalisele seadusele;

Teoreetilise ja empiirilise sageduse erinevus ei ole juhuslik (oluline), s.t. teoreetilised sagedused arvutatakse üldpopulatsiooni normaaljaotuse vale hüpoteesi põhjal.

Pearsoni sobivuse testi abil on võimalik kindlaks teha, kas teoreetilise ja empiirilise sageduse erinevus on juhuslik, s.t. antud usaldusnivoo korral määrake, kas üldine elanikkond jaguneb tavapärase seaduse kohaselt või mitte.

Niisiis, saadakse empiiriline jaotus suuruse n proovi jaoks:

Valikud ...

Empiirilised sagedused ...

Eeldame, et teoreetilised sagedused arvutatakse normaaljaotuse eeldusel. Tähtsuse tasemel tuleb kontrollida nullhüpoteesi: üldpopulatsioon jaotub tavaliselt.

Nullhüpoteesi testimise kriteeriumina võtame juhusliku muutuja

(*)

See väärtus on juhuslik, kuna erinevates katsetes võtab see erinevaid, varem tundmatuid väärtusi. On selge, et mida vähem empiirilised ja teoreetilised sagedused erinevad, seda väiksem on kriteeriumi väärtus ja seetõttu iseloomustab see mingil määral empiiriliste ja teoreetiliste jaotuste lähedust.

On tõestatud, et juhusliku muutuja (*) jaotusseadus, olenemata sellest, millisele jaotusseadusele elanikkond kuulub, kaldub vabadusastmetega jaotusseadusesse. Seetõttu tähistatakse juhusliku muutujaga (*) läbi ja kriteeriumi ennast nimetatakse "chi-ruudu" sobivuse testiks.

Tähistagem vaatlusandmetest arvutatud kriteeriumi väärtust läbi. Määratakse kindlaksmääratud olulisuse taseme ja vabadusastmete arvu kriteeriumi tabelid. Sel juhul määratakse vabadusastmete arv võrdsusest, kus proovi või klasside rühmade arv (osalised intervallid); - eeldatava jaotuse parameetrite arv. Normaaljaotusel on kaks parameetrit - matemaatiline ootus ja standardhälve. Seetõttu leitakse normaaljaotuse vabadusastmete arv võrdsusest

Kui arvutatud väärtus ja tabeli väärtus rahuldavad ebavõrdsust , aktsepteeritakse nullhüpoteesi üldpopulatsiooni normaalse jaotuse kohta. Kui , lükatakse nullhüpotees tagasi ja aktsepteeritakse alternatiivset hüpoteesi (üldpopulatsioon ei jagune normaalse seaduse järgi).

Kommenteeri. Pearsoni sobivuse testi kasutamisel peab valimi suurus olema vähemalt 30. Igas rühmas peab olema vähemalt 5 varianti. Kui gruppides on vähem kui 5 sagedust, ühendatakse need naaberrühmadega.

Üldreeglina määratletakse chi-ruutjaotuse vabadusastmete arv kui koguste koguarv, mille jaoks vastavad näitajad arvutatakse, lahutades neid koguseid ühendavate tingimuste arvu, s.o. vähendada nende vahelise variatsiooni võimalust. Lihtsaimal juhul võrdub arvutamisel vabadusastmete arv klasside arvuga, vähendatuna ühe võrra. Nii saadakse näiteks dihübriidse tükeldamisega 4 klassi, kuid ainult esimene klass saadakse seoseta, järgmised on juba eelmistega ühendatud. Seetõttu dihübriidseks jagamiseks vabadusastmete arv.

Näide 1. Määrake, kas rühmade tegelik jaotus vastab tuberkuloosiga lehmade arvule teoreetiliselt eeldatava lehmade arvuga, mis arvutati normaaljaotuse arvestamisel. Esialgsed andmed on kokku võetud tabelis:

Otsus.

Olulisuse taseme ja vabadusastmete arvu järgi kriitiliste jaotuspunktide tabelist (vt lisa 4) leiame väärtuse ... Niivõrd kui , võib järeldada, et erinevus teoreetiliste ja tegelike sageduste vahel on juhuslik. Seega vastab rühmade tegelik jaotus tuberkuloosiga lehmade arvu järgi teoreetiliselt eeldatavale.

Näide 2. Küülikute dihübriidse ristamisega Mendeli seaduse kohaselt saadud teises põlvkonnas saadud isendite teoreetiline fenotüübiline jaotus on 9: 3: 3: 1. Küülikute empiirilise jaotuse vastavus tuleb arvutada normaalsete karvadega mustade isendite ristamisel poriste loomade - albiinodega. Teises põlvkonnas ristamisel saadi 120 järglast, sealhulgas 45 mustat lühikeste juustega, 30 musta porist, 25 valget lühikese karvaga, 20 valget porist küülikut.

Otsus. Teoreetiliselt eeldatav jagunemine järglastes peaks vastama nelja fenotüübi suhtele (9: 3: 3: 1). Arvutame iga klassi teoreetilised sagedused (peade arv):

9 + 3 + 3 + 1 \u003d 16, nii et võite oodata mustad lühikarvalised ; must kirju - ; valge lühikarvaline - ; valge rääbine -.

Empiiriline (tegelik) fenotüübi jaotus oli järgmine 45; kolmkümmend; 25; 20.

Võtame kõik need andmed kokku järgmises tabelis:

Kasutades Pearsoni sobivuse testi, arvutame väärtuse:

Vabadusastmete arv dihübriidsel ristumisel. Tähtsuse taseme jaoks leia väärtus ... Niivõrd kui , võib järeldada, et erinevus teoreetiliste ja tegelike sageduste vahel ei ole juhuslik. Järelikult erineb saadud küülikute rühm fenotüüpide jaotuses Mendeli seadusest dihübriidsel ristamisel ja peegeldab teatud tegurite mõju, mis muudavad fenotüübi lõhenemise tüüpi hübriidide teises põlvkonnas.

Pearsoni chi-ruudu sobivuse testi saab kasutada ka kahe homogeense empiirilise jaotuse omavaheliseks võrdlemiseks, s.o. need, kellel on samad klassipiirid. Kahe tundmatu jaotusfunktsiooni võrdsuse hüpotees on aktsepteeritud nullhüpoteesina. Chi-ruudu kriteerium määratakse sellistel juhtudel kindlaks valemiga

(**)

kus ja kus on võrreldud jaotuste mahud; ja - vastavate klasside sagedused.

Vaatleme järgmises näites kahe empiirilise jaotuse võrdlust.

Näide 3. Kägu munade pikkust mõõdeti kahes territoriaaltsoonis. Esimeses tsoonis uuriti 76 muna () proovi, teises 54 (). Saadi järgmised tulemused:

Pikkus (mm)
Sagedused
Sagedused - - -

Olulisuse tasemel tuleb kontrollida nullhüpoteesi, et mõlemad munaproovid kuuluvad samasse kägupopulatsiooni.

Jaga seda: