Vstúpiť
Logopedický portál
  • Čierna panna z Nesvizhu a ďalší známi bieloruskí duchovia Osudné ženy z klanu Radzewill
  • Zámok Nesvizh a odhalenie legendy o čiernej dáme Biela panna Golshan
  • Vanga, biblia a moderní ufológovia o mimozemšťanoch Mimozemšťania sa nám snažia pomôcť
  • Predpovede Nostradama - najzaujímavejšie dedičstvo astrológa
  • Americký profesor povedal, kde môže začať tretia svetová vojna
  • Kreatívny človek - kto to je?
  • Intervaly spoľahlivosti. Konštrukcia intervalu spoľahlivosti pre matematické očakávania všeobecnej populácie Interval spoľahlivosti pre priemer vzorky

    Intervaly spoľahlivosti.  Konštrukcia intervalu spoľahlivosti pre matematické očakávania všeobecnej populácie Interval spoľahlivosti pre priemer vzorky

    Zostavme si v MS EXCEL interval spoľahlivosti pre odhad strednej hodnoty rozdelenia v prípade známej hodnoty rozptylu.

    Samozrejme výber úroveň dôveryúplne závisí od aktuálnej úlohy. Miera dôvery cestujúceho v leteckej doprave v spoľahlivosť lietadla by teda samozrejme mala byť vyššia ako miera dôvery kupujúceho v spoľahlivosť žiarovky.

    Formulácia úlohy

    Predpokladajme, že z populácia s prijatím vzorka veľkosť n. Predpokladá sa, že smerodajná odchýlka táto distribúcia je známa. Nevyhnutné na základe toho vzorky hodnotiť neznáme distribučný priemer(μ, ) a zostrojte zodpovedajúce bilaterálne interval spoľahlivosti.

    Bodový odhad

    Ako je známe z štatistiky(nazvime to X porov) je nestranný odhad priemeru toto populácia a má rozdelenie N(μ;σ 2 /n).

    Poznámka: Čo ak potrebujete stavať interval spoľahlivosti v prípade distribúcie, ktorá nie je normálne? V tomto prípade prichádza na pomoc, ktorá hovorí, že s dostatočne veľkou veľkosťou vzorky n z distribúcie nie normálne, výberové rozdelenie štatistík Х priem bude približne korešpondovať normálne rozdelenie s parametrami N(μ;σ 2 /n).

    takze bodový odhad stredná distribučné hodnoty máme je vzorový priemer, t.j. X porov. Teraz sa poďme zamestnať interval spoľahlivosti.

    Budovanie intervalu spoľahlivosti

    Zvyčajne, keď poznáme rozdelenie a jeho parametre, môžeme vypočítať pravdepodobnosť, že náhodná premenná nadobudne hodnotu z intervalu, ktorý sme zadali. Teraz urobme opak: nájdime interval, do ktorého náhodná premenná s danou pravdepodobnosťou spadá. Napríklad z nehnuteľností normálne rozdelenie je známe, že s pravdepodobnosťou 95% sa náhodná premenná rozloží normálny zákon, bude spadať do intervalu približne +/- 2 od stredná hodnota(pozri článok o). Tento interval bude slúžiť ako náš prototyp interval spoľahlivosti.

    Teraz sa pozrime, či poznáme distribúciu , vypočítať tento interval? Aby sme odpovedali na otázku, musíme špecifikovať formu distribúcie a jej parametre.

    Vieme, že forma distribúcie je normálne rozdelenie(pamätajte, že hovoríme o distribúcia vzoriek štatistiky X porov).

    Parameter μ nám nie je známy (treba ho odhadnúť pomocou interval spoľahlivosti), ale máme jej odhad X cf, vypočítané na základe vzorka, ktoré možno použiť.

    Druhým parametrom je priemerná štandardná odchýlka vzorky bude známy, rovná sa σ/√n.

    Pretože nepoznáme μ, potom zostrojíme interval +/- 2 štandardné odchýlky nie z stredná hodnota, ale z jeho známeho odhadu X porov. Tie. pri výpočte interval spoľahlivosti nebudeme to predpokladať X porov bude spadať do intervalu +/- 2 štandardné odchýlky od μ s pravdepodobnosťou 95% a budeme predpokladať, že interval je +/- 2 štandardné odchýlky od X porov s pravdepodobnosťou 95 % pokryje μ - priemer bežnej populácie, z ktorých vzorka. Tieto dva výroky sú ekvivalentné, ale druhý výrok nám umožňuje konštruovať interval spoľahlivosti.

    Okrem toho spresňujeme interval: náhodnú premennú distribuovanú cez normálny zákon, s 95% pravdepodobnosťou spadá do intervalu +/- 1,960 štandardné odchýlky, nie +/- 2 štandardné odchýlky. To možno vypočítať pomocou vzorca \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. vzorový súbor Sheet Spacing.

    Teraz môžeme sformulovať pravdepodobnostné tvrdenie, ktoré nám poslúži na formovanie interval spoľahlivosti:
    „Pravdepodobnosť, že priemer populácie nachádza sa od vzorový priemer do 1,960" štandardné odchýlky priemeru vzorky", sa rovná 95 %.

    Hodnota pravdepodobnosti uvedená vo vyhlásení má špeciálny názov , ktorý je spojený s hladina významnosti α (alfa) jednoduchým vyjadrením úroveň dôvery =1 . V našom prípade úroveň významnosti α =1-0,95=0,05 .

    Teraz na základe tohto pravdepodobnostného tvrdenia napíšeme výraz na výpočet interval spoľahlivosti:

    kde Za/2 štandardná normálne rozdelenie(taká hodnota náhodnej premennej z, čo P(z>=Za/2 ) = a/2).

    Poznámka: Horný α/2-kvantil definuje šírku interval spoľahlivosti v štandardné odchýlky vzorový priemer. Horný α/2-kvantil štandardná normálne rozdelenie je vždy väčšie ako 0, čo je veľmi výhodné.

    V našom prípade pri α=0,05 horný α/2-kvantil rovná sa 1,960. Pre ostatné hladiny významnosti α (10 %; 1 %) horný α/2-kvantil Za/2 možno vypočítať pomocou vzorca = NORM.ST.OBR (1-α / 2) alebo, ak je známy úroveň dôvery, =NORM.ST.OBR((1+úroveň spoľahlivosti)/2).

    Zvyčajne pri stavbe intervaly spoľahlivosti pre odhad priemeru iba použiť horné α/2-kvantil a nepoužívajte nižšie α/2-kvantil. To je možné, pretože štandardná normálne rozdelenie symetrické okolo osi x ( hustota jeho distribúcie symetrický o priemer, t.j. 0). Preto nie je potrebné počítať nižší α/2-kvantil(nazýva sa jednoducho α /2-kvantil), pretože je to rovné horné α/2-kvantil so znamienkom mínus.

    Pripomeňme, že bez ohľadu na tvar rozdelenia x, zodpovedajúca náhodná premenná X porov distribuovaný približne dobre N(μ;σ 2 /n) (pozri článok o). Preto vo všeobecnosti vyššie uvedený výraz pre interval spoľahlivosti je len približný. Ak je x rozdelené cez normálny zákon N(μ;σ 2 /n), potom výraz pre interval spoľahlivosti je presný.

    Výpočet intervalu spoľahlivosti v MS EXCEL

    Poďme vyriešiť problém.
    Čas odozvy elektronického komponentu na vstupný signál je dôležitou charakteristikou zariadenia. Technik chce vykresliť interval spoľahlivosti pre priemerný čas odozvy na úrovni spoľahlivosti 95 %. Z predchádzajúcich skúseností inžinier vie, že štandardná odchýlka času odozvy je 8 ms. Je známe, že inžinier vykonal 25 meraní, aby odhadol čas odozvy, priemerná hodnota bola 78 ms.

    Riešenie: Inžinier chce vedieť dobu odozvy elektronického zariadenia, no chápe, že doba odozvy nie je pevná, ale náhodná premenná, ktorá má svoje vlastné rozdelenie. Takže najlepšie, v čo môže dúfať, je určiť parametre a tvar tohto rozdelenia.

    Žiaľ, zo stavu problému nepoznáme formu rozloženia doby odozvy (nemusí byť normálne). , táto distribúcia je tiež neznáma. Len on je známy smerodajná odchýlka a = 8. Preto zatiaľ nevieme vypočítať pravdepodobnosti a zostrojiť interval spoľahlivosti.

    Hoci však distribúciu nepoznáme čas samostatná odpoveď, vieme, že podľa CPT, distribúcia vzoriek priemerný čas odozvy je približne normálne(predpokladáme, že podmienky CPT sa vykonávajú, pretože veľkosť vzorky dostatočne veľké (n=25)) .

    navyše priemerný toto rozdelenie sa rovná stredná hodnota distribúcie odozvy jednotiek, t.j. μ. A smerodajná odchýlka tohto rozdelenia (σ/√n) možno vypočítať pomocou vzorca =8/ROOT(25) .

    Je tiež známe, že inžinier dostal bodový odhad parameter μ rovný 78 ms (X cf). Preto teraz môžeme vypočítať pravdepodobnosti, pretože poznáme formu distribúcie ( normálne) a jeho parametre (Х ср a σ/√n).

    Inžinier to chce vedieť očakávaná hodnotaμ distribúcie času odozvy. Ako je uvedené vyššie, toto μ sa rovná očakávanie distribúcie vzorky priemerného času odozvy. Ak použijeme normálne rozdelenie N(X cf; σ/√n), potom bude požadované μ v rozsahu +/-2*σ/√n s pravdepodobnosťou približne 95 %.

    Úroveň významnosti rovná sa 1-0,95=0,05.

    Nakoniec nájdite ľavý a pravý okraj interval spoľahlivosti.
    Ľavý okraj: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864
    Pravý okraj: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / ROOT (25) \u003d 81,136

    Ľavý okraj: =NORM.INV(0,05/2; 78; 8/SQRT(25))
    Pravý okraj: =NORM.INV(1-0,05/2; 78, 8/SQRT(25))

    Odpoveď: interval spoľahlivosti pri 95 % hladina spoľahlivosti a σ=8ms rovná sa 78+/-3,136 ms

    V príklad súboru na hárku Sigma známy vytvoril formulár na výpočet a konštrukciu bilaterálne interval spoľahlivosti za svojvoľné vzorky s daným σ a úroveň významnosti.

    Funkcia CONFIDENCE.NORM().

    Ak hodnoty vzorky sú v rozsahu B20:B79 , a úroveň významnosti rovná 0,05; potom vzorec MS EXCEL:
    =AVERAGE(B20:B79)-CONFIDENCE(0,05;σ; COUNT(B20:B79))
    vráti ľavý okraj interval spoľahlivosti.

    Rovnakú hranicu možno vypočítať pomocou vzorca:
    =AVERAGE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

    Poznámka: Funkcia TRUST.NORM() sa objavila v MS EXCEL 2010. Staršie verzie MS EXCEL používali funkciu TRUST().

    Interval spoľahlivosti k nám prišiel z oblasti štatistiky. Ide o definovaný rozsah, ktorý slúži na odhad neznámeho parametra s vysokou mierou spoľahlivosti. Najjednoduchšie sa to dá vysvetliť na príklade.

    Predpokladajme, že potrebujete preskúmať nejakú náhodnú premennú, napríklad rýchlosť odpovede servera na požiadavku klienta. Zakaždým, keď používateľ zadá adresu konkrétnej lokality, server odpovie inou rýchlosťou. Skúmaný čas odozvy má teda náhodný charakter. Interval spoľahlivosti vám teda umožňuje určiť hranice tohto parametra a potom bude možné tvrdiť, že s pravdepodobnosťou 95% bude server v rozsahu, ktorý sme vypočítali.

    Alebo potrebujete zistiť, koľko ľudí vie o značke spoločnosti. Pri výpočte intervalu spoľahlivosti bude možné napríklad povedať, že s 95 % pravdepodobnosťou sa podiel spotrebiteľov, ktorí o tom vedia, pohybuje v rozmedzí od 27 % do 34 %.

    S týmto pojmom úzko súvisí taká hodnota ako úroveň spoľahlivosti. Predstavuje pravdepodobnosť, že požadovaný parameter je zahrnutý v intervale spoľahlivosti. Táto hodnota určuje, aký veľký bude náš požadovaný rozsah. Čím je hodnota väčšia, tým je interval spoľahlivosti užší a naopak. Zvyčajne je nastavená na 90 %, 95 % alebo 99 %. Najpopulárnejšia je hodnota 95 %.

    Tento ukazovateľ je ovplyvnený aj rozptylom pozorovaní a jeho definícia je založená na predpoklade, že skúmaný prvok sa riadi.Toto tvrdenie je známe aj ako Gaussov zákon. Takéto rozdelenie všetkých pravdepodobností spojitej náhodnej veličiny sa podľa neho nazýva normálne, čo možno opísať hustotou pravdepodobnosti. Ak sa predpoklad normálneho rozdelenia ukázal ako nesprávny, odhad sa môže ukázať ako nesprávny.

    Po prvé, poďme zistiť, ako vypočítať interval spoľahlivosti pre Tu sú možné dva prípady. Disperzia (stupeň šírenia náhodnej premennej) môže, ale nemusí byť známa. Ak je známy, potom sa náš interval spoľahlivosti vypočíta pomocou nasledujúceho vzorca:

    xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

    α - znak,

    t je parameter z Laplaceovej distribučnej tabuľky,

    σ je druhá odmocnina disperzie.

    Ak je rozptyl neznámy, možno ho vypočítať, ak poznáme všetky hodnoty požadovanej funkcie. Na tento účel sa používa nasledujúci vzorec:

    σ2 = х2ср - (хр)2, kde

    х2ср - priemerná hodnota druhých mocnín študovaného znaku,

    (xsr)2 je druhá mocnina tohto atribútu.

    Vzorec, podľa ktorého sa počíta interval spoľahlivosti, sa v tomto prípade mierne mení:

    xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

    xsr - vzorový priemer,

    α - znak,

    t je parameter, ktorý sa nachádza pomocou Študentovej distribučnej tabuľky t \u003d t (ɣ; n-1),

    sqrt(n) je druhá odmocnina z celkovej veľkosti vzorky,

    s je druhá odmocnina rozptylu.

    Zvážte tento príklad. Predpokladajme, že na základe výsledkov 7 meraní bol študovaný znak určený na 30 a rozptyl vzorky rovný 36. Je potrebné nájsť s pravdepodobnosťou 99% interval spoľahlivosti, ktorý obsahuje skutočnú hodnotu meraný parameter.

    Najprv určme, čomu sa t rovná: t \u003d t (0,99; 7-1) \u003d 3,71. Pomocou vyššie uvedeného vzorca dostaneme:

    xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

    30 – 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

    21.587 <= α <= 38.413

    Interval spoľahlivosti pre rozptyl sa vypočíta tak v prípade známeho priemeru, ako aj vtedy, keď nie sú k dispozícii údaje o matematickom očakávaní a je známa iba hodnota nezaujatého bodového odhadu rozptylu. Nebudeme tu uvádzať vzorce na jeho výpočet, pretože sú dosť zložité a v prípade potreby ich možno vždy nájsť na internete.

    Upozorňujeme len, že je vhodné určiť interval spoľahlivosti pomocou programu Excel alebo sieťovej služby, ktorá sa tak nazýva.

    Zapíšte si úlohu. Napríklad: Priemerná váha študenta na ABC University je 90 kg. Otestujete presnosť predikcie hmotnosti študentov mužského pohlavia na univerzite ABC v rámci daného intervalu spoľahlivosti.

    Urobte vhodnú vzorku. Budete ho používať na zber údajov na testovanie hypotéz. Povedzme, že ste už náhodne vybrali 1 000 študentov mužského pohlavia.

    Vypočítajte priemer a štandardnú odchýlku tejto vzorky. Vyberte štatistiky (napríklad priemer a štandardnú odchýlku), ktoré chcete použiť na analýzu vzorky. Tu je návod, ako vypočítať priemer a štandardnú odchýlku:

    • Ak chcete vypočítať priemer vzorky, pridajte hmotnosti 1 000 mužov vo vzorke a vydeľte výsledok 1 000 (počet mužov). Povedzme, že sme dostali priemernú váhu 93 kg.
    • Ak chcete vypočítať štandardnú odchýlku vzorky, musíte nájsť priemernú hodnotu. Potom musíte vypočítať rozptyl údajov alebo priemer štvorcových rozdielov od priemeru. Keď toto číslo nájdete, vezmite z neho druhú odmocninu. Povedzme, že v našom príklade je štandardná odchýlka 15 kg (všimnite si, že niekedy môže byť táto informácia uvedená spolu s podmienkou štatistického problému).
  • Vyberte požadovanú úroveň spoľahlivosti. Najčastejšie používané úrovne spoľahlivosti sú 90 %, 95 % a 99 %. Môže sa podávať aj spolu so stavom problému. Povedzme, že ste si vybrali 95 %.

  • Vypočítajte mieru chyby. Medzeru chyby môžete nájsť pomocou nasledujúceho vzorca: Z a/2 * σ/√(n). Z a/2 = faktor spoľahlivosti (kde a = úroveň spoľahlivosti), σ = štandardná odchýlka a n = veľkosť vzorky. Tento vzorec ukazuje, že musíte vynásobiť kritickú hodnotu štandardnou chybou. Tu je návod, ako môžete vyriešiť tento vzorec jeho rozdelením na časti:

    • Vypočítajte kritickú hodnotu alebo Z a/2 . Úroveň spoľahlivosti je 95 %. Preveďte percento na desatinné číslo: 0,95 a vydeľte 2, aby ste dostali 0,475. Potom sa pozrite do tabuľky Z-skóre a nájdite zodpovedajúcu hodnotu pre 0,475. Nájdete hodnotu 1,96 (na priesečníku riadku 1,9 a stĺpca 0,06).
    • Vezmite štandardnú chybu (štandardnú odchýlku): 15 a vydeľte ju druhou odmocninou veľkosti vzorky: 1000. Získate: 15/31,6 alebo 0,47 kg.
    • Vynásobte 1,96 x 0,47 (kritická hodnota na štandardnú chybu), aby ste dostali 0,92, čo je hranica chyby.
  • Zapíšte si interval spoľahlivosti. Ak chcete sformulovať interval spoľahlivosti, jednoducho zapíšte priemer (93) ± chyba. Odpoveď: 93 ± 0,92. Hornú a dolnú hranicu intervalu spoľahlivosti môžete nájsť pripočítaním a odčítaním chyby od priemeru. Spodná hranica je teda 93 – 0,92 alebo 92,08 a horná hranica 93 + 0,92 alebo 93,92.

    • Na výpočet intervalu spoľahlivosti môžete použiť nasledujúci vzorec: x̅ ± Z a/2 * σ/√(n), kde x̅ je stredná hodnota.
  • Interval spoľahlivosti pre matematické očakávania - ide o taký interval vypočítaný z údajov, ktorý so známou pravdepodobnosťou obsahuje matematické očakávanie bežnej populácie. Prirodzeným odhadom pre matematické očakávanie je aritmetický priemer jeho pozorovaných hodnôt. Preto budeme ďalej počas hodiny používať pojmy „priemer“, „priemerná hodnota“. V úlohách výpočtu intervalu spoľahlivosti sa najčastejšie vyžaduje odpoveď „Interval spoľahlivosti priemerného čísla [hodnota v konkrétnom probléme] je od [nižšia hodnota] po [vyššia hodnota]“. Pomocou intervalu spoľahlivosti je možné vyhodnotiť nielen priemerné hodnoty, ale aj podiel jedného alebo druhého znaku všeobecnej populácie. V lekcii sú analyzované stredné hodnoty, rozptyl, smerodajná odchýlka a chyba, cez ktoré sa dostaneme k novým definíciám a vzorcom. Charakteristika vzorky a populácie .

    Bodové a intervalové odhady priemeru

    Ak sa stredná hodnota všeobecnej populácie odhaduje číslom (bodom), potom sa za odhad neznámeho priemeru všeobecnej populácie berie špecifický priemer vypočítaný zo vzorky pozorovaní. V tomto prípade sa hodnota výberového priemeru – náhodná premenná – nezhoduje so strednou hodnotou všeobecnej populácie. Preto pri uvádzaní strednej hodnoty vzorky je potrebné súčasne uviesť aj výberovú chybu. Štandardná chyba sa používa ako miera výberovej chyby, ktorá je vyjadrená v rovnakých jednotkách ako priemer. Preto sa často používa tento zápis: .

    Ak sa vyžaduje, aby bol odhad priemeru spojený s určitou pravdepodobnosťou, potom sa parameter všeobecnej záujmovej populácie musí odhadnúť nie jedným číslom, ale intervalom. Interval spoľahlivosti je interval, v ktorom s určitou pravdepodobnosťou P zistí sa hodnota odhadovaného ukazovateľa bežnej populácie. Interval spoľahlivosti, v ktorom s pravdepodobnosťou P = 1 - α je náhodná premenná, vypočíta sa takto:

    ,

    α = 1 - P, ktorý nájdete v prílohe takmer každej knihy o štatistike.

    V praxi nie je známy priemer a rozptyl populácie, takže rozptyl populácie je nahradený rozptylom vzorky a priemer populácie priemerom vzorky. Interval spoľahlivosti sa teda vo väčšine prípadov vypočíta takto:

    .

    Vzorec intervalu spoľahlivosti možno použiť na odhad priemernej hodnoty populácie, ak

    • štandardná odchýlka všeobecnej populácie je známa;
    • alebo štandardná odchýlka populácie nie je známa, ale veľkosť vzorky je väčšia ako 30.

    Priemer vzorky je nezaujatý odhad priemeru populácie. Na druhej strane, rozptyl vzorky nie je nezaujatým odhadom rozptylu populácie . Na získanie nestranného odhadu rozptylu populácie vo vzorci rozptylu vzorky je veľkosť vzorky n by mal byť nahradený n-1.

    Príklad 1 Zo 100 náhodne vybraných kaviarní v určitom meste sa zbierajú informácie, že priemerný počet zamestnancov v nich je 10,5 so štandardnou odchýlkou ​​4,6. Určte interval spoľahlivosti 95% počtu zamestnancov kaviarne.

    kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

    95 % interval spoľahlivosti pre priemerný počet zamestnancov kaviarní bol teda medzi 9,6 a 11,4.

    Príklad 2 Pre náhodnú vzorku zo všeobecnej populácie 64 pozorovaní boli vypočítané tieto celkové hodnoty:

    súčet hodnôt v pozorovaniach,

    súčet štvorcových odchýlok hodnôt od priemeru .

    Vypočítajte 95 % interval spoľahlivosti pre očakávanú hodnotu.

    vypočítajte štandardnú odchýlku:

    ,

    vypočítajte priemernú hodnotu:

    .

    Interval spoľahlivosti nahraďte hodnotami vo výraze:

    kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

    Dostaneme:

    95 % interval spoľahlivosti pre matematické očakávanie tejto vzorky sa teda pohyboval od 7,484 do 11,266.

    Príklad 3 Pre náhodnú vzorku zo všeobecnej populácie 100 pozorovaní bola vypočítaná stredná hodnota 15,2 a štandardná odchýlka 3,2. Vypočítajte 95 % interval spoľahlivosti pre očakávanú hodnotu a potom 99 % interval spoľahlivosti. Ak výkon vzorky a jej variácie zostanú rovnaké, ale faktor spoľahlivosti sa zvýši, bude sa interval spoľahlivosti zužovať alebo rozširovať?

    Tieto hodnoty dosadíme do výrazu pre interval spoľahlivosti:

    kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,05 .

    Dostaneme:

    .

    95 % interval spoľahlivosti pre priemer tejto vzorky bol teda od 14,57 do 15,82.

    Opäť dosadíme tieto hodnoty do výrazu pre interval spoľahlivosti:

    kde je kritická hodnota štandardného normálneho rozdelenia pre hladinu významnosti α = 0,01 .

    Dostaneme:

    .

    99 % interval spoľahlivosti pre priemer tejto vzorky bol teda od 14,37 do 16,02.

    Ako vidíte, so zvyšujúcim sa faktorom spoľahlivosti sa zvyšuje aj kritická hodnota štandardného normálneho rozdelenia, a preto sú začiatočné a koncové body intervalu umiestnené ďalej od priemeru, a teda intervalu spoľahlivosti pre matematické očakávania. zvyšuje.

    Bodové a intervalové odhady špecifickej hmotnosti

    Podiel niektorého znaku vzorky možno interpretovať ako bodový odhad podielu p rovnaká vlastnosť v bežnej populácii. Ak je potrebné túto hodnotu spájať s pravdepodobnosťou, potom by sa mal vypočítať interval spoľahlivosti špecifickej hmotnosti p v bežnej populácii s pravdepodobnosťou P = 1 - α :

    .

    Príklad 4 V určitom meste sú dvaja kandidáti A a B kandidovať na primátora. Náhodne opýtaných bolo 200 obyvateľov mesta, z ktorých 46 % odpovedalo, že by volili kandidáta A, 26 % - pre kandidáta B a 28 % nevie, koho budú voliť. Určte 95 % interval spoľahlivosti pre podiel obyvateľov mesta, ktorí podporujú kandidáta A.

    Akákoľvek vzorka poskytuje iba približnú predstavu o všeobecnej populácii a všetky štatistické charakteristiky vzorky (priemer, režim, rozptyl ...) sú aproximáciou alebo odhadom všeobecných parametrov, ktoré sa vo väčšine prípadov nedajú vypočítať z dôvodu neprístupnosť bežnej populácie (obrázok 20) ​​.

    Obrázok 20. Chyba pri odbere vzoriek

    Môžete však určiť interval, v ktorom s určitou mierou pravdepodobnosti leží skutočná (všeobecná) hodnota štatistickej charakteristiky. Tento interval sa nazýva d interval spoľahlivosti (CI).

    Takže všeobecný priemer s pravdepodobnosťou 95 % leží v rámci

    od do, (20)

    kde t - tabuľková hodnota študentského kritéria pre α = 0,05 a f= n-1

    V tomto prípade možno nájsť 99% CI t vybraný pre α =0,01.

    Aký je praktický význam intervalu spoľahlivosti?

      Široký interval spoľahlivosti naznačuje, že priemer vzorky presne neodráža priemer populácie. Je to zvyčajne spôsobené nedostatočnou veľkosťou vzorky, prípadne jej heterogenitou, t.j. veľký rozptyl. Obidve poskytujú veľkú chybu v priemere, a teda aj širší CI. A to je dôvod vrátiť sa do fázy plánovania výskumu.

      Horná a dolná hranica CI hodnotia, či budú výsledky klinicky významné

    Zastavme sa podrobnejšie pri otázke štatistickej a klinickej významnosti výsledkov štúdia skupinových vlastností. Pripomeňme, že úlohou štatistiky je na základe vzorových údajov odhaliť aspoň nejaké rozdiely vo všeobecných populáciách. Úlohou lekára je nájsť také (nie žiadne) rozdiely, ktoré pomôžu diagnostike alebo liečbe. A nie vždy štatistické závery sú základom pre klinické závery. Štatisticky významný pokles hemoglobínu o 3 g/l teda nie je dôvodom na obavy. A naopak, ak nejaký problém v ľudskom tele nemá masový charakter na úrovni celej populácie, nie je to dôvod, aby sme sa týmto problémom nezaoberali.

    Túto pozíciu zvážime v príklad.

    Vedcov zaujímalo, či chlapci, ktorí mali nejaké infekčné ochorenie, nezaostávajú v raste za svojimi rovesníkmi. Za týmto účelom bola vykonaná selektívna štúdia, ktorej sa zúčastnilo 10 chlapcov, ktorí mali toto ochorenie. Výsledky sú uvedené v tabuľke 23.

    Tabuľka 23. Štatistické výsledky

    nižší limit

    Horná hranica

    Špecifikácie (cm)

    stredná

    Z týchto výpočtov vyplýva, že selektívna priemerná výška 10-ročných chlapcov, ktorí prekonali nejaký druh infekčného ochorenia, sa blíži k normálu (132,5 cm). Spodná hranica intervalu spoľahlivosti (126,6 cm) však naznačuje, že existuje 95 % pravdepodobnosť, že skutočná priemerná výška týchto detí zodpovedá pojmu „nízky vzrast“, t.j. tieto deti sú zakrpatené.

    V tomto príklade sú výsledky výpočtov intervalu spoľahlivosti klinicky významné.