Vstúpiť
Logopedický portál
  • Rusi v Bolívii: tri príbehy
  • Starí veriaci v Latinskej Amerike
  • Netradičný pohľad na Bolíviu
  • Ural vás nenechá nudiť: Shunut, Platonida a Old Man-Stone
  • Encyklopédia rozprávkových hrdinov: „Malý Muk“ Dielo malého trápenia
  • Klenba tváre Analistická klenba tváre - zdroj pravdy
  • parabolická regresia. Parabolická regresná rovnica. Korelačná analýza v Exceli

    parabolická regresia.  Parabolická regresná rovnica.  Korelačná analýza v Exceli

    Máme nasledujúce údaje rozdielne krajiny o indexe maloobchodných cien potravín (x) a indexe priemyselnej výroby (y).

    Index maloobchodných cien potravín (x)Index priemyselnej produkcie (y)
    1 100 70
    2 105 79
    3 108 85
    4 113 84
    5 118 85
    6 118 85
    7 110 96
    8 115 99
    9 119 100
    10 118 98
    11 120 99
    12 124 102
    13 129 105
    14 132 112

    Požadovaný:

    1. Na charakterizovanie závislosti y od x vypočítajte parametre nasledujúcich funkcií:

    A) lineárne;

    B) výkon;

    C) rovnostranná hyperbola.

    3. Posúďte štatistickú významnosť regresných a korelačných parametrov.

    4. Predpovedať hodnotu indexu priemyselnej výroby y s prognózovanou hodnotou indexu maloobchodných cien potravín х=138.

    Riešenie:

    1. Vypočítať parametre lineárnej regresie

    Riešime systém normálnych rovníc pre a a b:

    Zostavme tabuľku vypočítaných údajov, ako je uvedené v tabuľke 1.

    Tabuľka 1 Odhadované údaje pre odhad lineárnej regresie

    č. p / pXprihux2y2
    1 100 70 7000 10000 4900 74,26340 0,060906
    2 105 79 8295 11025 6241 79,92527 0,011712
    3 108 85 9180 11664 7225 83,32238 0,019737
    4 113 84 9492 12769 7056 88,98425 0,059336
    5 118 85 10030 13924 7225 94,64611 0,113484
    6 118 85 10030 13924 7225 94,64611 0,113484
    7 110 96 10560 12100 9216 85,58713 0,108467
    8 115 99 11385 13225 9801 91,24900 0,078293
    9 119 100 11900 14161 10000 95,77849 0,042215
    10 118 98 11564 13924 9604 94,64611 0,034223
    11 120 99 11880 14400 9801 96,91086 0,021102
    12 124 102 12648 15376 10404 101,4404 0,005487
    13 129 105 13545 16641 11025 107,1022 0,020021
    14 132 112 14784 17424 12544 110,4993 0,013399
    Celkom: 1629 1299 152293 190557 122267 1299,001 0,701866
    priemer: 116,3571 92,78571 10878,07 13611,21 8733,357 X X
    8,4988 11,1431 X X X X X
    72,23 124,17 X X X X X

    Priemerná hodnota je určená vzorcom:

    Stredná štvorcová odchýlka sa vypočíta podľa vzorca:

    a výsledok zapíšte do tabuľky 1.

    Umocnením výslednej hodnoty dostaneme rozptyl:

    Parametre rovnice možno určiť aj pomocou vzorcov:

    Takže regresná rovnica je:

    Preto pri zvýšení indexu maloobchodných cien potravín o 1 sa index priemyselnej produkcie zvyšuje v priemere o 1,13.

    Vypočítajte lineárny koeficient párovej korelácie:

    Spojenie je priame, skôr blízke.

    Definujme koeficient determinácie:

    Odchýlka výsledku o 74,59 % sa vysvetľuje zmenou x faktora.

    Nahradením skutočných hodnôt x do regresnej rovnice určíme teoretické (vypočítané) hodnoty .

    preto sú parametre rovnice definované správne.

    Vypočítajme priemernú chybu aproximácie - priemernú odchýlku vypočítaných hodnôt od skutočných:

    V priemere sa vypočítané hodnoty líšia od skutočných o 5,01%.

    Kvalitu regresnej rovnice vyhodnotíme pomocou F-testu.

    F-test spočíva v testovaní hypotézy H 0 o štatistickej nevýznamnosti regresnej rovnice a indikátora tesnej súvislosti. Na tento účel sa vykoná porovnanie skutočnej F skutočnosti a kritickej (tabuľkovej) tabuľky F hodnôt Fisherovho F-kritéria.

    Fakt F je určený vzorcom:

    kde n je počet jednotiek populácie;

    m je počet parametrov pre premenné x.

    Získané odhady regresnej rovnice nám umožňujú použiť ju na prognózovanie.

    Ak prognózovaná hodnota indexu maloobchodných cien potravín x = 138, potom prognózovaná hodnota indexu priemyselnej výroby bude:

    2. Mocninná regresia má tvar:

    Na určenie parametrov sa vykoná logaritmus výkonovej funkcie:

    Na definovanie parametrov logaritmická funkcia zostavte systém normálnych rovníc pomocou metódy najmenších štvorcov:

    Zostavme tabuľku vypočítaných údajov, ako je uvedené v tabuľke 2.

    Tabuľka 2 Odhadované údaje na vyhodnotenie výkonovej regresie

    č. p / pXprilg xlg ylg x * lg y(log x) 2(log y) 2
    1 100 70 2,000000 1,845098 3,690196 4,000000 3,404387
    2 105 79 2,021189 1,897627 3,835464 4,085206 3,600989
    3 108 85 2,033424 1,929419 3,923326 4,134812 3,722657
    4 113 84 2,053078 1,924279 3,950696 4,215131 3,702851
    5 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
    6 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
    7 110 96 2,041393 1,982271 4,046594 4,167284 3,929399
    8 115 99 2,060698 1,995635 4,112401 4,246476 3,982560
    9 119 100 2,075547 2,000000 4,151094 4,307895 4,000000
    10 118 98 2,071882 1,991226 4,125585 4,292695 3,964981
    11 120 99 2,079181 1,995635 4,149287 4,322995 3,982560
    12 124 102 2,093422 2,008600 4,204847 4,382414 4,034475
    13 129 105 2,110590 2,021189 4,265901 4,454589 4,085206
    14 132 112 2,120574 2,049218 4,345518 4,496834 4,199295
    Celkom 1629 1299 28,90474 27,49904 56,79597 59,69172 54,05467
    Priemerná 116,3571 92,78571 2,064624 1,964217 4,056855 4,263694 3,861048
    8,4988 11,1431 0,031945 0,053853 X X X
    72,23 124,17 0,001021 0,0029 X X X

    Pokračovanie tabuľky 2 Vypočítané údaje na vyhodnotenie výkonovej regresie

    č. p / pXpri
    1 100 70 74,16448 17,34292 0,059493 519,1886
    2 105 79 79,62057 0,385112 0,007855 190,0458
    3 108 85 82,95180 4,195133 0,024096 60,61728
    4 113 84 88,59768 21,13866 0,054734 77,1887
    5 118 85 94,35840 87,57961 0,110099 60,61728
    6 118 85 94,35840 87,57961 0,110099 60,61728
    7 110 96 85,19619 116,7223 0,11254 10,33166
    8 115 99 90,88834 65,79901 0,081936 38,6174
    9 119 100 95,52408 20,03384 0,044759 52,04598
    10 118 98 94,35840 13,26127 0,037159 27,18882
    11 120 99 96,69423 5,316563 0,023291 38,6174
    12 124 102 101,4191 0,337467 0,005695 84,90314
    13 129 105 107,4232 5,872099 0,023078 149,1889
    14 132 112 111,0772 0,85163 0,00824 369,1889
    Celkom 1629 1299 1296,632 446,4152 0,703074 1738,357
    Priemerná 116,3571 92,78571 X X X X
    8,4988 11,1431 X X X X
    72,23 124,17 X X X X

    Riešením systému normálnych rovníc určíme parametre logaritmickej funkcie.

    Dostaneme lineárnu rovnicu:

    Jeho potenciovaním získame:

    Nahradením skutočných hodnôt x do tejto rovnice získame teoretické hodnoty výsledku. Na základe nich vypočítame ukazovatele: tesnosť spojenia - korelačný index a priemernú chybu aproximácie.

    Spojenie je celkom blízke.

    V priemere sa vypočítané hodnoty líšia od skutočných o 5,02%.

    Teda H 0 - hypotéza o náhodnosti odhadovaných charakteristík sa zamieta a uznáva sa ich štatistická významnosť a spoľahlivosť.

    Získané odhady regresnej rovnice nám umožňujú použiť ju na prognózovanie. Ak prognózovaná hodnota indexu maloobchodných cien potravín x = 138, potom prognózovaná hodnota indexu priemyselnej výroby bude:

    Na určenie parametrov tejto rovnice sa používa systém normálnych rovníc:

    Urobme zmenu premenných

    a získajte nasledujúci systém normálnych rovníc:

    Riešením sústavy normálnych rovníc určíme parametre hyperboly.

    Urobme tabuľku vypočítaných údajov, ako je uvedené v tabuľke 3.

    Tabuľka 3 Vypočítané údaje pre odhad hyperbolickej závislosti

    č. p / pXprizyz
    1 100 70 0,010000000 0,700000 0,0001000 4900
    2 105 79 0,009523810 0,752381 0,0000907 6241
    3 108 85 0,009259259 0,787037 0,0000857 7225
    4 113 84 0,008849558 0,743363 0,0000783 7056
    5 118 85 0,008474576 0,720339 0,0000718 7225
    6 118 85 0,008474576 0,720339 0,0000718 7225
    7 110 96 0,009090909 0,872727 0,0000826 9216
    8 115 99 0,008695652 0,860870 0,0000756 9801
    9 119 100 0,008403361 0,840336 0,0000706 10000
    10 118 98 0,008474576 0,830508 0,0000718 9604
    11 120 99 0,008333333 0,825000 0,0000694 9801
    12 124 102 0,008064516 0,822581 0,0000650 10404
    13 129 105 0,007751938 0,813953 0,0000601 11025
    14 132 112 0,007575758 0,848485 0,0000574 12544
    Celkom: 1629 1299 0,120971823 11,13792 0,0010510 122267
    priemer: 116,3571 92,78571 0,008640844 0,795566 0,0000751 8733,357
    8,4988 11,1431 0,000640820 X X X
    72,23 124,17 0,000000411 X X X

    Tabuľka 3 pokračovanie Údaje z výpočtu pre odhad hyperbolickej závislosti

    1. Ktoré z uvedených meraní patrí do triedy názvov meracích váh:
    a) čísla kódujúce temperament;


    d) telefónne čísla.

    2. Ktoré z nasledujúcich meraní patrí do triedy rádových meracích stupníc:

    b) akademická hodnosť ako miera povýšenia;
    c) systém merania metrických vzdialeností;
    d) telefónne čísla.

    3. Ktoré z nasledujúcich meraní patrí do triedy pomerov meracích stupníc:
    a) čísla kódujúce temperament;
    b) akademická hodnosť ako miera povýšenia;
    c) systém merania metrických vzdialeností;
    d) telefónne čísla.

    4. Ktoré z nasledujúcich znakov sa týkajú kvantitatívnych druhov:

    b) rodinné väzby členov rodiny;
    c) pohlavie a vek osoby;
    d) sociálne postavenie vkladateľa;
    e) počet detí v rodine;
    f) maloobchodný obrat obchodných podnikov.

    5. Ktoré z nasledujúcich znakov súvisia s kvalitatívnymi druhmi:
    a) počet zamestnancov vo firme;
    b) rodinné väzby členov rodiny;
    c) pohlavie a vek osoby;
    d) sociálne postavenie vkladateľa;
    e) počet detí v rodine;
    f) maloobchodný obrat obchodných podnikov.

    6. Aká stupnica sa používa na meranie úrovne ľudskej inteligencie:
    a) mená;
    b) radové;
    c) interval;
    d) vzťahy.

    7. Štandardná odchýlka je:
    a) druhá mocnina rozsahu variačného radu;
    b) druhá odmocnina disperzie;
    c) druhá mocnina variačného koeficientu;
    G) Odmocnina od veľkosti rozsahu variácií.

    8. Variačný koeficient série je určený pomerom:
    a) štandardná odchýlka od aritmetického priemeru série;
    b) rozptyl k mediánu série;
    c) rozptyl na maximálnu hodnotu série;
    d) absolútny ukazovateľ odchýlky od aritmetického priemeru série.

    9. Mód daného variačného radu

    x 10 15 35
    n 1 2 3

    toto:
    a) 20;
    b) 16;
    v 3;
    d) 35.

    10. Aritmetický priemer populácie je:
    a) hodnota prvku v strede série variácií;
    b) polovičný rozdiel medzi maximálnymi a minimálnymi hodnotami série variácií;
    c) polovičný súčet maximálnych a minimálnych hodnôt série variácií;
    d) pomer súčtu všetkých hodnôt obyvateľstva k ich celkovému počtu.

    11. Známe údaje o dĺžke služby siedmich predavačov: 2; 3; 2; päť; 10; 7; 1 rok starý Nájdite priemernú hodnotu ich pracovných skúseností.
    a) 4,3 roka;
    b) 5 rokov;
    c) 3 roky;
    d) 3,8 roka.

    12. Distribučné číslo je:
    a) postupnosť vzorových údajov;
    b) usporiadané usporiadanie údajov podľa kvantitatívneho atribútu;
    c) číselná postupnosť údajov;
    d) postupnosť hodnôt zoradená podľa kvalitatívnych znakov.

    13. Frekvencia variantov variačného radu sa nazýva:
    a) veľkosť vzorky;
    b) hodnotu variantov variačného radu;
    c) počet jednotlivých variantov alebo skupín variácií;
    d) počet skupín variačných sérií.

    14. Móda je:
    a) maximálna hodnota vlastnosti populácie;
    b) najbežnejšia hodnota;
    c) aritmetický priemer obyvateľstva.

    15. Známe údaje o pracovných skúsenostiach predavačov: 2; 3; 2; päť; 10; 7; 1. Nájdite medián ich pracovných skúseností:
    a) 4,5 roka;
    b) 4,3 roka;
    c) 3 roky;
    d) 5 rokov.

    16. Rozsah variácií tohto radu variácií:
    x 10 15 20 30
    n 1 2 3 2

    toto:
    a) 15;
    b) 10;
    c) 30;
    d) 20.

    17. Počet objednaných sérií sa delí na polovicu:
    a) móda;
    b) aritmetický priemer;
    c) harmonický priemer;
    d) medián.

    18. Štatistické zoskupenie je:
    a) kombinovanie alebo oddeľovanie údajov podľa základných znakov;
    b) vedecká organizácia štatistického pozorovania;
    c) druhy podávania správ;
    d) priamy zber hromadných údajov.

    19. Koeficient oscilácie je:
    a) absolútny ukazovateľ;
    b) priemerný;
    c) relatívny ukazovateľ variácie.

    20. Rozptyl variačného radu charakterizuje:
    a) priemerná hodnota jednotlivých charakteristík;
    b) rozptyl jednotlivých hodnôt znakov od priemernej hodnoty;
    c) smerodajná odchýlka.

    21. Rovnica rovno lineárna funkcia regresia zobrazuje dynamiku vývoja:
    a) s premenlivým zrýchlením;

    c) uniforma;
    d) rovnomerne zrýchlené.

    22. Ak je hodnota korelačného koeficientu 0,6, potom na stupnici Chadd.ka:
    a) prakticky neexistuje žiadne spojenie;
    b) spojenie je slabé;
    c) komunikácia je mierna;
    d) spojenie je silné.

    23. Údaje predstavujú skóre dospelých v Stanford-Binetovom IQ teste 104, 87, 101, 130, 148, 92, 97, 105, 134, 121. Nájdite rozsah variácií:
    a) 61;
    b) 60;
    c) 75.

    24. Nájdite aritmetický vážený priemer pre nasledujúce intervaly:

    li ni
    10-14 1
    15-19 1
    20-24 4
    25-29 2
    30-34 4

    a) 24;
    b) 24,92;
    c) 25,38 hod.

    25. Vypočítajte medián nasledujúceho riadku 2.1; 1,5; 1,6; 2,1; 2.4:
    a) 2;
    b) 1,5;
    c) 2.1.

    26. Vypočítajte režim nasledujúceho intervalového radu

    frekvencia 5-7 8-10 11-13 14-16
    interval 4 7 26 41

    a) 14;
    b) 14,54;
    c) 15,23;

    27. Ktoré z uvedených meraní patrí do triedy názvov meracích stupníc:
    a) diagnóza pacienta;
    b) čísla áut;
    c) tvrdosť minerálu;
    d) kalendárny čas;
    d) hmotnosť osoby.

    28. Ktoré z nasledujúcich meraní patrí do triedy radových meracích stupníc:
    a) diagnóza pacienta;
    b) čísla áut;
    c) tvrdosť minerálu;
    d) kalendárny čas;
    d) hmotnosť osoby.

    29. Ktoré z nasledujúcich meraní patrí do triedy intervalových meracích stupníc:
    a) diagnóza pacienta;
    b) čísla áut;
    c) tvrdosť minerálu;
    d) kalendárny čas;
    d) hmotnosť osoby.
    30. Ktoré z nasledujúcich meraní patrí do triedy pomerov meracích stupníc:
    a) diagnóza pacienta;
    b) čísla áut;
    c) tvrdosť minerálu;
    d) kalendárny čas;
    d) hmotnosť osoby.

    31. Aká stupnica sa používa na meranie času:
    a) interval;
    b) vzťahy;
    c) Čaddok.

    32. Kvantitatívne druhy zahŕňajú tieto znaky:
    a) výška človeka;
    b) vyznamenania za zásluhy;
    c) farba očí;
    d) ŠPZ.

    33. Kvalitatívne druhy zahŕňajú tieto znaky:
    a) výška človeka;
    b) vyznamenania za zásluhy;
    c) farba očí;
    d) čísla áut

    34. Vypočítajte módu

    xi 5 8 10 13 14
    nie 7 4 5 9 1

    a) 10;
    b) 11;
    c) 13

    35. Vo veľkých triedach je za štvrťrok menší pokrok v získavaní vedomostí ako v malých triedach. Čo je to ukazovateľ výkonnosti?
    a) počet žiakov v triede;
    b) úspech pri získavaní vedomostí,
    c) počet žiakov s úspešnosťou v získavaní vedomostí.

    36. Dĺžka intervalu v intervalovom rade je:
    a) rozsah variácie vydelený aritmetickým priemerom;
    b) rozsah variácie vydelený počtom skupín;
    c) rozptyl delený veľkosťou vzorky.

    37. Príklad párovej korelácie: žiaci, ktorí sa naučili čítať skôr ako ostatní, dosahujú lepšie výsledky. Ktorá z týchto vlastností: skorá schopnosť čítať alebo vysoké výsledky študentov sú faktoriálnou vlastnosťou?
    a) schopnosť čítať skoro;
    b) vysoký akademický výkon;
    c) žiadny z nich.

    38. Ktorú z nasledujúcich metód možno použiť pri porovnávaní priemerov troch alebo viacerých vzoriek:
    a) Študentský test;
    b) Fisherov test;
    c) analýza rozptylu.

    39. Veľkosť vzorky série variácií

    xi 10 15 20 30
    nie 1 2 3 2

    a) 5;
    b) 8;
    v 12;
    d) 30.

    40. Móda variačnej série

    xi 10 15 20 25
    nie 1 5 4 3

    a) 15;
    b) 5;
    c) 23;
    d) 3.

    41. Rovnica parabolickej regresnej funkcie odráža dynamiku vývoja:
    a) s premenlivým zrýchlením;
    b) so spomalením rastu na konci obdobia;
    c) uniforma;
    d) rovnomerne zrýchlené.

    42. Regresný koeficient B ukazuje:
    a) očakávaná hodnota závislej premennej, keď je prediktorová hodnota nulová
    b) očakávaná hodnota závislej premennej pri zmene prediktora o jednotku
    c) pravdepodobnosť regresnej chyby
    d) problém ešte nie je úplne vyriešený

    43. Vzor je:
    a) celý súbor predmetov, na ktorých je postavená úvaha výskumníka;
    b) súbor objektov dostupných pre empirický výskum;
    c) všetky možné hodnoty rozptylu;
    d) rovnako ako randomizácia.

    44. Ktorý z uvedených korelačných koeficientov vykazuje najväčšiu súvislosť premenných:
    a) -0,90;
    b) 0;
    c) 0,07;
    d) 0,01.

    45. Všeobecná populácia je:
    a) celý súbor predmetov, na ktorých je postavená úvaha výskumníka;
    b) súbor objektov dostupných pre empirický výskum;
    c) všetky možné hodnoty matematického očakávania;
    d) normálne rozdelenie.

    46. ​​Ako sa porovnáva veľkosť vzorky a všeobecnej populácie:
    a) vzorka je zvyčajne oveľa menšia ako bežná populácia;
    b) populácia vždy menej ako vzorka;
    c) vzorka a všeobecná populácia sa takmer vždy zhodujú;
    d) neexistuje správna odpoveď.

    47. Bodkovaný bisériový korelačný koeficient je špeciálnym prípadom korelačného koeficientu:
    a) Spearman
    b) Pearson;
    c) Kendala;
    d) všetky odpovede sú správne.

    48. Keď minimálna úroveň význam je zvykom zamietnuť nulovú hypotézu?
    a) úroveň 5 %.
    b) úroveň 7 %.
    c) úroveň 9 %.
    d) úroveň 10 %.

    49. Ktorá z nasledujúcich metód sa zvyčajne používa pri porovnávaní priemerov dvoch normálnych vzoriek:
    a) Študentský test;
    b) Fisherov test;
    c) jednosmerná analýza rozptylu;
    d) korelačná analýza.

    50. Pomocou ktorých sa testujú štatistické hypotézy:
    a) štatistika
    b) parametre;
    c) pokusy;
    d) pozorovania.

    51. Ktorá z nasledujúcich hodnôt korelačného koeficientu nie je možná:
    a) -0,54;
    b) 2,18;
    c) 0; d) 1.

    52. Akú transformáciu je potrebné vykonať pri porovnaní dvoch korelačných koeficientov:
    študentka
    b) Fisher;
    c) Pearson;
    d) Spearman.

    53. Aký je medián distribúcie:
    a) rovnaké ako osi;
    b) rovnaké ako móda;
    c) aritmetický priemer;
    d) 50 % distribučný kvantil;
    e) neexistuje správna odpoveď.

    54. Bodkovaný bisériový korelačný koeficient je špeciálnym prípadom korelačného koeficientu:
    a) Spearman
    b) Pearson;
    c) Kendall;
    d) všetky odpovede sú správne.

    55. Ktorá z nasledujúcich premenných je diskrétna:
    a) typ temperamentu;
    b) úroveň inteligencie;
    c) reakčný čas;
    d) všetky odpovede sú správne.

    56. V akom rozsahu sa môže korelačný koeficient meniť:
    a) od -1 do 1;
    b) od 0 do 1;
    c) od 0 do 100;
    d) v akomkoľvek.

    57. O tom, aké štatistické hypotézy sa predkladajú:
    a) koncepty;
    b) štatistik;
    c) vzorky;
    d) parametre.

    58. Ako sa volá neparametrický analóg? analýza rozptylu:
    a) Študentský test;
    b) Kruskal-Wallisova metóda;
    c) Wilcoxonov test;
    d) Mann-Whitneyho test.

    59. Koncept korelačného koeficientu bol prvýkrát vyvinutý v prácach:
    a) Rybár;
    b) študent;
    c) Pearson;
    d) Spearman.

    60. Ktorá z nasledujúcich štatistík je nestranným odhadom očakávanej hodnoty:
    a) aritmetický priemer;
    b) móda;
    c) medián;
    d) všetky odpovede sú správne.

    61. Ako sa porovnávajú Pearsonove a Spearmanove korelačné koeficienty:
    a) Pearsonov koeficient je špeciálny prípad Spearmana;
    b) Spearmanov koeficient je špeciálny prípad Pearsona;
    c) tieto koeficienty majú odlišnú konštrukčnú logiku;
    d) sú rovnaké.

    62. Podľa teoretických predpokladov analýzy rozptylu F-pomer nemôže byť:
    a) sa rovná 1;
    b) viac ako 1;
    c) menej ako 1;
    d) neexistuje správna odpoveď.

    Pridelenie služby. Pomocou tejto online kalkulačky môžete nájsť parametre nelineárnej regresnej rovnice (exponenciálna, exponenciálna, rovnostranná hyperbola, logaritmická, exponenciálna) (pozri príklad).

    Poučenie. Zadajte množstvo zdrojových údajov. Výsledné riešenie sa uloží do súboru programu Word. V Exceli sa automaticky vygeneruje aj šablóna riešenia. Poznámka: ak potrebujete určiť parametre parabolickej závislosti (y = ax 2 + bx + c), môžete použiť službu Analytical alignment.
    Homogénny súbor jednotiek je možné obmedziť elimináciou anomálnych objektov pozorovania Irwinovou metódou alebo pravidlom troch sigma (eliminovať tie jednotky, pre ktoré sa hodnota vysvetľujúceho faktora odchyľuje od priemeru o viac ako trojnásobok štandardu). odchýlka).

    Typy nelineárnej regresie

    Tu je ε náhodná chyba (odchýlka, porucha), odrážajúca vplyv všetkých nezohľadnených faktorov.

    Regresná rovnica prvého poriadku je párová lineárna regresná rovnica.

    Regresná rovnica druhého rádu toto je polynomická regresná rovnica druhého rádu: y = a + bx + cx 2 .

    Regresná rovnica tretieho rádu v tomto poradí polynomická regresná rovnica tretieho rádu: y = a + bx + cx 2 + dx 3 .

    Aby sa nelineárne závislosti dostali na lineárnu, používajú sa metódy linearizácie (pozri metódu zarovnania):

    1. Zmena premenných.
    2. Logaritmus oboch strán rovnice.
    3. Kombinované.
    y = f(x)transformáciaLinearizačná metóda
    y = b x aY = log(y); X = log(x)Logaritmus
    y = b e sekeraY = log(y); X=xKombinované
    y = 1/(ax+b)Y = 1/y; X=xZmena premenných
    y = x/(ax+b)Y=x/y; X=xZmena premenných. Príklad
    y = aln(x)+bY=y; X = log(x)Kombinované
    y = a + bx + cx2xi = x; x2 = x2Zmena premenných
    y = a + bx + cx2 + dx3xi = x; x 2 \u003d x 2; x 3 = x 3Zmena premenných
    y = a + b/xx 1 = 1/xZmena premenných
    y = a + sqrt(x)bx 1 = sqrt(x)Zmena premenných
    Príklad. Podľa údajov prevzatých z príslušnej tabuľky postupujte takto:
    1. Zostavte korelačné pole a sformulujte hypotézu o podobe vzťahu.
    2. Vypočítajte parametre rovníc lineárnej, mocninnej, exponenciálnej, semilogaritmickej, inverznej, hyperbolickej párovej regresie.
    3. Posúďte tesnosť vzťahu pomocou ukazovateľov korelácie a determinácie.
    4. Použite priemerný (všeobecný) koeficient elasticity na porovnanie sily vzťahu medzi faktorom a výsledkom.
    5. Odhadnite kvalitu rovníc pomocou priemernej chyby aproximácie.
    6. Posúďte štatistickú spoľahlivosť výsledkov regresného modelovania pomocou Fisherovho F-testu. Podľa hodnôt charakteristík vypočítaných v odsekoch. 4, 5 a tento odsek, vyberte najlepšiu regresnú rovnicu a uveďte jej odôvodnenie.
    7. Vypočítajte predpokladanú hodnotu výsledku, ak sa predpokladaná hodnota faktora zvýši o 15 % jeho priemernej úrovne. Určte interval spoľahlivosti predpovede pre hladinu významnosti α=0,05.
    8. Vyhodnoťte získané výsledky a vyvodte závery v analytickej poznámke.
    rokSkutočná konečná spotreba domácností (v bežných cenách), miliardy rubľov (1995 - bilión rubľov), rPriemerný peňažný príjem obyvateľstva na obyvateľa (za mesiac), rub. (1995 - tisíc rubľov), x
    1995 872 515,9
    2000 3813 2281,1
    2001 5014 3062
    2002 6400 3947,2
    2003 7708 5170,4
    2004 9848 6410,3
    2005 12455 8111,9
    2006 15284 10196
    2007 18928 12602,7
    2008 23695 14940,6
    2009 25151 16856,9

    Riešenie. V kalkulačke vyberte typy nelineárnej regresie. Dostávame nasledujúcu tabuľku.
    Exponenciálna regresná rovnica je y = a e bx
    Po linearizácii dostaneme: ln(y) = ln(a) + bx
    Dostaneme empirické regresné koeficienty: b = 0,000162, a = 7,8132
    Regresná rovnica: y = e 7,81321500 e 0,000162x = 2473,06858e 0,000162x

    Mocninná regresná rovnica má tvar y = a x b
    Po linearizácii dostaneme: ln(y) = ln(a) + b ln(x)
    Empirické regresné koeficienty: b = 0,9626, a = 0,7714
    Regresná rovnica: y = e 0,77143204 x 0,9626 = 2,16286 x 0,9626

    Hyperbolická regresná rovnica je y = b/x + a + ε
    Po linearizácii dostaneme: y=bx + a
    Empirické regresné koeficienty: b = 21089190,1984, a = 4585,5706
    Empirická regresná rovnica: y = 21089190,1984 / x + 4585,5706

    Logaritmická regresná rovnica má tvar y = b ln(x) + a + ε
    Empirické regresné koeficienty: b = 7142,4505, a = -49694,9535
    Regresná rovnica: y = 7142,4505 ln(x) - 49694,9535

    Exponenciálna regresná rovnica má tvar y = a b x + ε
    Po linearizácii dostaneme: ln(y) = ln(a) + x ln(b)
    Empirické regresné koeficienty: b = 0,000162, a = 7,8132
    y = e 7,8132 *e 0,000162x = 2473,06858*1,00016x

    Xr1/xlog(x)log(y)
    515.9 872 0.00194 6.25 6.77
    2281.1 3813 0.000438 7.73 8.25
    3062 5014 0.000327 8.03 8.52
    3947.2 6400 0.000253 8.28 8.76
    5170.4 7708 0.000193 8.55 8.95
    6410.3 9848 0.000156 8.77 9.2
    8111.9 12455 0.000123 9 9.43
    10196 15284 9,8E-59.23 9.63
    12602.7 18928 7,9E-59.44 9.85
    14940.6 23695 6.7E-59.61 10.07
    16856.9 25151 5.9E-59.73 10.13

    Ďalším typom jednofaktorovej regresie je aproximácia mocninnými polynómami v tvare:

    Je prirodzené chcieť získať čo najjednoduchšiu závislosť obmedzujúcu sa na mocninné polynómy druhého stupňa, t.j. parabolická závislosť:
    (5.5.2)

    Parciálne derivácie vypočítame vzhľadom na koeficienty b 0 , b 1 A b 2 :



    (5.5.3)

    Prirovnaním derivátov k nule dostaneme normálny systém rovníc:

    (5.5.4)

    Riešenie sústavy normálnych rovníc (5.5.2) pre špecifický prípad hodnôt X i * , r i * ;
    dostaneme optimálne hodnoty b 0 , b 1 A b 2 . Pre aproximáciu závislosťou (5.5.2) a ešte viac (5.5.1) neboli získané jednoduché vzorce na výpočet koeficientov a spravidla sa počítajú pomocou štandardných postupov v maticovej forme:

    (5.5.5)

    Obrázok 5.5.1 ukazuje typický príklad aproximácie parabolickej závislosti:

    9 (5;9)

    (1;1)

    1

    1 2 3 4 5 x

    Obr.5.5.1. Súradnice experimentálnych bodov a aproximácia

    ich parabolická závislosť

    Príklad 5.1. Vykonajte aproximáciu experimentálnych výsledkov uvedených v tabuľke 5.1.1 pomocou lineárnej regresnej rovnice
    .

    Tabuľka 5.1.1

    Experimentálne body vynesme podľa súradníc uvedených v tabuľke 5.1.1 do grafu znázorneného na obrázku 5.1.1.

    pri

    9

    4

    1 2 3 4 5 x

    Podľa obr. 5.1.1, na ktorom nakreslíme priamku pre predbežné posúdenie, sme dospeli k záveru, že v umiestnení experimentálnych bodov existuje výrazná nelinearita, ktorá však nie je veľmi významná, a preto má zmysel aproximovať ich lineárnou závislosťou. Všimnite si, že na získanie správneho matematického záveru je potrebné zostrojiť priamku pomocou metódy najmenších štvorcov.

    Pred regresnou analýzou je vhodné vypočítať

    koeficient lineárnej korelácie medzi premennými X A pri:

    Významnosť korelácie je určená kritickou hodnotou koeficientu lineárnej korelácie vypočítanou podľa vzorca:

    Kritická hodnota študentského kritéria t Kréta sa zistí podľa štatistických tabuliek pre odporúčanú hladinu významnosti a = 0,05 a pre n-2 stupne slobody. Ak vypočítaná hodnota r xy nie menej ako kritická hodnota r Kréta, potom korelácia medzi premennými X A r považované za významné. Urobme výpočty:










    Vzhľadom k tomu, že
    sme dospeli k záveru, že korelácia medzi premennými X A pri je nevyhnutné a môže byť lineárne.

    Vypočítajme koeficienty regresnej rovnice:

    Dostali sme teda lineárnu regresnú rovnicu:

    Podľa regresnej rovnice nakreslíme priamku na obrázku 5.1.2.

    y (5;9,8)

    9

    4

    (0;-0.2) 1 2 3 4 5 x

    Obr.5.1.2. Súradnice experimentálnych bodov a aproximácia

    ich lineárna závislosť

    Pomocou regresnej rovnice vypočítame hodnoty funkcie pomocou experimentálnych bodov tabuľky 5.1.1 a rozdielu medzi experimentálnou a vypočítanou hodnotou funkcie, ktoré uvádzame v tabuľke 5.1.2.

    Tabuľka 5.1.2


    Vypočítajme odmocninu a jej pomer k strednej hodnote:

    Vo vzťahu k štandardnej chybe k strednej hodnote bol získaný neuspokojivý výsledok, pretože bola prekročená odporúčaná hodnota 0,05.

    Vyhodnoťme hladinu významnosti koeficientov regresnej rovnice podľa Studentovho kritéria:


    Zo štatistickej tabuľky pre 3 stupne voľnosti, riadky vypíšeme s hladinou významnosti - a hodnotu študentského kritéria t v tabuľke 5.1.3.

    Tabuľka 5.1.3

    Úroveň významnosti koeficientov regresnej rovnice:


    Všimnite si, že podľa úrovne významnosti pre koeficient sa dosiahol uspokojivý výsledok a pre koeficient nevyhovujúce.

    Zhodnoťme kvalitu získanej regresnej rovnice ukazovateľmi vypočítanými na základe analýzy rozptylu:

    Vyšetrenie:

    Výsledok kontroly je pozitívny, čo naznačuje správnosť vykonaných výpočtov.

    Vypočítajme Fisherovo kritérium:

    s dvoma stupňami voľnosti:

    Podľa štatistických tabuliek nájdeme kritické hodnoty Fisherovho kritéria pre dve odporúčané gradácie hladiny významnosti:


    Keďže vypočítaná hodnota Fisherovho kritéria presahuje kritickú hodnotu pre hladinu významnosti 0,01, budeme predpokladať, že hladina významnosti podľa Fisherovho kritéria je menšia ako 0,01, čo budeme považovať za vyhovujúce.

    Vypočítajme koeficient viacnásobného určenia:

    pre dva stupne voľnosti

    Podľa štatistickej tabuľky pre odporúčanú hladinu významnosti 0,05 a zistených dvoch stupňov voľnosti zistíme kritickú hodnotu koeficientu viacnásobnej determinácie:

    Keďže vypočítaná hodnota koeficientu viacnásobného určenia presahuje kritickú hodnotu pre hladinu významnosti
    , potom hladina významnosti koeficientom viacnásobného určenia
    a výsledok získaný pre daný ukazovateľ sa bude považovať za uspokojivý.

    Takto získané vypočítané parametre z hľadiska pomeru smerodajnej chyby k strednej hodnote a hladiny významnosti podľa Studentovho kritéria sú nevyhovujúce, preto je vhodné zvoliť pre aproximáciu inú približnú závislosť.

    Príklad 5.2. Aproximácia experimentálneho rozdelenia náhodných čísel matematickou závislosťou

    Experimentálne rozdelenie náhodných čísel uvedené v tabuľke 5.1.1 pri aproximácii lineárnou závislosťou neviedlo k uspokojivému výsledku, vr. bezvýznamnosťou koeficientu regresnej rovnice s voľným členom sa preto pre zlepšenie kvality aproximácie pokúsime nakresliť ju s lineárnou závislosťou bez voľného člena:

    Vypočítajte hodnotu koeficientu regresnej rovnice:

    Dostali sme teda regresnú rovnicu:

    Podľa získanej regresnej rovnice vypočítame hodnoty funkcie a rozdiel medzi experimentálnymi a vypočítanými hodnotami funkcie, ktoré uvádzame vo forme tabuľky 5.2.1.

    Tabuľka 5.2.1

    X i

    Podľa regresnej rovnice
    na Obr.5.2.1 nakreslite priamku.

    y(5;9.73 )

    (0;0) 1 2 3 4 5 x

    Obr.5.2.1. Súradnice experimentálnych bodov a aproximácia

    ich lineárna závislosť

    Na posúdenie kvality aproximácie vypočítame ukazovatele kvality podobne ako pri výpočtoch uvedených v príklade 5.1.

    (zostal starý);

    so 4 stupňami voľnosti;

    pre

    Na základe výsledkov aproximácie konštatujeme, že z hľadiska hladiny významnosti koeficientu regresnej rovnice bol dosiahnutý uspokojivý výsledok; pomer smerodajnej chyby k priemeru sa zlepšil, ale stále zostal nad odporúčanou hodnotou 0,05, preto sa odporúča opakovať aproximáciu so zložitejšou matematickou závislosťou.

    Príklad 5.3. Na zlepšenie kvality aproximácie príkladov 5.1 a 5.2 vykonáme nelineárnu aproximáciu pomocou závislosti
    . Za týmto účelom najprv vykonáme priebežné výpočty a ich výsledky umiestnime do tabuľky 5.3.1.

    hodnoty

    Tabuľka 5.3.1

    X 2

    (lnX) 2

    lnX lnY

    Okrem toho vypočítame:

    Urobme aproximáciu závislosti
    . Pomocou vzorcov (5.3.7), (5.3.8) vypočítame koeficienty b 0 A b 1 :

    Pomocou vzorcov (5.3.11) vypočítame koeficienty A 0 A A 1 :


    Na výpočet štandardnej chyby sa vykonali medzivýpočty uvedené v tabuľke 5.3.2.

    Tabuľka 5.3.2

    Y i

    r i

    Suma: 7,5968

    Ukázalo sa, že štandardná chyba aproximácie je oveľa väčšia ako v dvoch predchádzajúcich príkladoch, takže výsledky aproximácie sa považujú za nevhodné.

    Príklad 5.4. Skúsme si priblížiť ešte jednu nelineárnu závislosť
    . Podľa vzorcov (5.3.9), (5.3.10), podľa údajov tabuľky 5.3.1 vypočítame koeficienty b 0 A b 1 :

    Máme strednú závislosť:

    Pomocou vzorcov (5.3.13) vypočítame koeficienty C 0 A C 1 :


    Mám konečnú závislosť:

    Na výpočet štandardnej chyby vykonáme medzivýpočty a umiestnime ich do tabuľky 5.4.1.

    Tabuľka 5.4.1

    Y i

    r i

    Suma: 21,83152

    Vypočítajme štandardnú chybu:

    Ukázalo sa, že štandardná chyba aproximácie je oveľa väčšia ako v predchádzajúcom príklade, takže výsledky aproximácie sa považujú za nevhodné.

    Príklad 5.5. Aproximácia experimentálneho rozdelenia náhodných čísel matematickou závislosťou r = b · lnx

    Počiatočné údaje, ako v predchádzajúcich príkladoch, sú uvedené v tabuľke 5.4.1 a na obrázku 5.4.1.

    Tabuľka 5.4.1

    Na základe analýzy obr. 5.4.1 a tabuľky 5.4.1 si všimneme, že s menšími hodnotami argumentu (na začiatku tabuľky) sa funkcia mení výraznejšie ako s veľkými hodnotami (na koniec tabuľky), preto sa zdá vhodné zmeniť mierku argumentu a zaviesť z nej logaritmickú funkciu do regresnej rovnice a vykonať aproximáciu pomocou nasledujúcej matematickej závislosti:

    . Podľa vzorca (5.4.3) vypočítame koeficient b:

    Na posúdenie kvality aproximácie vykonáme medzivýpočty uvedené v tabuľke 5.4.2, pomocou ktorých vypočítame chybu a pomer štandardnej chyby k strednej hodnote.

    Tabuľka 5.4.2


    Keďže je prekročená odporúčaná hodnota 0,05 vo vzťahu k štandardnej chybe k strednej hodnote, výsledok bude považovaný za neuspokojivý. Najmä si všimneme, že najväčšia odchýlka dáva hodnotu x=1, pretože s touto hodnotou lnx=0. Preto vykonáme aproximáciu pomocou závislosti r = b 0 +b 1 lnx

    Pomocné výpočty sú uvedené vo forme tabuľky 5.4.3.

    Tabuľka 5.4.3

    Pomocou vzorcov (5.4.6) a (5.4.7) vypočítame koeficienty b 0 a b 1 :

    9 (5;9.12)

    4

    1 (1;0.93)

    1 2 3 4 5 x

    Pre posúdenie kvality aproximácie vykonáme pomocné výpočty a určíme úroveň významnosti zistených koeficientov a pomer smerodajnej chyby k strednej hodnote.

    Úroveň významnosti mierne nad odporúčanou hodnotou 0,05 (
    ).


    Vzhľadom na to, že pre hlavný ukazovateľ – pomer smerodajnej chyby k strednej hodnote, bolo dosiahnuté takmer dvojnásobné prekročenie odporúčanej úrovne 0,05, budú výsledky považované za prijateľné. Všimnite si, že vypočítaná hodnota Studentovho kritéria t b 0 =2,922 odlišné od kritických
    relatívne malé množstvo.

    Príklad 5.6. Približme experimentálne údaje z príkladu 5.1 hyperbolickou závislosťou
    . Na výpočet koeficientov b 0 a b 1 Vykonajte predbežné výpočty uvedené v tabuľke 5.6.1.

    Tabuľka 5.6.1

    X i

    X i = 1/X i

    X i 2

    X i r i

    Na základe výsledkov tabuľky 5.6.1 pomocou vzorcov (5.4.8) a (5.4.9) vypočítame koeficienty b 0 a b 1 :

    Takto sme dostali rovnicu hyperbolickej regresie

    .

    Výsledky pomocných výpočtov na posúdenie kvality aproximácie sú uvedené v tabuľke 5.6.2.

    Tabuľka 5.6.2

    X i

    Na základe výsledkov tabuľky 5.6.2 vypočítame štandardnú chybu a pomer štandardnej chyby k priemeru:


    Vzhľadom na to, že pomer smerodajnej chyby k strednej hodnote presahuje odporúčanú hodnotu 0,05, konštatujeme, že aproximačné výsledky sú nevhodné.

    Príklad 5.7.

    Na výpočet konkrétnych hodnôt príjmu z prevádzky výložníkových žeriavov v závislosti od času údržby je potrebné získať parabolickú závislosť.

    Vypočítajme koeficienty tejto závislosti b 0 , b 1 , b 11 v maticovej forme podľa vzorca:

    Nelineárne regresné rovnice týkajúce sa ukazovateľa výkonu s optimálnymi hodnotami práce údržby vežových žeriavov boli získané pomocou postupu viacnásobnej regresie použitého balíka. Programy Statistica 6.0. Ďalej uvádzame výsledky regresnej analýzy pre výsledný ukazovateľ výkonnosti v tabuľke 5.7.1.

    Tabuľka 5.7.1

    Tabuľka 5.7.2 ukazuje výsledky nelineárnej regresie pre výslednú mieru výkonu a Tabuľka 5.7.3 ukazuje výsledky reziduálnej analýzy.

    Tabuľka 5.7.2

    Tabuľka 5.7.3

    Ryža. 3.7.36. Analýza rezíduí.

    Získali sme teda viacnásobnú regresnú rovnicu pre premennú
    :

    Pomer štandardnej chyby znamená:

    14780/1017890=0,0145 < 0,05.

    Keďže pomer štandardnej chyby k priemeru nepresahuje odporúčanú hodnotu 0,05, výsledky aproximácie možno považovať za prijateľné. Ako nevýhodu podľa tabuľky 5.7.2 treba poznamenať, že všetky vypočítané koeficienty prekračujú odporúčanú hladinu významnosti 0,05.

    Lineárna regresia

    Rovnica lineárnej regresie je rovnica priamky, ktorá aproximuje (približne opisuje) vzťah medzi náhodnými premennými X a Y.

    Uvažujme náhodnú dvojrozmernú premennú (X, Y), kde -- závisí náhodné premenné. Predstavujeme jednu z veličín ako funkciu druhej. Obmedzíme sa na približnú reprezentáciu množstva ako lineárnej funkcie množstva X:

    kde sú parametre, ktoré sa majú určiť. Dá sa to urobiť rôznymi spôsobmi: najbežnejším z nich je metóda najmenších štvorcov. Funkcia g(x) sa nazýva rms regresia Y na X. Funkcia g(x) sa nazýva rms regresia Y na X.

    kde F je celková kvadratická odchýlka.

    Volíme a a b tak, aby súčet druhých mocnín odchýlok bol minimálny. Aby sme našli koeficienty a a b, pri ktorých F dosahuje svoju minimálnu hodnotu, prirovnáme parciálne derivácie k nule:

    Nájdeme a a b. Po vykonaní elementárnych transformácií dostaneme systém dvoch lineárne rovnice vzhľadom na a a b:

    kde je veľkosť vzorky.

    V našom prípade A = 3888; B = 549; C=8224; D = 1182, N = 100.

    Z tejto lineárnej nájdime a a b. Dostaneme stacionárny bod pre kde 1,9884; 0,8981.

    Preto rovnica bude mať tvar:

    y = 1,9884x + 0,8981


    Ryža. 10

    Parabolická regresia

    Na základe pozorovaných údajov nájdeme vzorovú rovnicu krivky strednej (v našom prípade parabolickej) regresie. Na určenie p, q, r použijeme metódu najmenších štvorcov.

    Obmedzujeme sa na reprezentáciu Y ako parabolickej funkcie X:

    kde p, q a r sú parametre, ktoré sa majú určiť. Dá sa to urobiť metódou najmenších štvorcov.

    Parametre p, q a r volíme tak, aby súčet kvadrátov odchýlok bol minimálny. Pretože každá odchýlka závisí od hľadaných parametrov, súčet štvorcových odchýlok je tiež funkciou F týchto parametrov:

    Aby sme našli minimum, prirovnáme zodpovedajúce parciálne derivácie k nule:

    Nájdite p, q a r. Po vykonaní elementárnych transformácií získame systém troch lineárnych rovníc pre p, q a r:

    Riešenie tohto systému metódou inverzná matica, dostaneme: p = -0,0085; q = 2,0761;

    Preto parabolická regresná rovnica bude mať tvar:

    y = -0,0085 x 2 + 2,0761 x + 0,7462

    Zostavme parabolickú regresiu. Pre uľahčenie pozorovania bude regresný graf na pozadí bodového grafu (pozri obrázok 13).


    Ryža. 13

    Teraz nakreslite čiary lineárnej regresie a parabolickej regresie na rovnaký graf pre vizuálne porovnanie (pozri obrázok 14).


    Ryža. štrnásť

    Lineárna regresia je znázornená červenou farbou, zatiaľ čo parabolická regresia je znázornená modrou farbou. Diagram ukazuje, že rozdiel je v tomto prípade väčší ako pri porovnaní dvoch lineárnych regresných čiar. Je potrebný ďalší výskum, ktorá regresia najlepšie vyjadruje vzťah medzi x a y, teda aký typ vzťahu medzi x a y.