स्पीच थेरेपी पोर्टल / अनुभव विनिमय / महत्वपूर्ण कारकों की संख्या के अनुसार, प्रतिगमन को उप-विभाजित किया जाता है। डेटा विश्लेषण की मूल बातें। प्रतिगमन को परिभाषित करना

महत्वपूर्ण कारकों की संख्या के अनुसार, प्रतिगमन को उप-विभाजित किया जाता है। डेटा विश्लेषण की मूल बातें। प्रतिगमन को परिभाषित करना

23.01.2021

1. शब्द "रिग्रेशन" पहली बार बायोमेट्रिक्स के संस्थापक एफ। गैल्टन (XIX सदी) द्वारा पेश किया गया था, जिनके विचारों को उनके अनुयायी के। पियर्सन ने विकसित किया था।

प्रतिगमन विश्लेषण - सांख्यिकीय डेटा प्रोसेसिंग की एक विधि जो आपको एक या अधिक कारणों (कारक संकेतक) और एक परिणाम (प्रभावी संकेतक) के बीच संबंध को मापने की अनुमति देती है।

संकेत- यह मुख्य विशिष्ट विशेषता है, अध्ययन की गई घटना या प्रक्रिया की विशेषता है।

प्रभावी विशेषता -जांच संकेतक।

कारक चिह्न- एक संकेतक जो प्रभावी विशेषता के मूल्य को प्रभावित करता है।

प्रतिगमन विश्लेषण का उद्देश्य प्रभावी विशेषता के औसत मूल्य की कार्यात्मक निर्भरता का आकलन करना है ( पर) भाज्य से ( एक्स 1, एक्स 2, ..., एक्स एन), इसके रूप में बताया गया प्रतिगमन समीकरण

पर= एफ(एक्स 1, एक्स 2, ..., एक्स एन). (6.1)

प्रतिगमन दो प्रकार के होते हैं: युग्मित और एकाधिक।

युग्मित (सरल) प्रतिगमन- फॉर्म का एक समीकरण:

पर= एफ(एक्स). (6.2)

युग्मित प्रतिगमन में परिणामी विशेषता को एक तर्क के कार्य के रूप में माना जाता है, अर्थात। एक तथ्यात्मक विशेषता।

प्रतिगमन विश्लेषण में निम्नलिखित चरण शामिल हैं:

· कार्य के प्रकार की परिभाषा;

प्रतिगमन गुणांक का निर्धारण;

· प्रभावी संकेतक के सैद्धांतिक मूल्यों की गणना;

प्रतिगमन गुणांकों के सांख्यिकीय महत्व की जाँच करना;

प्रतिगमन समीकरण के सांख्यिकीय महत्व की जाँच करना।

एकाधिक प्रतिगमन- फॉर्म का एक समीकरण:

पर= एफ(एक्स 1, एक्स 2, ..., एक्स एन). (6.3)

प्रभावी विशेषता को कई तर्कों का एक कार्य माना जाता है, अर्थात। कई कारक संकेत।

2. फ़ंक्शन के प्रकार को सही ढंग से निर्धारित करने के लिए, सैद्धांतिक डेटा के आधार पर संचार की दिशा का पता लगाना आवश्यक है।

रिश्ते की दिशा के अनुसार, प्रतिगमन में विभाजित है:

· प्रत्यक्ष प्रतिगमन,इस शर्त के तहत उत्पन्न होना कि स्वतंत्र मात्रा में वृद्धि या कमी के साथ " एन एस"निर्भर मात्रा का मूल्य " वाई "तदनुसार वृद्धि या कमी भी;

· रिवर्स रिग्रेशन,इस शर्त के तहत उत्पन्न होना कि स्वतंत्र मात्रा में वृद्धि या कमी के साथ "एनएस"निर्भर मात्रा " वाई "तदनुसार घटता या बढ़ता है।

संबंधों को चिह्नित करने के लिए, निम्न प्रकार के युग्म प्रतिगमन समीकरणों का उपयोग किया जाता है:

· वाई = ए + बीएक्स– रैखिक;

· वाई = ई कुल्हाड़ी + बी - घातीय;

· y = a + b / x - अतिशयोक्तिपूर्ण;

· वाई = ए + बी 1 एक्स + बी 2 एक्स 2 - परवलयिक;

· वाई = एबी एक्स - घातांकऔर आदि।

कहां ए, बी 1, बी 2- समीकरण के गुणांक (पैरामीटर); पर- प्रभावी संकेत; एन एस- तथ्यात्मक संकेत।

3. इस उपयोग के लिए प्रतिगमन समीकरण का निर्माण इसके गुणांक (पैरामीटर) के आकलन के लिए कम हो गया है कम से कम वर्ग विधि(ओएलएस)।

कम से कम वर्ग विधि किसी को ऐसे पैरामीटर अनुमान प्राप्त करने की अनुमति देती है जिसके लिए प्रभावी संकेतक के वास्तविक मूल्यों के विचलन के वर्गों का योग " पर"सैद्धांतिक से" वाई एक्स»न्यूनतम है, वह है

प्रतिगमन समीकरण पैरामीटर वाई = ए + बीएक्ससूत्रों का उपयोग करके कम से कम वर्गों का अनुमान लगाया जाता है:

कहां ए -मुक्त गुणांक, बी- प्रतिगमन गुणांक दिखाता है कि कितना प्रभावी संकेत " आप"कारक विशेषता बदलते समय" एक्स»माप की प्रति इकाई।

4. प्रतीपगमन गुणांकों के सांख्यिकीय महत्व का आकलन करने के लिए, छात्र के टी-परीक्षण का उपयोग किया जाता है।

प्रतिगमन गुणांक के महत्व के परीक्षण के लिए योजना:

1) एच 0: ए=0, बी= 0 - प्रतीपगमन गुणांक शून्य से नगण्य रूप से भिन्न होता है।

एच 1: एक 0, बी 0 - प्रतिगमन गुणांक शून्य से काफी भिन्न होता है।

2) आर= 0.05 - महत्व स्तर।

कहां एम बी,एम ए- यादृच्छिक त्रुटियां:

; . (6.7)

4) टी टैब(आर; एफ),

कहां एफ=एन-के- 1 - स्वतंत्रता की डिग्री (सारणीबद्ध मान) की संख्या, एन- अवलोकनों की संख्या, क एनएस"।

5) यदि, तो इसे अस्वीकार कर दिया जाता है, अर्थात। गुणांक महत्वपूर्ण है।

यदि, तो इसे स्वीकार किया जाता है, अर्थात्। गुणांक नगण्य है।

5. निर्मित समाश्रयण समीकरण की शुद्धता की जांच करने के लिए फिशर का मानदंड लागू किया जाता है।

प्रतिगमन समीकरण के महत्व के परीक्षण के लिए योजना:

1) एच 0:प्रतिगमन समीकरण महत्वहीन है।

एच 1:प्रतिगमन समीकरण महत्वपूर्ण है।

2) आर= 0.05 - महत्व स्तर।

3) , (6.8)

टिप्पणियों की संख्या कहां है; कचर के लिए समीकरण में मापदंडों की संख्या है « एन एस"; पर- प्रभावी विशेषता का वास्तविक मूल्य; वाई एक्स- प्रभावी विशेषता का सैद्धांतिक मूल्य; युग्मित सहसंबंध गुणांक है।

4) एफ टैब(आर; च १; च 2),

कहां एफ 1 = के, एफ 2 = एन-के-1-स्वतंत्रता की डिग्री की संख्या (सारणीबद्ध मान)।

5) अगर एफ कैल्क> एफ टैब, तो प्रतिगमन समीकरण सही ढंग से चुना जाता है और व्यवहार में लागू किया जा सकता है।

अगर एफ कैल्क , तो प्रतिगमन समीकरण गलत तरीके से चुना जाता है।

6. प्रतिगमन विश्लेषण की गुणवत्ता के माप को दर्शाने वाला मुख्य संकेतक है निर्धारण गुणांक (आर 2)।

निर्धारण गुणांकदिखाता है कि कितना निर्भर चर " पर»विश्लेषण में ध्यान में रखा गया और विश्लेषण में शामिल कारकों के प्रभाव के कारण हुआ।

निर्धारण गुणांक (आर 2)बीच में मान लेता है। प्रतिगमन समीकरण गुणात्मक है यदि आर 2 ≥0,8.

निर्धारण गुणांक सहसंबंध गुणांक के वर्ग के बराबर होता है, अर्थात।

उदाहरण ६.१.निम्नलिखित डेटा का उपयोग करते हुए, प्रतिगमन समीकरण का निर्माण और विश्लेषण करें:

समाधान।

1) सहसंबंध गुणांक की गणना करें:। संकेतों के बीच संबंध प्रत्यक्ष और मध्यम है।

2) एक जोड़ीदार रैखिक समाश्रयण समीकरण बनाएँ।

२.१) एक गणना तालिका बनाएं।

№ एन एस पर हू एक्स 2 वाई एक्स (वाई-वाई-एक्स) 2
55,89 47,54 65,70
45,07 15,42 222,83
54,85 34,19 8,11
51,36 5,55 11,27
42,28 45,16 13,84
47,69 1,71 44,77
45,86 9,87 192,05
योग 159,45 558,55
औसत 77519,6 22,78 79,79 2990,6

,

जोड़ीदार रैखिक प्रतिगमन समीकरण: वाई एक्स = 25.17 + 0.087x।

3) सैद्धांतिक मूल्यों का पता लगाएं " वाई एक्स"प्रतिगमन समीकरण में वास्तविक मानों को प्रतिस्थापित करके" एन एस».

4) वास्तविक "के रेखांकन बनाएँ" वाई "और सैद्धांतिक मूल्य " वाई एक्स»प्रभावी चिह्न (चित्र 6.1): r xy = 0.47) और प्रेक्षणों की एक छोटी संख्या।

7) निर्धारण के गुणांक की गणना करें: आर 2= (०.४७) २ = ०.२२। निर्मित समीकरण खराब गुणवत्ता का है।

चूंकि प्रतिगमन विश्लेषण के दौरान गणना काफी मात्रा में होती है, विशेष कार्यक्रमों ("स्टेटिस्टिका 10", एसपीएसएस, आदि) का उपयोग करने की सिफारिश की जाती है।

चित्र 6.2 सांख्यिकी 10 कार्यक्रम का उपयोग करके किए गए प्रतिगमन विश्लेषण के परिणामों के साथ एक तालिका दिखाता है।

चित्र 6.2। "स्टेटिस्टिका 10" कार्यक्रम का उपयोग करके किए गए प्रतिगमन विश्लेषण के परिणाम

5. साहित्य:

1. गमुरमन वी.ई. संभाव्यता सिद्धांत और गणितीय सांख्यिकी: पाठ्यपुस्तक। विश्वविद्यालयों के लिए मैनुअल / वी.ई. गमुरमैन। - एम।: हायर स्कूल, 2003।-- 479 पी।

2. कोइचुबेकोव बी.के. बायोस्टैटिस्टिक्स: पाठ्यपुस्तक। - अल्माटी: एवरो, 2014 .-- 154 पी।

3. लोबोट्सकाया एन.एल. उच्च गणित। / एन.एल. लोबोट्सकाया, यू.वी. मोरोज़ोव, ए.ए. दुनेव। - मिन्स्क: हायर स्कूल, 1987 .-- 319 पी।

4. मेडिसिन वी.ए., टोकमाचेव एम.एस., फिशमैन बी.बी. मेडिसिन एंड बायोलॉजी में सांख्यिकी: एक मैनुअल। 2 खंडों में / एड। यू.एम. कोमारोव। टी। 1. सैद्धांतिक आँकड़े। - एम।: मेडिसिन, 2000।-- 412 पी।

5. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल के अध्ययन के लिए सांख्यिकीय विश्लेषण के तरीकों का अनुप्रयोग: पाठ्यपुस्तक / संस्करण। वी.जेड. कुचेरेन्को - चौथा संस्करण।, रेव। और जोड़। - एम।: जियोटार - मीडिया, 2011 .-- 256 पी।

प्रतिगमन विश्लेषण अध्ययन की गई विशेषताओं के बीच स्टोकेस्टिक संबंध की विश्लेषणात्मक अभिव्यक्ति स्थापित करने की एक विधि है। प्रतिगमन समीकरण दिखाता है कि औसत कैसे बदलता है परमें से किसी को बदलते समय एक्स मैं , और इसका रूप है:
कहां वाई -आश्रित चर (यह हमेशा एक होता है);
एन एस मैं - स्वतंत्र चर (कारक) (कई हो सकते हैं)।
यदि केवल एक व्याख्यात्मक चर है, तो यह एक सरल प्रतिगमन विश्लेषण है। यदि उनमें से कई हैं ( एन एस 2), तो ऐसे विश्लेषण को बहुभिन्नरूपी कहा जाता है।
प्रतिगमन विश्लेषण के दौरान, दो मुख्य कार्य हल किए जाते हैं:
एक प्रतिगमन समीकरण का निर्माण, अर्थात्। अंतिम संकेतक और स्वतंत्र कारकों के बीच संबंध के प्रकार का पता लगाना एक्स 1 , एक्स 2 , …, एक्स एन .

परिणामी समीकरण के महत्व का अनुमान, अर्थात्। यह निर्धारित करना कि चयनित कारक विशेषताएँ किस हद तक विशेषता की भिन्नता की व्याख्या करती हैं पर।

प्रतिगमन विश्लेषण का उपयोग मुख्य रूप से नियोजन के साथ-साथ एक नियामक ढांचे के विकास के लिए किया जाता है।
सहसंबंध विश्लेषण के विपरीत, जो केवल इस सवाल का जवाब देता है कि क्या विश्लेषण की गई विशेषताओं के बीच कोई संबंध है, प्रतिगमन विश्लेषण भी इसकी औपचारिक अभिव्यक्ति देता है। इसके अलावा, यदि सहसंबंध विश्लेषण कारकों के किसी भी अंतर्संबंध का अध्ययन करता है, तो प्रतिगमन विश्लेषण एकतरफा निर्भरता का अध्ययन करता है, अर्थात। एक कनेक्शन दिखा रहा है कि कारक संकेतों में परिवर्तन प्रभावी संकेत को कैसे प्रभावित करता है।
प्रतिगमन विश्लेषण गणितीय आँकड़ों के सबसे विकसित तरीकों में से एक है। कड़ाई से बोलते हुए, प्रतिगमन विश्लेषण को लागू करने के लिए, कई विशेष आवश्यकताओं को पूरा करना आवश्यक है (विशेष रूप से, एक्समैं , एक्स 2 , ..., एक्स एन ;आपस्वतंत्र होना चाहिए, सामान्य रूप से निरंतर भिन्नता वाले यादृच्छिक चर वितरित किए जाते हैं)। वास्तविक जीवन में, प्रतिगमन और सहसंबंध विश्लेषण की आवश्यकताओं का सख्त अनुपालन बहुत दुर्लभ है, लेकिन आर्थिक अनुसंधान में ये दोनों विधियां काफी सामान्य हैं। अर्थव्यवस्था में निर्भरता न केवल प्रत्यक्ष हो सकती है, बल्कि व्युत्क्रम और अरेखीय भी हो सकती है। एक प्रतिगमन मॉडल किसी भी निर्भरता की उपस्थिति में बनाया जा सकता है, हालांकि, बहुभिन्नरूपी विश्लेषण में, केवल फॉर्म के रैखिक मॉडल का उपयोग किया जाता है:
प्रतिगमन समीकरण का निर्माण, एक नियम के रूप में, कम से कम वर्ग विधि द्वारा किया जाता है, जिसका सार इसकी गणना मूल्यों से परिणामी विशेषता के वास्तविक मूल्यों के विचलन के वर्गों के योग को कम करना है, अर्थात:
कहां टी -टिप्पणियों की संख्या;
जे =ए + बी 1 एक्स 1 जे + बी 2 एक्स 2 जे + ... + बी एन एन एस एन जे - परिणामी कारक का परिकलित मान।
व्यक्तिगत कंप्यूटर या एक विशेष वित्तीय कैलकुलेटर के लिए विश्लेषणात्मक पैकेजों का उपयोग करके प्रतिगमन गुणांक निर्धारित करने की सिफारिश की जाती है। सरलतम मामले में, फॉर्म के एकतरफा रैखिक प्रतिगमन समीकरण के प्रतिगमन गुणांक वाई = ए + बीएक्ससूत्रों द्वारा पाया जा सकता है:
समूह विश्लेषण
क्लस्टर विश्लेषण बहुभिन्नरूपी विश्लेषण के तरीकों में से एक है, जो एक आबादी को समूहीकृत (क्लस्टरिंग) करने के लिए डिज़ाइन किया गया है, जिसके तत्व कई विशेषताओं की विशेषता है। प्रत्येक गुण के मान गुण के बहुआयामी स्थान में अध्ययन की गई जनसंख्या की प्रत्येक इकाई के निर्देशांक के रूप में कार्य करते हैं। कई संकेतकों के मूल्यों की विशेषता वाले प्रत्येक अवलोकन को इन संकेतकों के स्थान में एक बिंदु के रूप में दर्शाया जा सकता है, जिसके मूल्यों को एक बहुआयामी अंतरिक्ष में निर्देशांक के रूप में माना जाता है। बिंदुओं के बीच की दूरी आरतथा क्यूसाथ कनिर्देशांक के रूप में परिभाषित किया गया है:
क्लस्टरिंग के लिए मुख्य मानदंड यह है कि समूहों के बीच अंतर एक ही क्लस्टर को सौंपे गए अवलोकनों की तुलना में अधिक महत्वपूर्ण होना चाहिए, अर्थात। एक बहुआयामी अंतरिक्ष में, असमानता देखी जानी चाहिए:
कहां आर 1, 2 - क्लस्टर 1 और 2 के बीच की दूरी।
प्रतिगमन विश्लेषण प्रक्रियाओं की तरह, क्लस्टरिंग प्रक्रिया बल्कि श्रमसाध्य है, इसे कंप्यूटर पर करने की सलाह दी जाती है।

प्रतिगमन क्या है?
दो सतत चरों पर विचार करें एक्स = (एक्स 1, एक्स 2, .., एक्स एन), वाई = (वाई 1, वाई 2, ..., वाई एन)।

आइए बिंदुओं को 2D स्कैटर प्लॉट पर रखें और कहें कि हमारे पास है रैखिक संबंधयदि डेटा एक सीधी रेखा के साथ फिट किया गया है।

अगर हम मानते हैं कि आपनिर्भर करता है एक्स, और में परिवर्तन आपमें परिवर्तन के कारण सटीक रूप से होते हैं एक्स, हम प्रतिगमन रेखा (प्रतिगमन .) निर्धारित कर सकते हैं आपपर एक्स), जो इन दो चरों के बीच सीधे संबंध का सबसे अच्छा वर्णन करता है।

शब्द "प्रतिगमन" का सांख्यिकीय उपयोग एक घटना से आता है जिसे प्रतिगमन के रूप में जाना जाता है, जिसका श्रेय सर फ्रांसिस गैल्टन (1889) को दिया जाता है।

उन्होंने दिखाया कि हालांकि लंबे पिता के लंबे बेटे होते हैं, बेटों की औसत ऊंचाई उनके लंबे पिता की तुलना में कम होती है। बेटों की औसत ऊंचाई जनसंख्या में सभी पिताओं की औसत ऊंचाई के लिए "पीछे" और "उलट" है। इस प्रकार, औसतन, लम्बे पिता के निम्न (लेकिन अभी भी लम्बे) पुत्र होते हैं, और निम्न पिता के उच्च (लेकिन फिर भी छोटे) पुत्र होते हैं।

प्रतिगमन लाइन

एक गणितीय समीकरण जो एक सरल (युग्मित) रैखिक प्रतिगमन रेखा का अनुमान लगाता है:

एक्सस्वतंत्र चर या भविष्यवक्ता कहा जाता है।

यू- आश्रित चर या प्रतिक्रिया चर। यह वह मूल्य है जिसकी हम अपेक्षा करते हैं आप(औसतन) यदि हम मूल्य जानते हैं एक्स, अर्थात। यह "अनुमानित मूल्य आप»

ए- मूल्यांकन की रेखा के मुक्त सदस्य (चौराहे); यह मान यू, कब एक्स = 0(चित्र एक)।

बी- मूल्यांकन की गई रेखा का ढलान या ढाल; यह उस राशि का प्रतिनिधित्व करता है जिसके द्वारा यूअगर हम बढ़ते हैं तो औसतन बढ़ता है एक्सएक इकाई द्वारा।

एतथा बीअनुमानित रेखा के प्रतीपगमन गुणांक कहलाते हैं, हालांकि इस शब्द का प्रयोग अक्सर केवल के लिए किया जाता है बी.

युग्मित रैखिक प्रतिगमन को एक से अधिक स्वतंत्र चर शामिल करने के लिए बढ़ाया जा सकता है; इस मामले में इसे के रूप में जाना जाता है एकाधिक प्रतिगमन.

चित्र एक। रेखीय प्रतिगमन रेखा a के प्रतिच्छेदन और b के ढलान को दर्शाती है (Y की मात्रा एक इकाई द्वारा x बढ़ने पर बढ़ जाती है)

कम से कम वर्ग विधि

हम अवलोकनों के नमूने का उपयोग करके प्रतिगमन विश्लेषण करते हैं जहां एतथा बी- सही (सामान्य) मापदंडों का नमूना अनुमान, α और β, जो जनसंख्या (सामान्य जनसंख्या) में रैखिक प्रतिगमन की रेखा निर्धारित करते हैं।

गुणांक निर्धारित करने की सबसे सरल विधि एतथा बीएक कम से कम वर्ग विधि(ओएलएस)।

फिट का अनुमान अवशिष्टों (रेखा से प्रत्येक बिंदु की ऊर्ध्वाधर दूरी, उदाहरण के लिए, अवशिष्ट = मनाया गया) पर विचार करके लगाया जाता है आप- भविष्यवाणी की आप, चावल। 2))।

सबसे अच्छी फिट लाइन को चुना जाता है ताकि अवशिष्ट के वर्गों का योग न्यूनतम हो।

चावल। 2. प्रत्येक बिंदु के लिए दर्शाए गए अवशेषों के साथ रैखिक प्रतिगमन रेखा (ऊर्ध्वाधर धराशायी रेखाएं)।

रैखिक प्रतिगमन धारणाएँ

इसलिए, प्रत्येक देखे गए मान के लिए, अवशिष्ट अंतर और संबंधित अनुमानित मूल्य के बराबर है। प्रत्येक अवशिष्ट सकारात्मक या नकारात्मक हो सकता है।

आप रेखीय प्रतिगमन अंतर्निहित निम्नलिखित मान्यताओं का परीक्षण करने के लिए अवशिष्टों का उपयोग कर सकते हैं:

शेष राशि सामान्य रूप से शून्य माध्य के साथ वितरित की जाती है;

यदि रैखिकता, सामान्यता और / या निरंतर भिन्नता की धारणाएं संदिग्ध हैं, तो हम एक नई प्रतिगमन रेखा को बदल सकते हैं या गणना कर सकते हैं जिसके लिए ये धारणाएं संतुष्ट हैं (उदाहरण के लिए, लॉग ट्रांसफॉर्मेशन का उपयोग करें, आदि)।

असामान्य मूल्य (बाहरी) और प्रभाव बिंदु

एक "प्रभावशाली" अवलोकन, यदि छोड़ा जाता है, तो मॉडल मापदंडों (यानी, ढलान या अवरोधन) के एक या अधिक अनुमानों को बदल देता है।

एक बाहरी (एक अवलोकन जो एक डेटासेट में अधिकांश मूल्यों का खंडन करता है) एक "प्रभावशाली" अवलोकन हो सकता है और 2 डी स्कैटर प्लॉट या अवशिष्ट प्लॉट से देखे जाने पर दृष्टि से अच्छी तरह से पता लगाया जा सकता है।

आउटलेयर और "प्रभावशाली" टिप्पणियों (अंक) दोनों के लिए, मॉडल का उपयोग उनके साथ और उनके बिना, अनुमान (प्रतिगमन गुणांक) में परिवर्तन पर ध्यान देते हुए किया जाता है।

विश्लेषण करते समय, आउटलेर्स या प्रभाव बिंदुओं को स्वचालित रूप से न छोड़ें, क्योंकि साधारण अनदेखी प्राप्त परिणामों को प्रभावित कर सकती है। हमेशा इन आउटलेर्स के कारणों की जांच और विश्लेषण करें।

रैखिक प्रतिगमन परिकल्पना

एक रेखीय प्रतिगमन का निर्माण करते समय, शून्य परिकल्पना का परीक्षण किया जाता है कि प्रतिगमन रेखा β का सामान्य ढलान शून्य के बराबर है।

यदि रेखा का ढलान शून्य है, तो और के बीच कोई रैखिक संबंध नहीं है: परिवर्तन प्रभावित नहीं करता है

शून्य परिकल्पना का परीक्षण करने के लिए कि वास्तविक ढलान शून्य है, आप निम्न एल्गोरिथम का उपयोग कर सकते हैं:

अनुपात के बराबर एक परीक्षण आंकड़े की गणना करें जो स्वतंत्रता की डिग्री के साथ वितरण का पालन करता है, जहां गुणांक की मानक त्रुटि है

,

- अवशेषों के विचरण का अनुमान।
आमतौर पर, यदि प्राप्त महत्व का स्तर शून्य परिकल्पना को खारिज कर दिया जाता है।

स्वतंत्रता की डिग्री के साथ वितरण का प्रतिशत बिंदु कहां है जो दो-तरफा परीक्षण की संभावना देता है

यह वह अंतराल है जिसमें 95% संभावना के साथ सामान्य ढलान होता है।

बड़े नमूनों के लिए, मान लें कि हम 1.96 के मान के साथ अनुमानित कर सकते हैं (अर्थात, मानदंड के आँकड़े सामान्य वितरण की ओर प्रवृत्त होंगे)

रैखिक प्रतिगमन की गुणवत्ता का मूल्यांकन: निर्धारण का गुणांक R 2

रैखिक संबंध के कारण, और हम उम्मीद करते हैं कि यह बदलते ही बदल जाएगा , और हम इस भिन्नता को कहते हैं जो प्रतिगमन के कारण या समझाया गया है। अवशिष्ट भिन्नता यथासंभव छोटी होनी चाहिए।

यदि ऐसा है, तो अधिकांश भिन्नता प्रतिगमन के कारण होगी, और बिंदु प्रतिगमन रेखा के करीब होंगे, अर्थात। रेखा डेटा से अच्छी तरह मेल खाती है।

प्रतिगमन द्वारा समझाया गया कुल विचरण का अनुपात कहलाता है निर्धारण का गुणांक, आमतौर पर प्रतिशत के रूप में व्यक्त किया जाता है और निरूपित करता है आर 2(युग्मित रैखिक प्रतिगमन में, यह मान है आर 2, सहसंबंध गुणांक का वर्ग), आपको प्रतिगमन समीकरण की गुणवत्ता का व्यक्तिपरक मूल्यांकन करने की अनुमति देता है।

अंतर विचरण का प्रतिशत है जिसे प्रतिगमन द्वारा समझाया नहीं जा सकता है।

मूल्यांकन करने के लिए कोई औपचारिक परीक्षण नहीं है, हमें रिग्रेशन लाइन फिट की गुणवत्ता निर्धारित करने के लिए व्यक्तिपरक निर्णय पर भरोसा करना होगा।

पूर्वानुमान के लिए प्रतिगमन रेखा लागू करना

आप प्रेक्षित सीमा के भीतर किसी मान से किसी मान की भविष्यवाणी करने के लिए एक प्रतिगमन रेखा का उपयोग कर सकते हैं (इन सीमाओं के बाहर कभी भी एक्सट्रपलेशन नहीं करें)।

हम वेधशालाओं के माध्य का अनुमान लगाते हैं जिनका एक विशेष मान होता है, उस मान को प्रतिगमन रेखा समीकरण में प्लग करके।

इसलिए, यदि हम यह अनुमान लगाते हैं कि जनसंख्या में सही माध्य के लिए विश्वास अंतराल का अनुमान लगाने के लिए हम इस अनुमानित मूल्य और इसकी मानक त्रुटि का उपयोग कैसे करते हैं।

विभिन्न मूल्यों के लिए इस प्रक्रिया को दोहराने से आप इस लाइन के लिए आत्मविश्वास की सीमा बना सकते हैं। यह वह बैंड या क्षेत्र है जिसमें सच्ची रेखा होती है, उदाहरण के लिए, 95% आत्मविश्वास स्तर के साथ।

सरल प्रतिगमन डिजाइन

सरल प्रतिगमन डिजाइन में एक निरंतर भविष्यवक्ता होता है। यदि भविष्यवक्ता मान P के साथ 3 मामले हैं, उदाहरण के लिए, 7, 4, और 9, और डिज़ाइन में प्रथम-क्रम प्रभाव P शामिल है, तो डिज़ाइन मैट्रिक्स X का रूप होगा

और X1 के लिए P का उपयोग करते हुए प्रतिगमन समीकरण जैसा दिखता है

वाई = बी0 + बी1 पी

यदि एक साधारण प्रतिगमन डिज़ाइन में P पर उच्च-क्रम प्रभाव होता है, जैसे कि द्विघात प्रभाव, तो डिज़ाइन मैट्रिक्स में स्तंभ X1 में मान दूसरी शक्ति तक बढ़ाए जाएंगे:

और समीकरण रूप लेता है

Y = b0 + b1 P2

सिग्मा-प्रतिबंधित और अति-पैरामीटरयुक्त कोडिंग विधियां साधारण प्रतिगमन डिजाइनों और अन्य डिजाइनों पर लागू नहीं होती हैं जिनमें केवल निरंतर भविष्यवाणियां होती हैं (चूंकि श्रेणीबद्ध भविष्यवक्ता बस मौजूद नहीं होते हैं)। चुने गए कोडिंग विधि के बावजूद, निरंतर चर के मूल्यों को उचित डिग्री तक बढ़ाया जाता है और एक्स चर के मूल्यों के रूप में उपयोग किया जाता है। इस मामले में, कोई रीकोडिंग नहीं की जाती है। इसके अलावा, प्रतिगमन डिजाइनों का वर्णन करते समय, आप डिजाइन मैट्रिक्स एक्स के विचार को छोड़ सकते हैं, और केवल प्रतिगमन समीकरण के साथ काम कर सकते हैं।

उदाहरण: सरल प्रतिगमन विश्लेषण

यह उदाहरण तालिका में प्रस्तुत डेटा का उपयोग करता है:

चावल। 3. प्रारंभिक डेटा की तालिका।

बेतरतीब ढंग से चुने गए 30 जिलों में 1960 और 1970 की जनगणना की तुलना से संकलित डेटा। जिले के नामों को अवलोकन नामों के रूप में दर्शाया गया है। प्रत्येक चर के संबंध में जानकारी नीचे प्रस्तुत की गई है:

चावल। 4. परिवर्तनीय विनिर्देशों की तालिका।

अनुसंधान कार्य

इस उदाहरण के लिए, गरीबी दर और डिग्री के बीच संबंध का विश्लेषण किया जाएगा, जो गरीबी रेखा से नीचे रहने वाले परिवारों के प्रतिशत की भविष्यवाणी करता है। इसलिए, हम चर 3 (Pt_Poor) को एक आश्रित चर के रूप में मानेंगे।

यह अनुमान लगाया जा सकता है कि जनसंख्या परिवर्तन और गरीबी रेखा से नीचे के परिवारों का प्रतिशत संबंधित है। यह अपेक्षा करना उचित प्रतीत होता है कि गरीबी से जनसंख्या का बहिर्वाह होता है, इसलिए गरीबी रेखा से नीचे के लोगों के प्रतिशत और जनसंख्या परिवर्तन के बीच एक नकारात्मक सहसंबंध होगा। इसलिए, हम वेरिएबल 1 (Pop_Chng) को एक प्रेडिक्टर वेरिएबल के रूप में मानेंगे।

परिणाम देखना

प्रतिगमन गुणांक

चावल। 5. रिग्रेशन गुणांक Pt_Poor Pop_Chng पर।

Pop_Chng पंक्ति और परम के चौराहे पर। Pop_Chng पर Pt_Poor प्रतिगमन के लिए गैर-मानकीकृत गुणांक -0.40374 है। इसका मतलब है कि जनसंख्या में प्रत्येक इकाई कमी के लिए, गरीबी दर में 40374 की वृद्धि हुई है। इस गैर-मानकीकृत गुणांक के लिए ऊपरी और निचले (डिफ़ॉल्ट) 95% विश्वास सीमा में शून्य शामिल नहीं है, इसलिए पी स्तर पर प्रतिगमन गुणांक महत्वपूर्ण है<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

चर का वितरण

डेटा में बड़े आउटलेयर होने पर सहसंबंध गुणांक काफी अधिक या कम करके आंका जा सकता है। आइए हम आश्रित चर Pt_Poor के जिले द्वारा वितरण की जाँच करें। ऐसा करने के लिए, आइए Pt_Poor चर का एक हिस्टोग्राम बनाएं।

चावल। 6. Pt_Poor चर का हिस्टोग्राम।

जैसा कि आप देख सकते हैं, इस चर का वितरण सामान्य वितरण से स्पष्ट रूप से भिन्न है। हालांकि, हालांकि दो काउंटियों (दाएं हाथ के दो कॉलम) में सामान्य वितरण की अपेक्षा गरीबी रेखा से नीचे के परिवारों का प्रतिशत अधिक है, वे "सीमा के भीतर" प्रतीत होते हैं।

चावल। 7. Pt_Poor चर का हिस्टोग्राम।

यह फैसला कुछ हद तक व्यक्तिपरक है। अंगूठे के एक नियम के रूप में, आउटलेर्स का हिसाब लगाया जाना चाहिए यदि अवलोकन (या अवलोकन) अंतराल के भीतर नहीं आते हैं (मतलब मानक विचलन का ± 3 गुना)। इस मामले में, आउटलेर्स के साथ और बिना विश्लेषण को दोहराने के लायक है ताकि यह सुनिश्चित हो सके कि जनसंख्या के सदस्यों के बीच सहसंबंध पर उनका महत्वपूर्ण प्रभाव नहीं पड़ता है।

स्कैटर प्लॉट

यदि दिए गए चरों के बीच संबंध के बारे में परिकल्पना में से एक प्राथमिकता है, तो इसे संबंधित स्कैटरप्लॉट के ग्राफ पर जांचना उपयोगी होता है।

चावल। 8. स्कैटर आरेख।

स्कैटर प्लॉट दो चर के बीच एक स्पष्ट नकारात्मक सहसंबंध (-.65) दिखाता है। यह प्रतिगमन रेखा के लिए ९५% विश्वास अंतराल को भी दर्शाता है, अर्थात, ९५% संभावना के साथ, प्रतिगमन रेखा दो धराशायी वक्रों के बीच से गुजरती है।

महत्व मानदंड

चावल। 9. महत्व के मानदंड वाली तालिका।

Pop_Chng प्रतिगमन गुणांक की कसौटी पुष्टि करती है कि Pop_Chng दृढ़ता से Pt_Poor, p से संबंधित है<.001 .

परिणाम

इस उदाहरण ने दिखाया कि एक साधारण प्रतिगमन डिजाइन का विश्लेषण कैसे किया जाता है। गैर-मानकीकृत और मानकीकृत प्रतिगमन गुणांक की व्याख्या भी प्रस्तुत की गई थी। आश्रित चर की प्रतिक्रियाओं के वितरण के अध्ययन के महत्व पर चर्चा की जाती है, और भविष्यवक्ता और आश्रित चर के बीच संबंधों की दिशा और ताकत को निर्धारित करने के लिए एक तकनीक का प्रदर्शन किया जाता है।

सांख्यिकीय मॉडलिंग में, प्रतिगमन विश्लेषण एक अध्ययन है जिसका उपयोग चर के बीच संबंध का आकलन करने के लिए किया जाता है। इस गणितीय तकनीक में कई चरों के मॉडलिंग और विश्लेषण के लिए कई अन्य तकनीकें शामिल हैं, जहां आश्रित चर और एक या अधिक स्वतंत्र चर के बीच संबंधों पर ध्यान केंद्रित किया जाता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण आपको यह समझने में मदद करता है कि आश्रित चर का विशिष्ट मूल्य कैसे बदलता है यदि एक व्याख्यात्मक चर बदलता है जबकि अन्य व्याख्यात्मक चर स्थिर रहते हैं।

सभी मामलों में, लक्ष्य स्कोर व्याख्यात्मक चर का एक कार्य है और इसे प्रतिगमन फ़ंक्शन कहा जाता है। प्रतिगमन विश्लेषण में, आश्रित चर में परिवर्तन को एक प्रतिगमन फ़ंक्शन के रूप में चिह्नित करना भी रुचि का है, जिसे एक संभाव्यता वितरण का उपयोग करके वर्णित किया जा सकता है।

प्रतिगमन विश्लेषण कार्य

इस सांख्यिकीय अनुसंधान पद्धति का व्यापक रूप से पूर्वानुमान के लिए उपयोग किया जाता है, जहां इसके उपयोग का एक महत्वपूर्ण लाभ होता है, लेकिन कभी-कभी यह भ्रम या गलत दृष्टिकोण पैदा कर सकता है, इसलिए इस मुद्दे में इसे सावधानी से उपयोग करने की सिफारिश की जाती है, उदाहरण के लिए, सहसंबंध का मतलब यह नहीं है कारण

प्रतिगमन विश्लेषण करने के लिए बड़ी संख्या में विधियों का विकास किया गया है, जैसे कि रैखिक और साधारण न्यूनतम वर्ग प्रतिगमन, जो पैरामीट्रिक हैं। उनका सार यह है कि प्रतिगमन फ़ंक्शन को डेटा से अनुमानित अज्ञात मापदंडों की एक सीमित संख्या के रूप में परिभाषित किया गया है। गैर-पैरामीट्रिक प्रतिगमन अपने कार्यों को कार्यों के एक निश्चित सेट में झूठ बोलने की अनुमति देता है, जो अनंत-आयामी हो सकता है।

एक सांख्यिकीय अनुसंधान पद्धति के रूप में, व्यवहार में प्रतिगमन विश्लेषण डेटा निर्माण प्रक्रिया के रूप पर निर्भर करता है और यह प्रतिगमन दृष्टिकोण से कैसे संबंधित है। चूंकि डेटा प्रक्रिया का वास्तविक रूप आमतौर पर एक अज्ञात संख्या होती है, डेटा का प्रतिगमन विश्लेषण अक्सर प्रक्रिया के बारे में मान्यताओं पर कुछ हद तक निर्भर करता है। पर्याप्त डेटा उपलब्ध होने पर ये धारणाएं कभी-कभी परीक्षण योग्य होती हैं। प्रतिगमन मॉडल अक्सर तब भी उपयोगी होते हैं जब धारणाएं मामूली रूप से टूट जाती हैं, हालांकि वे यथासंभव कुशलता से काम नहीं कर सकते हैं।

एक संकीर्ण अर्थ में, प्रतिगमन विशेष रूप से निरंतर प्रतिक्रिया चर के आकलन को संदर्भित कर सकता है, जैसा कि वर्गीकरण में उपयोग किए जाने वाले असतत प्रतिक्रिया चर के विपरीत है। निरंतर आउटपुट चर के मामले को संबंधित समस्याओं से अलग करने के लिए मीट्रिक प्रतिगमन भी कहा जाता है।

इतिहास

समाश्रयण का सबसे प्रारंभिक रूप सुप्रसिद्ध न्यूनतम वर्ग विधि है। यह 1805 में लेजेंड्रे द्वारा और 1809 में गॉस द्वारा प्रकाशित किया गया था। लेजेंडर और गॉस ने खगोलीय टिप्पणियों से सूर्य के चारों ओर पिंडों की कक्षाओं (मुख्य रूप से धूमकेतु, लेकिन बाद में नए खोजे गए छोटे ग्रहों) को निर्धारित करने की समस्या को लागू किया। गॉस ने 1821 में कम से कम वर्गों के सिद्धांत का एक और विकास प्रकाशित किया, जिसमें गॉस-मार्कोव प्रमेय का एक प्रकार भी शामिल था।

प्रतिगमन शब्द 19वीं शताब्दी में फ्रांसिस गैल्टन द्वारा एक जैविक घटना का वर्णन करने के लिए गढ़ा गया था। लब्बोलुआब यह था कि पूर्वजों की वृद्धि से संतानों की वृद्धि, एक नियम के रूप में, सामान्य माध्य तक वापस आ जाती है। गैल्टन के लिए, प्रतिगमन का केवल यही जैविक अर्थ था, लेकिन बाद में उनके काम को उडनी योली और कार्ल पियर्सन द्वारा जारी रखा गया और एक अधिक सामान्य सांख्यिकीय संदर्भ में लाया गया। यूल और पियर्सन के काम में, प्रतिक्रिया और व्याख्यात्मक चर के संयुक्त वितरण को गाऊसी माना जाता है। फिशर ने 1922 और 1925 में इस धारणा को खारिज कर दिया था। फिशर ने सुझाव दिया कि प्रतिक्रिया चर का सशर्त वितरण गाऊसी है, लेकिन संयुक्त वितरण नहीं होना चाहिए। इस संबंध में, फिशर की धारणा 1821 में गॉस के निर्माण के करीब है। 1970 तक, प्रतिगमन विश्लेषण का परिणाम प्राप्त करने में कभी-कभी 24 घंटे तक लग जाते थे।

प्रतिगमन विश्लेषण विधियां सक्रिय अनुसंधान का एक क्षेत्र बनी हुई हैं। हाल के दशकों में, मजबूत प्रतिगमन के लिए नए तरीके विकसित किए गए हैं; सहसंबद्ध प्रतिक्रियाओं के साथ प्रतिगमन; विभिन्न प्रकार के लापता डेटा को समायोजित करने वाली प्रतिगमन विधियां; गैर-पैरामीट्रिक प्रतिगमन; बायेसियन प्रतिगमन के तरीके; प्रतिगमन जिसमें भविष्यवक्ता चर को त्रुटि में मापा जाता है; अवलोकनों की तुलना में अधिक भविष्यवक्ताओं के साथ प्रतिगमन; और प्रतिगमन के साथ कारण निष्कर्ष।
प्रतिगमन मॉडल

प्रतिगमन विश्लेषण मॉडल में निम्नलिखित चर शामिल हैं:

अज्ञात पैरामीटर, निरूपित बीटा, जो एक अदिश या सदिश हो सकता है।

स्वतंत्र चर, एक्स।

आश्रित चर, वाई।

विज्ञान के विभिन्न क्षेत्रों में जहां प्रतिगमन विश्लेषण लागू किया जाता है, आश्रित और स्वतंत्र चर के बजाय अलग-अलग शब्दों का उपयोग किया जाता है, लेकिन सभी मामलों में प्रतिगमन मॉडल वाई को एक्स और β के फ़ंक्शन के लिए संदर्भित करता है।

सन्निकटन आमतौर पर ई (वाई | एक्स) = एफ (एक्स, β) के रूप में लिखा जाता है। प्रतिगमन विश्लेषण करने के लिए, फ़ंक्शन f का रूप निर्धारित किया जाना चाहिए। कम सामान्यतः, यह वाई और एक्स के बीच संबंधों के ज्ञान पर आधारित होता है जो डेटा पर निर्भर नहीं करता है। यदि ऐसा ज्ञान उपलब्ध नहीं है, तो एक लचीला या सुविधाजनक एफ फॉर्म चुना जाता है।

आश्रित चर Y

अब मान लीजिए कि अज्ञात पैरामीटर β के वेक्टर की लंबाई k है। प्रतिगमन विश्लेषण करने के लिए, उपयोगकर्ता को आश्रित चर Y के बारे में जानकारी प्रदान करनी होगी:

यदि फॉर्म के एन डेटा बिंदु (वाई, एक्स) देखे जाते हैं, जहां एन< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.

यदि वास्तव में N = K का अवलोकन किया जाता है, और फलन F रैखिक है, तो समीकरण Y = F (X, β) को ठीक-ठीक हल किया जा सकता है, लगभग नहीं। यह एन-अज्ञात (तत्वों β) के साथ एन-समीकरणों के एक सेट को हल करने के लिए उबलता है, जिसका एक अनूठा समाधान है जब तक कि एक्स रैखिक रूप से स्वतंत्र है। यदि F अरेखीय है, तो समाधान मौजूद नहीं हो सकता है, या कई समाधान मौजूद हो सकते हैं।

सबसे आम स्थिति वह है जहां डेटा के लिए N> अंक देखे जाते हैं। इस मामले में, डेटा में β के लिए अद्वितीय मान का अनुमान लगाने के लिए पर्याप्त जानकारी है जो डेटा के लिए सबसे उपयुक्त है, और एक प्रतिगमन मॉडल जहां डेटा के लिए आवेदन को β में एक अतिनिर्धारित प्रणाली के रूप में देखा जा सकता है।

बाद के मामले में, प्रतिगमन विश्लेषण के लिए उपकरण प्रदान करता है:

अज्ञात पैरामीटर β के लिए एक समाधान खोजें, जो, उदाहरण के लिए, Y के मापा और अनुमानित मान के बीच की दूरी को कम करेगा।

कुछ सांख्यिकीय मान्यताओं के तहत, प्रतिगमन विश्लेषण अज्ञात β मापदंडों और आश्रित चर Y के अनुमानित मूल्यों के बारे में सांख्यिकीय जानकारी प्रदान करने के लिए अतिरिक्त जानकारी का उपयोग करता है।

स्वतंत्र माप की आवश्यक संख्या

एक प्रतिगमन मॉडल पर विचार करें जिसमें तीन अज्ञात पैरामीटर हैं: β 0, β 1, और β 2। मान लीजिए कि प्रयोगकर्ता सदिश X के लिए स्वतंत्र चर के समान मान पर 10 माप करता है। इस मामले में, प्रतिगमन विश्लेषण मानों का एक अनूठा सेट नहीं देता है। सबसे अच्छी बात यह है कि आश्रित चर वाई के माध्य और मानक विचलन का अनुमान लगाया जाए। इसी तरह, दो अलग-अलग एक्स-मानों को मापकर, आप दो अज्ञात के साथ वापस आने के लिए पर्याप्त डेटा प्राप्त कर सकते हैं, लेकिन तीन या अधिक अज्ञात नहीं।

यदि प्रयोगकर्ता के माप वेक्टर एक्स के स्वतंत्र चर के तीन अलग-अलग मूल्यों पर किए गए थे, तो प्रतिगमन विश्लेषण β में तीन अज्ञात मापदंडों के लिए अनुमानों का एक अनूठा सेट प्रदान करेगा।
सामान्य रैखिक प्रतिगमन के मामले में, उपरोक्त कथन आवश्यकता के बराबर है कि मैट्रिक्स एक्स टी एक्स उलटा है।

सांख्यिकीय धारणाएं

जब माप की संख्या एन अज्ञात मापदंडों की संख्या से अधिक होती है k और माप त्रुटियां ε i, तब, एक नियम के रूप में, माप में निहित जानकारी की अधिकता को तब प्रचारित किया जाता है और अज्ञात मापदंडों के संबंध में सांख्यिकीय भविष्यवाणियों के लिए उपयोग किया जाता है। जानकारी की इस अधिकता को प्रतिगमन की स्वतंत्रता की डिग्री कहा जाता है।

निहित पूर्वधारणायें

प्रतिगमन विश्लेषण के लिए क्लासिक मान्यताओं में शामिल हैं:

नमूना अनुमान भविष्यवाणी का प्रतिनिधि है।

त्रुटि शून्य के माध्य के साथ एक यादृच्छिक चर है, जो व्याख्यात्मक चर पर सशर्त है।

व्याख्यात्मक चर को त्रुटि के बिना मापा जाता है।

स्वतंत्र चर (भविष्यवाणियों) के रूप में, वे रैखिक रूप से स्वतंत्र हैं, अर्थात किसी भी भविष्यवक्ता को दूसरों के रैखिक संयोजन के रूप में व्यक्त करना संभव नहीं है।

त्रुटियां असंबंधित हैं, अर्थात, विकर्णों का त्रुटि सहप्रसरण मैट्रिक्स और प्रत्येक गैर-शून्य तत्व त्रुटि का विचरण है।

प्रेक्षणों (होमोसेडैस्टिसिटी) के अनुसार त्रुटि का प्रसरण स्थिर होता है। यदि नहीं, तो भारित न्यूनतम वर्ग या अन्य विधियों का उपयोग किया जा सकता है।

कम से कम वर्ग अनुमान के लिए इन पर्याप्त स्थितियों में आवश्यक गुण हैं, विशेष रूप से, इन मान्यताओं का मतलब है कि पैरामीटर अनुमान उद्देश्यपूर्ण, सुसंगत और प्रभावी होंगे, खासकर जब रैखिक अनुमानों के वर्ग में ध्यान में रखा जाता है। यह ध्यान रखना महत्वपूर्ण है कि साक्ष्य शायद ही कभी शर्तों को पूरा करते हैं। अर्थात् अनुमान सही न होने पर भी विधि का प्रयोग किया जाता है। अनुमानों से भिन्नता का उपयोग कभी-कभी यह मापने के लिए किया जा सकता है कि मॉडल कितना उपयोगी है। इनमें से कई धारणाओं को अधिक उन्नत तरीकों से शिथिल किया जा सकता है। सांख्यिकीय विश्लेषण रिपोर्ट में आम तौर पर मॉडल की उपयोगिता के लिए नमूना डेटा और कार्यप्रणाली के खिलाफ परीक्षणों का विश्लेषण शामिल होता है।

इसके अलावा, कुछ मामलों में चर बिंदु स्थानों पर मापे गए मानों को संदर्भित करते हैं। सांख्यिकीय मान्यताओं का उल्लंघन करने वाले चरों में स्थानिक रुझान और स्थानिक स्वसंबंध हो सकते हैं। भौगोलिक भारित प्रतिगमन एकमात्र ऐसी तकनीक है जो इस प्रकार के डेटा से संबंधित है।

रैखिक प्रतिगमन में, विशेषता यह है कि आश्रित चर, जो कि Y i है, मापदंडों का एक रैखिक संयोजन है। उदाहरण के लिए, सरल रैखिक प्रतिगमन एक स्वतंत्र चर, x i, और दो पैरामीटर, β 0 और β 1 का उपयोग n-बिंदुओं को मॉडल करने के लिए करता है।

बहु रेखीय प्रतिगमन में, कई स्वतंत्र चर या उनके कार्य होते हैं।

जब किसी जनसंख्या से यादृच्छिक रूप से नमूना लिया जाता है, तो इसके पैरामीटर एक रेखीय प्रतिगमन मॉडल का एक नमूना प्रदान करते हैं।

इस पहलू में, कम से कम वर्ग विधि सबसे लोकप्रिय है। इसका उपयोग पैरामीटर अनुमान प्राप्त करने के लिए किया जाता है जो अवशिष्ट के वर्गों के योग को कम करता है। इस प्रकार के न्यूनीकरण (जो रैखिक प्रतिगमन के लिए विशिष्ट है) सामान्य समीकरणों के एक सेट और मापदंडों के साथ रैखिक समीकरणों के एक सेट की ओर जाता है, जिसे पैरामीटर अनुमान प्राप्त करने के लिए हल किया जाता है।

यह मानते हुए कि जनसंख्या त्रुटि आमतौर पर प्रचारित होती है, शोधकर्ता मानक त्रुटियों के इन अनुमानों का उपयोग आत्मविश्वास अंतराल बनाने और इसके मापदंडों के बारे में परिकल्पनाओं का परीक्षण करने के लिए कर सकता है।

नॉनलाइनियर रिग्रेशन एनालिसिस

एक उदाहरण जहां फ़ंक्शन मापदंडों के संबंध में रैखिक नहीं है, यह दर्शाता है कि वर्गों के योग को एक पुनरावृत्त प्रक्रिया का उपयोग करके कम से कम किया जाना चाहिए। यह कई जटिलताओं का परिचय देता है जो रैखिक और गैर-रैखिक कम से कम वर्गों के बीच अंतर करते हैं। नतीजतन, गैर-रेखीय पद्धति का उपयोग करते समय प्रतिगमन विश्लेषण के परिणाम कभी-कभी अप्रत्याशित होते हैं।

शक्ति और नमूना आकार की गणना

प्रेक्षणों की संख्या बनाम मॉडल में व्याख्यात्मक चरों की संख्या के लिए आमतौर पर कोई सुसंगत विधि नहीं होती है। पहला नियम डोबरा और हार्डिन द्वारा प्रस्तावित किया गया था और एन = टी ^ एन जैसा दिखता है, जहां एन नमूना आकार है, एन स्वतंत्र चर की संख्या है, और टी वांछित सटीकता प्राप्त करने के लिए आवश्यक अवलोकनों की संख्या है यदि मॉडल था केवल एक स्वतंत्र चर। उदाहरण के लिए, एक शोधकर्ता एक डेटासेट का उपयोग करके एक रैखिक प्रतिगमन मॉडल बनाता है जिसमें 1000 रोगी (एन) होते हैं। यदि शोधकर्ता यह निर्णय लेता है कि सीधी रेखा (एम) को सटीक रूप से निर्धारित करने के लिए पांच अवलोकनों की आवश्यकता है, तो मॉडल का समर्थन करने वाले स्वतंत्र चर की अधिकतम संख्या 4 है।

अन्य तरीके

यद्यपि एक प्रतिगमन मॉडल के मापदंडों का अनुमान आमतौर पर कम से कम वर्ग विधि का उपयोग करके लगाया जाता है, लेकिन ऐसी अन्य विधियाँ हैं जिनका उपयोग बहुत कम बार किया जाता है। उदाहरण के लिए, ये निम्नलिखित विधियाँ हैं:

बायेसियन तरीके (उदाहरण के लिए, बायेसियन लीनियर रिग्रेशन मेथड)।

प्रतिशत प्रतिगमन, उन स्थितियों के लिए उपयोग किया जाता है जहां प्रतिशत त्रुटियों को कम करना अधिक उपयुक्त माना जाता है।

सबसे छोटा निरपेक्ष विचलन, जो बाहरी कारकों की उपस्थिति में अधिक मजबूत होता है जो मात्रात्मक प्रतिगमन की ओर ले जाता है।

गैर-पैरामीट्रिक प्रतिगमन के लिए बड़ी संख्या में टिप्पणियों और गणनाओं की आवश्यकता होती है।

दूरस्थ शिक्षा मीट्रिक जो किसी दिए गए इनपुट स्थान में एक सार्थक दूरी मीट्रिक की खोज में सीखी जाती है।

सॉफ्टवेयर

सभी प्रमुख सांख्यिकीय सॉफ्टवेयर पैकेज कम से कम वर्ग प्रतिगमन विश्लेषण का उपयोग करके किए जाते हैं। सरल रैखिक प्रतिगमन और एकाधिक प्रतिगमन विश्लेषण का उपयोग कुछ स्प्रेडशीट अनुप्रयोगों के साथ-साथ कुछ कैलकुलेटर में भी किया जा सकता है। हालांकि कई सांख्यिकीय सॉफ्टवेयर पैकेज विभिन्न प्रकार के गैर-पैरामीट्रिक और मजबूत प्रतिगमन का प्रदर्शन कर सकते हैं, ये विधियां कम मानकीकृत हैं; विभिन्न सॉफ्टवेयर पैकेज विभिन्न तरीकों को लागू करते हैं। सर्वेक्षण विश्लेषण और न्यूरोइमेजिंग जैसे क्षेत्रों में उपयोग के लिए विशिष्ट प्रतिगमन सॉफ्टवेयर विकसित किया गया है।

आधुनिक राजनीति विज्ञान समाज में सभी घटनाओं और प्रक्रियाओं के संबंध की स्थिति से आगे बढ़ता है। समाज के जीवन के राजनीतिक क्षेत्र में मौजूद संबंधों और निर्भरता का अध्ययन किए बिना घटनाओं और प्रक्रियाओं को समझना, भविष्यवाणी करना और राजनीतिक जीवन की घटनाओं का प्रबंधन करना असंभव है। नीति अनुसंधान के सबसे सामान्य उद्देश्यों में से एक कुछ अवलोकन योग्य चर के बीच संबंधों की जांच करना है। विश्लेषण के सांख्यिकीय तरीकों का एक पूरा वर्ग, सामान्य नाम "प्रतिगमन विश्लेषण" (या, जैसा कि इसे "सहसंबंध-प्रतिगमन विश्लेषण" भी कहा जाता है) से एकजुट होकर, इस समस्या को हल करने में मदद करता है। हालांकि, यदि सहसंबंध विश्लेषण किसी को दो चर के बीच संबंधों की ताकत का आकलन करने की अनुमति देता है, तो प्रतिगमन विश्लेषण का उपयोग करके इस संबंध के प्रकार को निर्धारित करना संभव है, किसी अन्य चर के मूल्य पर किसी भी चर के मूल्य की निर्भरता की भविष्यवाणी करना संभव है।

सबसे पहले, आइए याद करें कि सहसंबंध क्या है। सह - संबंधसांख्यिकीय कनेक्शन का सबसे महत्वपूर्ण विशेष मामला कहा जाता है, जिसमें यह तथ्य शामिल होता है कि एक चर के समान मान भिन्न के अनुरूप होते हैं औसत मूल्यएक और। विशेषता x के मान में परिवर्तन के साथ, विशेषता y का औसत मान नियमित रूप से बदलता है, जबकि प्रत्येक व्यक्तिगत मामले में विशेषता का मान पर(विभिन्न संभावनाओं के साथ) कई अलग-अलग मान ले सकते हैं।

शब्द "सहसंबंध" के आंकड़ों में उपस्थिति (और राजनीति विज्ञान में आंकड़ों की उपलब्धि शामिल है, इसलिए, राजनीति विज्ञान से संबंधित एक अनुशासन है), अंग्रेजी जीवविज्ञानी और सांख्यिकीविद् फ्रांसिस गैल्टन के नाम से जुड़ा हुआ है, जिन्होंने प्रस्तावित किया था 19वीं सदी। सहसंबंध और प्रतिगमन विश्लेषण की सैद्धांतिक नींव। "सहसंबंध" शब्द पहले विज्ञान में जाना जाता था। विशेष रूप से, जीवाश्म विज्ञान में 18 वीं शताब्दी की शुरुआत में। यह फ्रांसीसी वैज्ञानिक जॉर्जेस कुवियर द्वारा लागू किया गया था। उन्होंने सहसंबंध के तथाकथित कानून को पेश किया, जिसकी मदद से खुदाई के दौरान पाए गए जानवरों के अवशेषों से उनकी उपस्थिति को बहाल करना संभव था।

इस वैज्ञानिक के नाम और उसके सहसंबंध के नियम के साथ एक ज्ञात कहानी जुड़ी हुई है। इसलिए, विश्वविद्यालय की छुट्टी के दिनों में, एक प्रसिद्ध प्रोफेसर के साथ चाल चलने का फैसला करने वाले छात्रों ने एक छात्र पर सींग और खुरों के साथ एक बकरी की खाल खींची। वह कुवियर के बेडरूम की खिड़की से चढ़ गया और चिल्लाया: "मैं तुम्हें खाऊंगा।" प्रोफेसर जाग गया, सिल्हूट को देखा और उत्तर दिया: "यदि आपके सींग और खुर हैं, तो आप एक शाकाहारी हैं और आप मुझे नहीं खा सकते हैं। और सहसंबंध के नियम की अज्ञानता के लिए, आपको दो प्राप्त होंगे।" वह दूसरी तरफ पलटा और सो गया। यह एक मजाक है, लेकिन इस उदाहरण में हम एकाधिक सहसंबंध-प्रतिगमन विश्लेषण का उपयोग करने का एक विशेष मामला देखते हैं। यहाँ प्रोफेसर ने दो प्रेक्षित लक्षणों (सींगों और खुरों की उपस्थिति) के मूल्यों के ज्ञान से आगे बढ़ते हुए, सहसंबंध कानून के आधार पर, तीसरे गुण (जिस वर्ग से यह जानवर संबंधित है) का औसत मूल्य घटाया - शाकाहारी)। इस मामले में, हम इस चर के विशिष्ट मूल्य के बारे में बात नहीं कर रहे हैं (यानी, यह जानवर नाममात्र के पैमाने पर अलग-अलग मान ले सकता है - यह एक बकरी, एक मेढ़ा या एक बैल हो सकता है ...)

अब हम "प्रतिगमन" शब्द पर चलते हैं। कड़ाई से बोलते हुए, यह उन सांख्यिकीय समस्याओं के अर्थ से जुड़ा नहीं है जिन्हें इस पद्धति का उपयोग करके हल किया जाता है। सुविधाओं के बीच संबंधों का अध्ययन करने के तरीकों के विकास के इतिहास के ज्ञान के आधार पर ही शब्द की व्याख्या दी जा सकती है। इस तरह के शोध के पहले उदाहरणों में से एक सांख्यिकीविदों एफ। गैल्टन और के। पियर्सन का काम था, जिन्होंने दो प्रेक्षित विशेषताओं में पिता और उनके बच्चों के विकास के बीच एक पैटर्न खोजने की कोशिश की (जहां एक्स-पिता की वृद्धि और वाई-बच्चों की वृद्धि)। अपने शोध के दौरान, उन्होंने प्रारंभिक परिकल्पना की पुष्टि की कि औसतन, लंबे पिता के औसतन, लंबे बच्चे होते हैं। कम पिता और बच्चों पर भी यही सिद्धांत लागू होता है। हालांकि, अगर वैज्ञानिक इस पर रुक जाते, तो सांख्यिकी पर पाठ्यपुस्तकों में उनके काम का उल्लेख कभी नहीं होता। शोधकर्ताओं ने पहले से ही पुष्टि की गई परिकल्पना के भीतर एक और पैटर्न पाया। उन्होंने साबित किया कि बहुत लंबे पिता औसत लंबे बच्चों पर पैदा होते हैं, लेकिन उन बच्चों से ऊंचाई में बहुत अलग नहीं होते हैं, जिनके पिता औसत से ऊपर होते हुए भी औसत ऊंचाई से ज्यादा भिन्न नहीं होते हैं। बहुत छोटे कद वाले पिता (छोटे समूह के औसत संकेतकों से विचलित) के लिए भी यही सच है - उनके बच्चे, औसतन, अपने साथियों से ऊंचाई में भिन्न नहीं थे, जिनके पिता बस छोटे थे। उन्होंने इस पैटर्न का वर्णन करने वाले फ़ंक्शन को बुलाया प्रतिगमन समारोह।इस अध्ययन के बाद, समान कार्यों का वर्णन करने वाले और समान तरीके से निर्मित सभी समीकरणों को समाश्रयण समीकरण कहा जाता था।

प्रतिगमन विश्लेषण डेटा के बहुभिन्नरूपी सांख्यिकीय विश्लेषण के तरीकों में से एक है, जो एक आश्रित और कई (या एक) स्वतंत्र चर के बीच संबंधों का अध्ययन या मॉडल करने के लिए डिज़ाइन की गई सांख्यिकीय तकनीकों के एक सेट को जोड़ता है। आश्रित चर, आँकड़ों में स्वीकृत परंपरा के अनुसार, प्रतिक्रिया कहलाती है और इसे इस प्रकार दर्शाया जाता है वीस्वतंत्र चरों को भविष्यवक्ता कहा जाता है और इन्हें इस प्रकार दर्शाया जाता है एक्स।विश्लेषण के दौरान, कुछ चर प्रतिक्रिया से कमजोर रूप से संबंधित होंगे और अंततः विश्लेषण से बाहर कर दिए जाएंगे। आश्रित से जुड़े शेष चरों को भी कारक कहा जा सकता है।

प्रतिगमन विश्लेषण दूसरे चर (उदाहरण के लिए, शिक्षा के स्तर के आधार पर अपरंपरागत राजनीतिक व्यवहार के लिए प्रवृत्ति) या कई चर के आधार पर एक या अधिक चर के मूल्यों की भविष्यवाणी करना संभव बनाता है। इसकी गणना पीसी पर की जाती है। एक प्रतिगमन समीकरण तैयार करने के लिए जो आपको भाज्य पर नियंत्रित सुविधा की निर्भरता की डिग्री को मापने की अनुमति देता है, पेशेवर गणितज्ञ-प्रोग्रामर को शामिल करना आवश्यक है। एक राजनीतिक स्थिति के विकास के लिए भविष्य कहनेवाला मॉडल बनाने, सामाजिक तनाव के कारणों का आकलन करने और सैद्धांतिक प्रयोगों का संचालन करते समय प्रतिगमन विश्लेषण एक अमूल्य सेवा प्रदान कर सकता है। नागरिकों के चुनावी व्यवहार पर कई सामाजिक-जनसांख्यिकीय मापदंडों के प्रभाव का अध्ययन करने के लिए प्रतिगमन विश्लेषण का सक्रिय रूप से उपयोग किया जाता है: लिंग, आयु, पेशा, निवास स्थान, राष्ट्रीयता, स्तर और आय की प्रकृति।

प्रतिगमन विश्लेषण अवधारणाओं का उपयोग करता है स्वतंत्रतथा आश्रितचर। एक स्वतंत्र चर एक चर है जो दूसरे चर में परिवर्तन की व्याख्या या कारण बनता है। आश्रित चर एक ऐसा चर है जिसका मान पहले चर के प्रभाव से समझाया जाता है। उदाहरण के लिए, 2004 में राष्ट्रपति चुनावों में, निर्धारक कारक, अर्थात। स्वतंत्र चर ऐसे संकेतक थे जैसे देश की आबादी की भौतिक स्थिति का स्थिरीकरण, उम्मीदवारों की लोकप्रियता का स्तर और कारक सत्ताधारीइस मामले में आश्रित चर उम्मीदवारों के लिए डाले गए वोटों का प्रतिशत है। इसी तरह, "मतदाता आयु" और "चुनावी गतिविधि का स्तर" चर की जोड़ी में, पहला स्वतंत्र है, दूसरा निर्भर है।

प्रतिगमन विश्लेषण आपको निम्नलिखित कार्यों को हल करने की अनुमति देता है:

1) Ki . के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध की उपस्थिति या अनुपस्थिति के बहुत तथ्य को स्थापित करें एक्स;

2) प्रतिगमन समारोह का सबसे अच्छा (सांख्यिकीय अर्थों में) अनुमानों का निर्माण करें;

3) निर्धारित मूल्यों के अनुसार एक्सअज्ञात के लिए पूर्वानुमान बनाएं पास होना

4) प्रत्येक कारक के प्रभाव के विशिष्ट भार का अनुमान लगाएं एक्सपर पास होनाऔर, तदनुसार, मॉडल से महत्वहीन सुविधाओं को बाहर करें;

5) चर के बीच कारण संबंधों की पहचान करके, व्याख्यात्मक चर के मूल्यों को विनियमित करके आंशिक रूप से पी के मूल्यों को नियंत्रित करते हैं एक्स।

प्रतिगमन विश्लेषण पारस्परिक रूप से स्वतंत्र चर का चयन करने की आवश्यकता से जुड़ा हुआ है जो अध्ययन के तहत संकेतक के मूल्य को प्रभावित करते हैं, प्रतिगमन समीकरण के रूप का निर्धारण करते हैं, प्राथमिक सामाजिक डेटा को संसाधित करने के लिए सांख्यिकीय विधियों का उपयोग करके मापदंडों का अनुमान लगाते हैं। इस प्रकार का विश्लेषण संबंध के आकार, दिशा और जकड़न (घनत्व) के विचार पर आधारित है। अंतर करना भाप से भरा कमरातथा एकाधिक प्रतिगमनजांच की गई सुविधाओं की संख्या के आधार पर। व्यवहार में, प्रतिगमन विश्लेषण आमतौर पर सहसंबंध विश्लेषण के संयोजन में किया जाता है। प्रतिगमन समीकरणमात्राओं के बीच संख्यात्मक संबंध का वर्णन करता है, जिसे एक चर में वृद्धि या कमी के साथ दूसरे में वृद्धि या कमी की प्रवृत्ति के रूप में व्यक्त किया जाता है। साथ ही वे गुस्से में हैं। ठंढातथा अरेखीय प्रतिगमन।राजनीतिक प्रक्रियाओं का वर्णन करते समय, प्रतिगमन के दोनों रूप समान रूप से पाए जाते हैं।

राजनीतिक लेखों में परस्पर निर्भरता के वितरण के लिए तितर बितर साजिश ( वाई)और उत्तरदाताओं की शिक्षा (एक्स)एक रैखिक प्रतिगमन है (चित्र 30)।

चावल। तीस।

चुनावी गतिविधि के स्तर के वितरण के लिए तितर बितर साजिश ( वाई)और प्रतिवादी की उम्र (ए) (सशर्त उदाहरण) एक गैर-रेखीय प्रतिगमन (चित्र। 31) है।

चावल। 31.

युग्मित प्रतिगमन मॉडल में दो विशेषताओं (ए "और वाई) के संबंध का वर्णन करने के लिए, एक रैखिक समीकरण का उपयोग किया जाता है

जहाँ a, सुविधाओं की भिन्नता के साथ समीकरण की त्रुटि का एक यादृच्छिक मान है, अर्थात। "रैखिकता" से समीकरण का विचलन।

गुणांक का अनुमान लगाने के लिए एतथा बीकम से कम वर्ग विधि का उपयोग करें, जो मानता है कि प्रतिगमन रेखा से स्कैटर प्लॉट पर प्रत्येक बिंदु के विचलन के वर्गों का योग न्यूनतम होना चाहिए। अंतर ए एच बीसमीकरणों की प्रणाली का उपयोग करके गणना की जा सकती है:

कम से कम वर्ग अनुमान विधि गुणांकों के ऐसे अनुमान देती है एतथा बी,जिस पर सीधी रेखा निर्देशांक के साथ एक बिंदु से गुजरती है एन एसतथा वाई,वे। रिश्ता कायम है पर = कुल्हाड़ी + बी।प्रतीपगमन समीकरण का आलेखीय निरूपण कहलाता है सैद्धांतिक प्रतिगमन रेखा।एक रैखिक संबंध के साथ, प्रतिगमन गुणांक ग्राफ पर सैद्धांतिक प्रतिगमन रेखा के ढलान के स्पर्शरेखा को एब्सिस्सा अक्ष पर दर्शाता है। गुणांक पर चिन्ह लिंक की दिशा को दर्शाता है। यदि यह शून्य से अधिक है, तो कनेक्शन प्रत्यक्ष है, यदि यह कम है, तो यह उलटा है।

अध्ययन "पॉलिटिकल पीटर्सबर्ग-2006" (तालिका 56) से नीचे दिया गया उदाहरण नागरिकों की वर्तमान में उनके जीवन के साथ संतुष्टि की डिग्री और भविष्य में जीवन की गुणवत्ता में बदलाव की अपेक्षाओं के बीच एक रैखिक संबंध दिखाता है। संबंध प्रत्यक्ष, रैखिक है (मानकीकृत प्रतिगमन गुणांक 0.233 है, महत्व स्तर 0.000 है)। इस मामले में, प्रतिगमन गुणांक कम है, लेकिन यह सांख्यिकीय रूप से महत्वपूर्ण संकेतक (पियर्सन गुणांक के सांख्यिकीय रूप से महत्वपूर्ण संकेतक के वर्ग की निचली सीमा) की निचली सीमा से अधिक है।

तालिका 56

अपेक्षाओं पर वर्तमान में नागरिकों के जीवन की गुणवत्ता का प्रभाव

(सेंट पीटर्सबर्ग, 2006)

* आश्रित चर: "आपको क्या लगता है कि अगले 2-3 वर्षों में आपका जीवन कैसे बदलेगा?"

राजनीतिक जीवन में, अध्ययन किए गए चर का मूल्य अक्सर एक साथ कई विशेषताओं पर निर्भर करता है। उदाहरण के लिए, राजनीतिक गतिविधि का स्तर और प्रकृति एक साथ राज्य के राजनीतिक शासन, राजनीतिक परंपराओं, किसी दिए गए क्षेत्र में लोगों के राजनीतिक व्यवहार की ख़ासियत और प्रतिवादी के सामाजिक सूक्ष्म समूह, उसकी उम्र, शिक्षा, आय स्तर से प्रभावित होती है। राजनीतिक अभिविन्यास, आदि। इस मामले में, समीकरण का उपयोग करना आवश्यक है एकाधिक प्रतिगमनजो इस तरह दिखता है:

जहां गुणांक बी।आंशिक प्रतिगमन गुणांक है। यह स्वतंत्र (परिणामी) चर के मूल्यों के निर्धारण में प्रत्येक स्वतंत्र चर के योगदान को दर्शाता है। यदि आंशिक प्रतिगमन गुणांक 0 के करीब है, तो हम यह निष्कर्ष निकाल सकते हैं कि स्वतंत्र और आश्रित चर के बीच कोई सीधा संबंध नहीं है।

ऐसे मॉडल की गणना मैट्रिक्स बीजगणित का उपयोग करके पीसी पर की जा सकती है। एकाधिक प्रतिगमन आपको सामाजिक संबंधों की बहुक्रियात्मक प्रकृति को प्रतिबिंबित करने और परिणामी विशेषता पर व्यक्तिगत और सामूहिक रूप से प्रत्येक कारक के प्रभाव की डिग्री को स्पष्ट करने की अनुमति देता है।

गुणांक निरूपित बी,रैखिक प्रतिगमन का गुणांक कहा जाता है और कारक विशेषता की भिन्नता के बीच संबंध की ताकत को दर्शाता है एक्सऔर प्रभावी विशेषता की भिन्नता यूयह गुणांक विशेषताओं के मापन की निरपेक्ष इकाइयों में बांड की ताकत को मापता है। हालांकि, सुविधाओं के बीच सहसंबंध की जकड़न को प्रभावी विशेषता के मानक विचलन के अंशों में व्यक्त किया जा सकता है (ऐसे गुणांक को सहसंबंध गुणांक कहा जाता है)। प्रतिगमन गुणांक के विपरीत बीसहसंबंध गुणांक सुविधाओं के मापन की अपनाई गई इकाइयों पर निर्भर नहीं करता है, और इसलिए, यह किसी भी विशेषता के लिए तुलनीय है। आमतौर पर, कनेक्शन को मजबूत माना जाता है यदि /> 0.7, मध्यम जकड़न - 0.5 ग्राम 0.5 पर।

जैसा कि आप जानते हैं, निकटतम कनेक्शन एक कार्यात्मक कनेक्शन है, जब प्रत्येक व्यक्ति का अर्थ होता है यूस्पष्ट रूप से मूल्य को सौंपा जा सकता है एक्स।इस प्रकार, सहसंबंध गुणांक 1 के जितना करीब होता है, संबंध कार्यात्मक के उतना ही करीब होता है। प्रतिगमन विश्लेषण के लिए महत्व स्तर 0.001 से अधिक नहीं होना चाहिए।

सहसंबंध गुणांक को लंबे समय से सुविधाओं के संबंध की जकड़न का मुख्य संकेतक माना जाता है। हालांकि, बाद में, निर्धारण का गुणांक ऐसा संकेतक बन गया। इस गुणांक का अर्थ इस प्रकार है - यह परिणामी विशेषता के कुल विचरण के हिस्से को दर्शाता है पास होना, सुविधा के विचरण द्वारा समझाया गया एक्स।यह सहसंबंध गुणांक (0 से 1 तक भिन्न) के सरल वर्ग द्वारा पाया जाता है और बदले में, एक रैखिक संबंध के लिए, 0 (0%) से अनुपात को दर्शाता है। 1 (१००%) विशेषता मान वाई,विशेषता मूल्यों द्वारा परिभाषित एक्स।के रूप में लिखा गया है मैं २,और एसपीएसएस पैकेज में प्रतिगमन विश्लेषण के परिणामी तालिकाओं में - बिना वर्ग के।

आइए बहुल प्रतिगमन समीकरण के निर्माण की मुख्य समस्याओं को नामित करें।

1. प्रतिगमन समीकरण में शामिल कारकों का चयन।इस स्तर पर, शोधकर्ता पहले मुख्य कारणों की एक सामान्य सूची तैयार करता है, जो सिद्धांत के अनुसार अध्ययन के तहत घटना का निर्धारण करता है। फिर उसे प्रतिगमन समीकरण में विशेषताओं का चयन करना होगा। चयन का मूल नियम: विश्लेषण में शामिल कारकों को एक दूसरे के साथ जितना संभव हो उतना कम सहसंबद्ध होना चाहिए; केवल इस मामले में एक निश्चित कारक-विशेषता के प्रभाव का मात्रात्मक माप निर्दिष्ट करना संभव है।

2. एकाधिक प्रतिगमन समीकरण के रूप का चयन(व्यवहार में, वे अक्सर रैखिक या रैखिक-लघुगणक का उपयोग करते हैं)। इसलिए, एकाधिक प्रतिगमन का उपयोग करने के लिए, शोधकर्ता को पहले परिणामी पर कई स्वतंत्र चर के प्रभाव का एक काल्पनिक मॉडल बनाना चाहिए। प्राप्त परिणामों के विश्वसनीय होने के लिए, यह आवश्यक है कि मॉडल वास्तविक प्रक्रिया से बिल्कुल मेल खाता हो, अर्थात। चरों के बीच संबंध रैखिक होना चाहिए, किसी भी महत्वपूर्ण स्वतंत्र चर को नजरअंदाज नहीं किया जा सकता है, और कोई भी चर जो अध्ययन के तहत प्रक्रिया से सीधे संबंधित नहीं है, उसे विश्लेषण में शामिल नहीं किया जा सकता है। इसके अलावा, चर के सभी माप अत्यंत सटीक होने चाहिए।

उपरोक्त विवरण इस पद्धति के आवेदन के लिए कई शर्तों का तात्पर्य है, जिसके बिना एकाधिक प्रतिगमन विश्लेषण (एमपीए) की प्रक्रिया के साथ आगे बढ़ना असंभव है। केवल नीचे सूचीबद्ध सभी बिंदुओं का पालन प्रतिगमन विश्लेषण को सही ढंग से करना संभव बनाता है।

संबंधित सामग्री:

आत्मविश्वास कैसे प्राप्त करें, शांति प्राप्त करें और आत्म-सम्मान बढ़ाएं: आत्मविश्वास प्राप्त करने के मुख्य रहस्यों की खोज

सामान्य भाषण अविकसित बच्चों की मनोवैज्ञानिक विशेषताएं: संज्ञानात्मक गतिविधि की विशेषताएं onr . वाले बच्चों की मानसिक विशेषताएं

काम पर बर्नआउट क्या है और इससे कैसे निपटें काम पर बर्नआउट से कैसे निपटें

इमोशनल बर्नआउट से निपटने के लिए इमोशनल बर्नआउट के तरीकों से कैसे निपटें

इमोशनल बर्नआउट से निपटने के लिए इमोशनल बर्नआउट के तरीकों से कैसे निपटें

बर्नआउट - काम के तनाव से कैसे निपटें भावनात्मक बर्नआउट से कैसे निपटें

पूर्वस्कूली बच्चों में भाषण के विकास के लिए कार्यप्रणाली

कलरव

लाइव जर्नल

फेसबुक

ट्विटर

साप्ताहिक न्यूज़लेटर aurumrp.ru . की सदस्यता लें

लोकप्रिय

पूर्वस्कूली बच्चों में भाषण के विकास के लिए कार्यप्रणाली

अतिसक्रिय बच्चों की विशेषताएं और उनकी परवरिश

घर की हवा को कैसे साफ करें?

भुगतान और वितरण के तरीके

ताप स्थापना पाठ्यक्रम

लोकप्रिय

2021-10-12 10:15:12 क्या मैं डॉक्टर को देखने से मना कर सकता हूँ?

2021-10-08 09:37:49 वर्ष की आपात स्थिति मंत्रालय के बचाव कार्यों में यूएवी का उपयोग

2021-10-08 09:37:49 रूसी नौसेना की स्थापना का दिन - नाविक-सतह नाविक का दिन रूसी नौसेना का संक्षिप्त इतिहास

2021-10-08 09:37:49 जलन कहाँ से आती है?

2021-10-08 09:37:49 शील : इसके पक्ष और विपक्ष, शील से कैसे छुटकारा पाएं उसकी चुप्पी का मतलब आपके खिलाफ नाराजगी नहीं है

अभी पढ़ें

परास्नातक कक्षा
बोरोडिनो लड़ाई का दिन

भाषण चिकित्सा कक्षाओं का सारांश
बोरोडिनो लड़ाई का दिन

भाषण चिकित्सक
खनिजों के बुनियादी भौतिक गुण

नवीनतम सामग्री

योजना
मोनोसेकेराइड: राइबोज, डीऑक्सीराइबोज, ग्लूकोज, फ्रुक्टोज

राइनोलिया
पुरुषों में अनुचित आक्रामकता: कारण और उपचार के तरीके

भाषण चिकित्सक
प्रोटीन पदार्थों का जमाव

भाषण विकास
सेरीन। दैनिक दर। आर्जिनिन की कमी। मानव शरीर में सेरीन, दवा और खेल में उपयोग सेरीन क्या है

दस्तावेज़
मानव शरीर के माध्यम से विद्युत प्रवाह के मार्ग

योजना
भावनात्मक रिलीज तकनीक

माँ बाप के लिए
तात्कालिक साधनों के साथ मनोवैज्ञानिक विश्राम

साइट का नक्शा

योजना क्रियाविधि कक्षाओं के लिए सामग्री डिसरथ्रिया परास्नातक कक्षा माँ बाप के लिए भाषण चिकित्सक शुरुआती अनुभव विनिमय डिसग्राफिया भाषण विकास राइनोलिया दस्तावेज़

№	एन एस	पर	हू	एक्स 2	वाई एक्स		(वाई-वाई-एक्स) 2
					55,89	47,54	65,70
					45,07	15,42	222,83
					54,85	34,19	8,11
					51,36	5,55	11,27
					42,28	45,16	13,84
					47,69	1,71	44,77
					45,86	9,87	192,05
योग						159,45	558,55
औसत				77519,6		22,78	79,79	2990,6