एक्सेल कम से कम वर्ग विधि में फ़ंक्शन सन्निकटन। एक्सेल में कम से कम वर्ग विधि लागू करना

इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन के अन्य सरल लोगों द्वारा अनुमानित प्रतिनिधित्व की अनुमति देता है। OLS अवलोकनों को संसाधित करने में अत्यंत उपयोगी हो सकता है, और यह सक्रिय रूप से कुछ मात्राओं का अनुमान दूसरों के माप के परिणामों से अनुमान लगाने के लिए उपयोग किया जाता है जिनमें यादृच्छिक त्रुटियां होती हैं। यह आलेख आपको दिखाएगा कि एक्सेल में कम से कम वर्ग गणना कैसे कार्यान्वित करें।

एक विशिष्ट उदाहरण का उपयोग करके समस्या का विवरण

मान लीजिए कि दो संकेतक एक्स और वाई हैं। और वाई एक्स पर निर्भर करता है। चूंकि ओएलएस प्रतिगमन विश्लेषण के दृष्टिकोण से हमारे लिए रूचि रखता है (एक्सेल में, इसके तरीकों को अंतर्निहित कार्यों का उपयोग करके लागू किया जाता है), तो आपको तुरंत जाना चाहिए एक विशिष्ट समस्या पर विचार करने के लिए।

तो, एक्स को एक किराने की दुकान का खुदरा स्थान होने दें, जिसे वर्ग मीटर में मापा जाता है, और वाई - वार्षिक कारोबार, लाखों रूबल में मापा जाता है।

यह अनुमान लगाना आवश्यक है कि यदि किसी विशेष खुदरा स्थान के पास स्टोर का टर्नओवर (Y) क्या होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टॉल से अधिक माल बेचता है।

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लें कि हमारे पास n स्टोर्स के लिए डेटा से निर्मित एक टेबल है।

गणितीय आँकड़ों के अनुसार, कम से कम 5-6 वस्तुओं के डेटा की जांच करने पर परिणाम कमोबेश सही होंगे। इसके अलावा, आप "असामान्य" परिणामों का उपयोग नहीं कर सकते। विशेष रूप से, एक कुलीन छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े रिटेल आउटलेट्स के टर्नओवर से कई गुना अधिक हो सकता है।

विधि सार

तालिका डेटा को कार्तीय तल पर बिंदुओं M 1 (x 1, y 1),… M n (x n, y n) के रूप में प्रदर्शित किया जा सकता है। अब समस्या का समाधान एक अनुमानित फ़ंक्शन y = f (x) के चयन के लिए कम हो जाएगा, जिसमें एक ग्राफ जितना संभव हो सके बिंदुओं M 1, M 2, .. M n के करीब से गुजर रहा हो।

बेशक, आप एक उच्च डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि यह भी गलत है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसका पता लगाने की आवश्यकता है। सबसे उचित समाधान सीधी रेखा y = ax + b को खोजना है, जो प्रयोगात्मक डेटा का सबसे अच्छा अनुमान लगाता है, या इसके बजाय, गुणांक - ए और बी।

शुद्धता मूल्यांकन

किसी भी सन्निकटन के लिए, उसकी सटीकता का आकलन विशेष महत्व रखता है। आइए हम बिंदु x i के लिए कार्यात्मक और प्रायोगिक मूल्यों के बीच अंतर (विचलन) को e i द्वारा निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, सन्निकटन की सटीकता का अनुमान लगाने के लिए, विचलन के योग का उपयोग किया जा सकता है, अर्थात, Y पर X की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा का चयन करते समय, किसी को सबसे छोटे मान वाले को वरीयता देनी चाहिए सभी बिंदुओं पर विचाराधीन योग। हालांकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ, नकारात्मक विचलन व्यावहारिक रूप से मौजूद होंगे।

विचलन या उनके वर्गों के मापांक का उपयोग करके समस्या को हल किया जा सकता है। अंतिम विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण (एक्सेल दो अंतर्निहित कार्यों को लागू करता है) शामिल है, और लंबे समय से इसके लायक साबित हुआ है।

कम से कम वर्ग विधि

एक्सेल में, जैसा कि आप जानते हैं, एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित श्रेणी में स्थित सभी मानों के मूल्यों की गणना करने की अनुमति देता है। इस प्रकार, हमें व्यंजक के मान की गणना करने से कोई नहीं रोकता है (e 1 2 + e 2 2 + e 3 2 + ... e n 2)।

गणितीय संकेतन में, ऐसा लगता है:

चूंकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित करने के लिए किया गया था, हमारे पास है:

इस प्रकार, एक्स और वाई की मात्राओं की विशिष्ट निर्भरता का सबसे अच्छा वर्णन करने वाली सीधी रेखा को खोजने की समस्या को दो चर के न्यूनतम फ़ंक्शन की गणना करने के लिए कम किया जाता है:

इसके लिए नए चर ए और बी के संबंध में आंशिक डेरिवेटिव को शून्य करने की आवश्यकता है, और एक आदिम प्रणाली को हल करना जिसमें दो अज्ञात फॉर्म के साथ दो समीकरण शामिल हैं:

कुछ सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेर-फेर करना शामिल है, हम प्राप्त करते हैं:

इसे हल करना, उदाहरण के लिए, क्रैमर की विधि द्वारा, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, अर्थात, यह अनुमान लगाने के लिए कि किसी निश्चित क्षेत्र के लिए स्टोर का टर्नओवर क्या होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन इससे आपको यह अंदाजा लगाने में मदद मिलेगी कि क्या किसी विशेष क्षेत्र के स्टोर के लिए क्रेडिट पर खरीदारी का भुगतान होगा।

एक्सेल में कम से कम वर्ग विधि कैसे लागू करें

एक्सेल में ओएलएस मान की गणना के लिए एक फ़ंक्शन है। इसका निम्न रूप है: "TREND" (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिरांक।)। आइए एक्सेल में ओएलएस की गणना के लिए सूत्र को हमारी तालिका में लागू करें।

ऐसा करने के लिए, उस सेल में जिसमें एक्सेल में कम से कम वर्ग विधि द्वारा गणना का परिणाम प्रदर्शित किया जाना चाहिए, "=" चिह्न दर्ज करें और "ट्रेंड" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

  • वाई के लिए ज्ञात मूल्यों की सीमा (इस मामले में, टर्नओवर के लिए डेटा);
  • रेंज x 1,… x n, यानी रिटेल स्पेस का आकार;
  • x के ज्ञात और अज्ञात दोनों मान, जिसके लिए आपको टर्नओवर के आकार का पता लगाना होगा (वर्कशीट पर उनके स्थान की जानकारी के लिए नीचे देखें)।

इसके अलावा, सूत्र में बूलियन चर "कॉन्स्ट" होता है। यदि आप संबंधित क्षेत्र में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि गणना की जानी चाहिए, यह मानते हुए कि बी = 0।

यदि आपको x के एक से अधिक मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद, आपको "एंटर" नहीं दबाना चाहिए, लेकिन आपको कीबोर्ड पर "Shift" + "Control" + "Enter" संयोजन टाइप करना होगा। ("दर्ज")।

कुछ सुविधाएं

प्रतिगमन विश्लेषण डमी के लिए भी उपलब्ध हो सकता है। अज्ञात चरों की एक सरणी के मूल्य की भविष्यवाणी करने के लिए एक्सेल फॉर्मूला - "ट्रेंड" - का उपयोग उन लोगों द्वारा भी किया जा सकता है जिन्होंने कम से कम वर्गों की विधि के बारे में कभी नहीं सुना है। उसके काम की कुछ विशेषताओं को जानने के लिए बस इतना ही काफी है। विशेष रूप से:

  • यदि आप y चर के ज्ञात मानों की श्रेणी को एक पंक्ति या स्तंभ में व्यवस्थित करते हैं, तो ज्ञात x मानों वाली प्रत्येक पंक्ति (स्तंभ) को प्रोग्राम द्वारा एक अलग चर के रूप में माना जाएगा।
  • यदि "ट्रेंड" विंडो में ज्ञात x के साथ एक श्रेणी नहीं है, तो यदि फ़ंक्शन का उपयोग एक्सेल में किया जाता है, तो प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या दिए गए मानों के साथ सीमा से मेल खाती है। वाई चर के।
  • आउटपुट के रूप में "अनुमानित" मानों की एक सरणी प्राप्त करने के लिए, प्रवृत्ति अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
  • यदि नए x मान निर्दिष्ट नहीं हैं, तो TREND फ़ंक्शन उन्हें ज्ञात के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से दिए गए पैरामीटर y के साथ सीमा के अनुरूप है।
  • नए x-मानों वाली श्रेणी में दिए गए y-मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के अनुरूप होना चाहिए।
  • ज्ञात x मानों वाली एक सरणी में कई चर हो सकते हैं। हालांकि, अगर हम केवल एक के बारे में बात कर रहे हैं, तो यह आवश्यक है कि x और y के दिए गए मानों वाली श्रेणियां अनुरूप हों। एकाधिक चर के मामले में, आप चाहते हैं कि दिए गए y मानों वाली श्रेणी एक कॉलम या एक पंक्ति में फ़िट हो।

पूर्वानुमान समारोह

इसे कई कार्यों के साथ कार्यान्वित किया जाता है। उनमें से एक को "पूर्वानुमान" कहा जाता है। यह "TREND" के समान है, अर्थात यह कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y मान अज्ञात है।

अब आप एक्सेल में डमी के लिए सूत्रों को जानते हैं जो आपको एक रैखिक प्रवृत्ति के अनुसार किसी दिए गए संकेतक के भविष्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।

खैर, काम पर उन्होंने निरीक्षण की सूचना दी, लेख सम्मेलन के लिए घर पर लिखा गया था - अब आप ब्लॉग पर लिख सकते हैं। जब मैं अपना डेटा संसाधित कर रहा था, मुझे एहसास हुआ कि मैं मदद नहीं कर सकता लेकिन एक्सेल में एक बहुत ही शांत और आवश्यक ऐड-इन के बारे में लिख सकता हूं, जिसे कहा जाता है। तो लेख इस विशेष ऐड-इन के लिए समर्पित होगा, और मैं आपको इसके बारे में उपयोग के एक उदाहरण का उपयोग करके बताऊंगा कम से कम वर्ग विधि(OLS) प्रयोगात्मक डेटा का वर्णन करते समय अज्ञात समीकरण गुणांक खोजने के लिए।

फाइंड सॉल्यूशन ऐड-इन कैसे इनेबल करें

सबसे पहले, आइए जानें कि इस ऐड-इन को कैसे सक्षम किया जाए।

1. "फ़ाइल" मेनू पर जाएं और "एक्सेल विकल्प" चुनें

2. दिखाई देने वाली विंडो में, "समाधान खोजें" चुनें और "जाओ" पर क्लिक करें।

3. अगली विंडो में, "समाधान की खोज करें" आइटम के सामने एक टिक लगाएं और "ओके" पर क्लिक करें।

4. ऐड-ऑन सक्रिय है - अब इसे "डेटा" मेनू आइटम में पाया जा सकता है।

कम से कम वर्ग विधि

अब संक्षेप में कम से कम वर्ग विधि (OLS) और जहां इसे लागू किया जा सकता है।

मान लें कि हमारे पास कुछ प्रयोग करने के बाद एक डेटासेट है जहां हमने Y मान पर X मान के प्रभाव का अध्ययन किया है।

हम इस प्रभाव का गणितीय रूप से वर्णन करना चाहते हैं, ताकि बाद में हम इस सूत्र का उपयोग कर सकें और जान सकें कि यदि हम X के मान को इतना बदल दें, तो हमें Y का मान मिलता है।

मैं एक सुपर-सरल उदाहरण लूंगा (अंजीर देखें।)

यह स्पष्ट है कि बिंदु एक के बाद एक स्थित हैं जैसे कि एक सीधी रेखा में, और इसलिए हम सुरक्षित रूप से मान लेते हैं कि हमारी निर्भरता एक रैखिक फ़ंक्शन y = kx + b द्वारा वर्णित है। साथ ही, हम निश्चित रूप से सुनिश्चित हैं कि जब एक्स शून्य के बराबर होता है, तो वाई का मान भी शून्य के बराबर होता है। इसका मतलब है कि निर्भरता का वर्णन करने वाला कार्य और भी सरल होगा: y = kx (स्कूल पाठ्यक्रम याद रखें)।

सामान्य तौर पर, हमें गुणांक k ज्ञात करना होता है। यही हम साथ करेंगे ओएलएस "समाधान की खोज" ऐड-इन का उपयोग करना।

विधि इस तथ्य में निहित है कि (यहां - ध्यान: आपको इसके बारे में सोचने की ज़रूरत है) प्रयोगात्मक रूप से प्राप्त और संबंधित गणना मूल्यों के बीच अंतर के वर्गों का योग न्यूनतम था। अर्थात्, जब X1 = 1 वास्तव में मापा गया मान Y1 = 4.6, और परिकलित y1 = f (x1) 4 है, तो अंतर का वर्ग होगा (y1-Y1) ^ 2 = (4-4.6) ^ 2 = 0.36 ... निम्नलिखित के साथ: जब X2 = 2, वास्तव में मापा गया मान Y2 = 8.1, और परिकलित y2 8 है, तो अंतर का वर्ग होगा (y2-Y2) ^ 2 = (8-8.1) ^ 2 = 0.01 . और इन सभी वर्गों का योग यथासंभव छोटा होना चाहिए।

तो, आइए ओएलएस के उपयोग पर प्रशिक्षण शुरू करें और समाधान खोजें एक्सेल ऐड-इन्स .

समाधान खोज ऐड-इन लागू करना

1. यदि आपने "समाधान की खोज" ऐड-ऑन चालू नहीं किया है, तो बिंदु पर वापस जाएं समाधान ऐड-इन के लिए खोज को कैसे सक्षम करें और सक्षम करें 🙂

2. सेल A1 में, "1" मान दर्ज करें। यह इकाई हमारी कार्यात्मक निर्भरता y = kx के गुणांक (k) के वास्तविक मान का पहला सन्निकटन होगी।

3. कॉलम बी में, हमारे पास एक्स पैरामीटर के मान हैं, कॉलम सी में - वाई पैरामीटर के मान। डी कॉलम की कोशिकाओं में, हम सूत्र दर्ज करते हैं: "गुणांक के मूल्य से गुणा किया जाता है एक्स" का। उदाहरण के लिए, सेल D1 में हम "= A1 * B1" दर्ज करते हैं, सेल D2 में हम "= A1 * B2" दर्ज करते हैं, और इसी तरह।

4. हम मानते हैं कि गुणांक k एक के बराबर है और फलन f (x) = y = 1 * x हमारे समाधान का पहला सन्निकटन है। हम Y के मापा मूल्यों और सूत्र y = 1 * x द्वारा गणना किए गए अंतरों के वर्गों के योग की गणना कर सकते हैं। हम यह सब मैन्युअल रूप से सूत्र में उपयुक्त सेल संदर्भ चलाकर कर सकते हैं: "= (D2-C2) ^ 2 + (D3-C3) ^ 2 + (D4-C4) ^ 2 ... आदि। अंत में हम गलत हैं और समझें कि हमने बहुत समय खो दिया है। एक्सेल में, अंतर के वर्गों के योग की गणना के लिए, एक विशेष सूत्र है, "SUMKVRAZN", जो हमारे लिए सब कुछ करेगा। इसे सेल A2 में दर्ज करें और प्रारंभिक डेटा सेट करें : मापा मूल्यों की सीमा वाई (स्तंभ सी) और परिकलित वाई मूल्यों की सीमा (स्तंभ डी)।

4. वर्गों के अंतर के योग की गणना की गई है - अब हम "डेटा" टैब पर जाते हैं और "समाधान के लिए खोजें" का चयन करते हैं।

5. दिखाई देने वाले मेनू में, सेल A1 (गुणांक k वाला एक) को सेल के रूप में परिवर्तित करने के लिए चुनें।

6. लक्ष्य के रूप में सेल A2 का चयन करें और "न्यूनतम मान के बराबर सेट करें" शर्त सेट करें। याद रखें कि यह वह सेल है जहां हम गणना और मापा मूल्यों के बीच अंतर के वर्गों के योग की गणना करते हैं, और यह योग न्यूनतम होना चाहिए। "निष्पादित करें" पर क्लिक करें।

7. गुणांक k का चयन किया जाता है। अब आप सत्यापित कर सकते हैं कि परिकलित मान अब मापे गए मान के बहुत करीब हैं।

पी.एस.

सामान्य तौर पर, निश्चित रूप से, एक्सेल में प्रयोगात्मक डेटा का अनुमान लगाने के लिए, विशेष उपकरण हैं जो आपको रैखिक, घातीय, शक्ति और बहुपद फ़ंक्शन का उपयोग करके डेटा का वर्णन करने की अनुमति देते हैं, इसलिए आप अक्सर n के बिना कर सकते हैं समाधान खोज ऐड-ऑन... मैंने अपनी खदान में इन सभी सन्निकटन विधियों के बारे में बात की है, इसलिए यदि आप रुचि रखते हैं, तो एक नज़र डालें। लेकिन जब बात किसी अनोखे फंक्शन की आती है एक अज्ञात गुणांक के साथया अनुकूलन समस्याएं, यहाँ सुपरस्ट्रक्चरबहुत अवसर से।

समाधान खोजें ऐड-इनअन्य कार्यों के लिए इस्तेमाल किया जा सकता है, मुख्य बात सार को समझना है: एक सेल है जहां हम एक मूल्य का चयन करते हैं, और एक लक्ष्य सेल है जिसमें एक अज्ञात पैरामीटर का चयन करने के लिए एक शर्त निर्धारित की जाती है।
बस इतना ही! अगले लेख में मैं आपको छुट्टी के बारे में एक परी कथा बताऊंगा, ताकि लेख को याद न करने के लिए,

कम से कम वर्ग विधिप्रतिगमन समीकरण के मापदंडों का अनुमान लगाने के लिए प्रयोग किया जाता है।

सुविधाओं के बीच स्टोकेस्टिक संबंधों का अध्ययन करने के तरीकों में से एक प्रतिगमन विश्लेषण है।
प्रतिगमन विश्लेषण प्रतिगमन समीकरण की व्युत्पत्ति है, जिसकी सहायता से एक यादृच्छिक चर (सुविधा-परिणाम) का औसत मूल्य पाया जाता है, यदि दूसरे (या अन्य) चर (फीचर-कारक) का मान ज्ञात हो। इसमें निम्नलिखित चरण शामिल हैं:

  1. संचार के रूप का चुनाव (विश्लेषणात्मक प्रतिगमन समीकरण का प्रकार);
  2. समीकरण के मापदंडों का अनुमान;
  3. विश्लेषणात्मक प्रतिगमन समीकरण की गुणवत्ता का आकलन।
अक्सर, सुविधाओं के सांख्यिकीय संबंध का वर्णन करने के लिए एक रैखिक रूप का उपयोग किया जाता है। रैखिक संबंध पर ध्यान इसके मापदंडों की स्पष्ट आर्थिक व्याख्या, चर की सीमित भिन्नता और इस तथ्य से समझाया गया है कि ज्यादातर मामलों में गणना करने के लिए संचार के गैर-रेखीय रूपों को एक रैखिक रूप में परिवर्तित किया जाता है (लघुगणक या चर के परिवर्तन द्वारा)।
एक रैखिक जोड़ीदार संबंध के मामले में, प्रतिगमन समीकरण रूप लेगा: y i = a + b x i + u i। इस समीकरण a और b के प्राचलों का अनुमान सांख्यिकीय प्रेक्षण x और y के आंकड़ों से लगाया जाता है। इस तरह के मूल्यांकन का परिणाम समीकरण है: जहां, पैरामीटर ए और बी के अनुमान हैं, प्रतिगमन समीकरण (गणना मूल्य) द्वारा प्राप्त प्रभावी विशेषता (चर) का मूल्य है।

मापदंडों का अनुमान लगाने के लिए सबसे अधिक उपयोग किया जाता है कम से कम वर्ग विधि (OLS)।
कम से कम वर्ग विधि प्रतिगमन समीकरण के मापदंडों का सर्वोत्तम (सुसंगत, कुशल और निष्पक्ष) अनुमान देती है। लेकिन केवल तभी जब यादृच्छिक पद (यू) और स्वतंत्र चर (एक्स) के संबंध में कुछ पूर्वापेक्षाएँ पूरी होती हैं (देखें ओएलएस पूर्वापेक्षाएँ)।

न्यूनतम वर्ग विधि द्वारा एक रैखिक युग्मित समीकरण के प्राचलों का आकलन करने की समस्यानिम्नलिखित में शामिल हैं: ऐसे पैरामीटर अनुमान प्राप्त करने के लिए, जिस पर प्रभावी संकेतक के वास्तविक मूल्यों के विचलन के वर्गों का योग - y मैं परिकलित मूल्यों से - न्यूनतम है।
औपचारिक रूप से ओएलएस मानदंडइस तरह लिखा जा सकता है: .

कम से कम वर्ग वर्गीकरण

  1. कम से कम वर्ग विधि।
  2. अधिकतम संभावना विधि (सामान्य शास्त्रीय रैखिक प्रतिगमन मॉडल के लिए, प्रतिगमन अवशिष्टों की सामान्यता पोस्ट की गई है)।
  3. सामान्यीकृत कम से कम वर्ग ओएलएस पद्धति का उपयोग त्रुटियों के स्वत: सहसंबंध के मामले में और विषमलैंगिकता के मामले में किया जाता है।
  4. भारित कम से कम वर्ग विधि (विषमयुग्मजी अवशेषों के साथ ओएलएस का एक विशेष मामला)।

आइए सार का वर्णन करें शास्त्रीय कम से कम वर्ग विधि ग्राफिक रूप से... ऐसा करने के लिए, हम एक आयताकार समन्वय प्रणाली में अवलोकन डेटा (x i, y i, i = 1; n) के अनुसार एक डॉट प्लॉट का निर्माण करेंगे (ऐसे डॉट प्लॉट को सहसंबंध क्षेत्र कहा जाता है)। आइए एक ऐसी सीधी रेखा खोजने का प्रयास करें जो सहसंबंध क्षेत्र के बिंदुओं के सबसे निकट हो। कम से कम वर्गों की विधि के अनुसार, रेखा को चुना जाता है ताकि सहसंबंध क्षेत्र के बिंदुओं और इस रेखा के बीच लंबवत दूरी के वर्गों का योग न्यूनतम हो।

इस समस्या का गणितीय रिकॉर्ड: .
हम y i और x i = 1 ... n के मान जानते हैं, ये अवलोकन संबंधी आंकड़े हैं। एस फ़ंक्शन में, वे स्थिरांक हैं। इस फ़ंक्शन में चर आवश्यक पैरामीटर अनुमान हैं -,। 2 चरों के एक फलन का न्यूनतम ज्ञात करने के लिए, प्रत्येक प्राचल के संबंध में इस फलन के आंशिक अवकलजों की गणना करना और उन्हें शून्य के बराबर करना आवश्यक है, अर्थात्। .
नतीजतन, हमें 2 सामान्य रैखिक समीकरणों की एक प्रणाली मिलती है:
इस प्रणाली को हल करते हुए, हमें आवश्यक पैरामीटर अनुमान मिलते हैं:

प्रतिगमन समीकरण के मापदंडों की गणना की शुद्धता की जाँच राशियों की तुलना करके की जा सकती है (गणना की गोलाई के कारण कुछ विसंगति हो सकती है)।
पैरामीटर अनुमानों की गणना करने के लिए, आप तालिका 1 बना सकते हैं।
प्रतिगमन गुणांक b का संकेत संबंध की दिशा को इंगित करता है (यदि b> 0, संबंध प्रत्यक्ष है, यदि b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
औपचारिक रूप से, पैरामीटर a का मान y का औसत मान x पर शून्य के बराबर होता है। यदि विशेषता कारक का शून्य मान नहीं है और नहीं हो सकता है, तो पैरामीटर की उपरोक्त व्याख्या का कोई मतलब नहीं है।

संकेतों के बीच संबंधों की जकड़न का आकलन रैखिक जोड़ी सहसंबंध के गुणांक का उपयोग करके किया जाता है - r x, y। इसकी गणना सूत्र का उपयोग करके की जा सकती है: ... इसके अलावा, रैखिक जोड़ीदार सहसंबंध गुणांक को प्रतिगमन गुणांक b के माध्यम से निर्धारित किया जा सकता है: .
रैखिक जोड़ी सहसंबंध गुणांक के स्वीकार्य मूल्यों की सीमा -1 से +1 तक है। सहसंबंध गुणांक का चिह्न लिंक की दिशा को इंगित करता है। यदि r x, y> 0, तो कनेक्शन प्रत्यक्ष है; अगर आर एक्स, वाई<0, то связь обратная.
यदि यह गुणांक निरपेक्ष मान में एक के करीब है, तो सुविधाओं के बीच संबंध को एक करीबी रैखिक के रूप में व्याख्या किया जा सकता है। यदि इसका मापांक एक r x, y = 1 के बराबर है, तो सुविधाओं के बीच संबंध कार्यात्मक रैखिक है। यदि गुण x और y रैखिक रूप से स्वतंत्र हैं, तो r x, y 0 के करीब है।
r x, y की गणना करने के लिए, आप तालिका 1 का भी उपयोग कर सकते हैं।

प्राप्त प्रतिगमन समीकरण की गुणवत्ता का आकलन करने के लिए, निर्धारण के सैद्धांतिक गुणांक की गणना की जाती है - R 2 yx:

,
जहाँ d 2 प्रसरण y है जिसे समाश्रयण समीकरण द्वारा समझाया गया है;
ई 2 - अवशिष्ट (प्रतिगमन समीकरण द्वारा समझाया नहीं गया) विचरण y;
s 2 y, y का कुल (कुल) प्रसरण है।
निर्धारण का गुणांक कुल भिन्नता (भिन्नता) y में प्रतिगमन (और, परिणामस्वरूप, कारक x) द्वारा समझाया गया प्रभावी गुण y की भिन्नता (भिन्नता) के अनुपात को दर्शाता है। निर्धारण गुणांक R 2 yx 0 से 1 तक मान लेता है। तदनुसार, मान 1-R 2 yx मॉडल और विनिर्देश त्रुटियों में अन्य कारकों के प्रभाव के कारण विचरण y के अनुपात को दर्शाता है।
युग्मित रैखिक प्रतिगमन के साथ R 2 yx = r 2 yx।

कम से कम वर्ग विधि (OLS)

n अज्ञात के साथ m रैखिक समीकरणों की प्रणाली का रूप है:

तीन मामले संभव हैं: एम एन। मामला जब m = n को पिछले अनुभागों में माना गया था। प्रपत्र

अगर m> n और सिस्टम सुसंगत है, तो मैट्रिक्स A में कम से कम m - n रैखिक रूप से निर्भर पंक्तियाँ हैं। यहां किसी भी n रैखिक रूप से स्वतंत्र समीकरण (यदि वे मौजूद हैं) का चयन करके और सूत्र X = A -1 CHV को लागू करके, यानी पहले हल की गई समस्या को कम करके समाधान प्राप्त किया जा सकता है। इस स्थिति में, प्राप्त हल शेष m - n समीकरणों को हमेशा संतुष्ट करेगा।

हालांकि, कंप्यूटर का उपयोग करते समय, अधिक सामान्य दृष्टिकोण का उपयोग करना अधिक सुविधाजनक होता है - कम से कम वर्गों की विधि।

बीजीय न्यूनतम वर्ग

बीजीय कम से कम वर्ग विधि को रैखिक समीकरणों के सिस्टम को हल करने की विधि के रूप में समझा जाता है

यूक्लिडियन मानदंड को कम करके

कुल्हाड़ी? बी? > सूचना (1.2)

प्रयोग डेटा विश्लेषण

किसी ऐसे प्रयोग पर विचार करें, जिसके दौरान समय-समय पर

उदाहरण के लिए, तापमान क्यू (टी) मापा जाता है। माप परिणाम सरणी द्वारा दिए जाने दें

आइए मान लें कि प्रयोग की शर्तें ऐसी हैं कि माप एक जानबूझकर त्रुटि के साथ किया जाता है। इन मामलों में, कुछ बहुपद का उपयोग करके तापमान भिन्नता क्यू (टी) का कानून मांगा जाता है

पी (टी) = + + + ... +,

अज्ञात गुणांक का निर्धारण, ..., इस विचार से कि मान E (, ...,), समानता द्वारा परिभाषित किया गया है

गॉस बीजीय एक्सेल सन्निकटन

न्यूनतम मान लिया। चूँकि वर्गों का योग न्यूनतम होता है, इसलिए इस विधि को न्यूनतम वर्ग डेटा फ़िट कहा जाता है।

यदि हम P (t) को उसके व्यंजक से प्रतिस्थापित करते हैं, तो हमें प्राप्त होता है

आइए हम एक सरणी को परिभाषित करने की समस्या को प्रस्तुत करते हैं ताकि मान न्यूनतम हो, अर्थात। आइए कम से कम वर्ग विधि का उपयोग करके एक सरणी को परिभाषित करें। ऐसा करने के लिए, हम आंशिक डेरिवेटिव को शून्य के बराबर करते हैं:

यदि आप m × n मैट्रिक्स A = (), i = 1, 2 ..., m; जे = 1, 2, ..., एन, जहां

मैं = 1, 2 ..., मी; जे = 1, 2, ..., एन,

तब लिखित समानता का रूप ले लेता है

आइए हम मैट्रिक्स के साथ संचालन के संदर्भ में लिखित समानता को फिर से लिखें। हमारे पास मैट्रिक्स-कॉलम गुणन की परिभाषा के अनुसार है

एक ट्रांसपोज़्ड मैट्रिक्स के लिए, एक समान संबंध इस तरह दिखता है

आइए हम संकेतन का परिचय दें: वेक्टर कुल्हाड़ी के i-वें घटक को निरूपित किया जाएगा। लिखित मैट्रिक्स समानता के अनुसार, हमारे पास होगा

मैट्रिक्स रूप में, इस समानता को फिर से लिखा जा सकता है

ए टी एक्स = ए टी बी (1.3)

यहाँ A एक आयताकार m × n आव्यूह है। इसके अलावा, डेटा सन्निकटन की समस्याओं में, एक नियम के रूप में, m> n। समीकरण (1.3) को सामान्य समीकरण कहा जाता है।

शुरुआत से ही, वैक्टर के यूक्लिडियन मानदंड का उपयोग करते हुए, समस्या को एक समान मैट्रिक्स रूप में लिखना संभव था:

हमारा लक्ष्य x के संबंध में इस फलन को न्यूनतम करना है। समाधान बिंदु पर न्यूनतम तक पहुंचने के लिए, इस बिंदु पर x के संबंध में पहला व्युत्पन्न शून्य के बराबर होना चाहिए। इस फ़ंक्शन के व्युत्पन्न हैं

2ए टी बी + 2ए टी एक्स

और इसलिए समाधान को रैखिक समीकरणों की प्रणाली को संतुष्ट करना चाहिए

(ए टी ए) एक्स = (ए टी बी)।

इन समीकरणों को सामान्य समीकरण कहा जाता है। यदि A एक m × n आव्यूह है, तो A> A - n × n एक आव्यूह है, अर्थात्। सामान्य समीकरण का मैट्रिक्स हमेशा एक द्विघात सममित मैट्रिक्स होता है। इसके अलावा, यह इस अर्थ में सकारात्मक निश्चितता का गुण रखता है कि (A> Ax, x) = (Ax, Ax)? 0.

टिप्पणी। कभी-कभी फॉर्म (1.3) के समीकरण के समाधान को सिस्टम एक्स = बी का समाधान कहा जाता है, जहां ए कम से कम वर्ग विधि द्वारा आयताकार एम × एन (एम> एन) मैट्रिक्स है।

कम से कम वर्ग समस्या को डेटा बिंदुओं से मॉडल वक्र तक ऊर्ध्वाधर दूरी को कम करने के रूप में ग्राफिक रूप से व्याख्या की जा सकती है (चित्र 1.1 देखें)। यह विचार इस धारणा पर आधारित है कि सन्निकटन में सभी त्रुटियां टिप्पणियों में त्रुटियों के अनुरूप हैं। यदि व्याख्यात्मक चरों में भी त्रुटियां हैं, तो डेटा से मॉडल तक यूक्लिडियन दूरी को कम करना अधिक उपयुक्त हो सकता है।

एक्सेल के लिए ओएलएस

नीचे एक्सेल में ओएलएस को लागू करने के लिए एल्गोरिदम मानता है कि सभी प्रारंभिक डेटा पहले से ही ज्ञात हैं। सिस्टम के मैट्रिक्स समीकरण AЧX = B के दोनों पक्षों को सिस्टम के ट्रांसपोज़्ड मैट्रिक्स द्वारा बाईं ओर गुणा किया जाता है:

एटी एएक्स = एटी बी

फिर हम बाईं ओर समीकरण के दोनों पक्षों को मैट्रिक्स (एटी ए) -1 से गुणा करते हैं। यदि यह मैट्रिक्स मौजूद है, तो सिस्टम परिभाषित किया गया है। ध्यान में रख कर

(एटी ए) -1 * (एटी ए) = ई, हमें मिलता है

एक्स = (एटी ए) -1 एटी बी।

परिणामी मैट्रिक्स समीकरण m> n के लिए n अज्ञात के साथ m रैखिक समीकरणों की एक प्रणाली का समाधान है।

आइए एक विशिष्ट उदाहरण के लिए उपरोक्त एल्गोरिथम के अनुप्रयोग पर विचार करें।

उदाहरण। सिस्टम को हल करना आवश्यक होने दें

एक्सेल में, इस कार्य के लिए सूत्र प्रदर्शन मोड में समाधान वाली सूची इस तरह दिखती है:


गणना परिणाम:

आवश्यक सदिश X, E11: E12 के परास में स्थित है।

रैखिक समीकरणों की दी गई प्रणाली को हल करते समय, निम्नलिखित कार्यों का उपयोग किया गया था:

1. MOBRE - किसी सरणी में संग्रहीत मैट्रिक्स का व्युत्क्रम लौटाता है।

सिंटैक्स: MOBR (सरणी)।

ऐरे - समान संख्या में पंक्तियों और स्तंभों के साथ एक संख्यात्मक सरणी।

2. MULTIPLE - मैट्रिसेस का उत्पाद लौटाता है (मैट्रिस को सरणियों में संग्रहीत किया जाता है)। परिणाम एक सरणी है जिसमें समान संख्या में पंक्तियाँ होती हैं जैसे कि array1 और समान संख्या में कॉलम array2 के रूप में।

सिंटैक्स: एकाधिक (सरणी 1, सरणी 2)।

Array1, array2 - गुणा सरणियाँ।

सरणी श्रेणी के ऊपरी बाएँ कक्ष में फ़ंक्शन दर्ज करने के बाद, सूत्र वाले कक्ष से प्रारंभ होने वाले सरणी का चयन करें, F2 दबाएँ, और फिर CTRL + SHIFT + ENTER दबाएँ।

3. TRANSPOSE - कोशिकाओं के एक लंबवत सेट को एक क्षैतिज या इसके विपरीत में परिवर्तित करता है। इस फ़ंक्शन का उपयोग करने का परिणाम एक सरणी है जिसमें मूल सरणी में स्तंभों की संख्या के बराबर पंक्तियों की संख्या और प्रारंभिक सरणी में पंक्तियों की संख्या के बराबर स्तंभों की संख्या होती है।

कम से कम वर्ग एक रैखिक समीकरण के निर्माण के लिए एक गणितीय प्रक्रिया है जो संख्याओं की दो श्रृंखलाओं के समूह से सबसे अधिक निकटता से मेल खाता है। इस पद्धति का उद्देश्य कुल चुकता त्रुटि को कम करना है। एक्सेल में ऐसे उपकरण हैं जिनका उपयोग आप गणनाओं में इस पद्धति को लागू करने के लिए कर सकते हैं। आइए देखें कि यह कैसे किया जाता है।

एक्सेल में विधि का उपयोग करना

o सॉल्वर ऐड-इन को सक्षम करना

ओ समस्या की स्थिति

ओ निर्णय

एक्सेल में विधि का उपयोग करना

कम से कम वर्गों की विधि (OLS) एक चर की दूसरे पर निर्भरता का गणितीय विवरण है। इसका उपयोग भविष्यवाणी में किया जा सकता है।

सॉल्वर ऐड-इन को सक्षम करना

एक्सेल में ओएलएस का उपयोग करने के लिए, आपको ऐड-इन सक्षम करने की आवश्यकता है "समाधान खोजें"जो डिफ़ॉल्ट रूप से अक्षम है।

1. टैब पर जाएं "फाइल".

2. सेक्शन के नाम पर क्लिक करें "पैरामीटर".

3. खुलने वाली विंडो में, उपखंड पर चयन को रोकें "ऐड-ऑन".

4. ब्लॉक में "नियंत्रण"खिड़की के नीचे स्थित, स्विच को स्थिति पर सेट करें एक्सेल ऐड-इन्स(यदि इसका कोई भिन्न मान है) और बटन पर क्लिक करें "जाओ ...".

5. एक छोटी सी खिड़की खुलती है। हम इसमें पैरामीटर के आगे एक टिक लगाते हैं "समाधान खोजें"... बटन पर क्लिक करें "ठीक है".

अब समारोह समाधान खोजनाएक्सेल में सक्रिय है, और इसके उपकरण रिबन पर दिखाई दिए हैं।

सबक:एक्सेल में समाधान ढूँढना

समस्या की शर्तें

आइए हम एक विशिष्ट उदाहरण के साथ ओएलएस के अनुप्रयोग का वर्णन करें। हमारे पास संख्याओं की दो पंक्तियाँ हैं एक्सतथा आपजिसका क्रम नीचे इमेज में दिखाया गया है।

फ़ंक्शन इस निर्भरता का सबसे सटीक वर्णन कर सकता है:

इसके अलावा, यह ज्ञात है कि के लिए एक्स = 0 वाईभी बराबर है 0 ... इसलिए, इस समीकरण को निर्भरता द्वारा वर्णित किया जा सकता है वाई = एनएक्स.

हमें अंतर के वर्गों का न्यूनतम योग ज्ञात करना है।

समाधान

आइए विधि के प्रत्यक्ष अनुप्रयोग का वर्णन करने के लिए आगे बढ़ें।

1. पहले मान के बाईं ओर एक्सएक नंबर डाल दो 1 ... यह गुणांक के पहले मान का अनुमानित मान होगा एन.

2. कॉलम के दाईं ओर आपएक और कॉलम जोड़ें - एनएक्स... इस कॉलम के पहले सेल में गुणांक को गुणा करने का सूत्र लिखिए एनपहले चर के प्रति सेल एक्स... उसी समय, हम गुणांक के साथ फ़ील्ड का लिंक निरपेक्ष बनाते हैं, क्योंकि यह मान नहीं बदलेगा। बटन पर क्लिक करें दर्ज.

3. भरण हैंडल का उपयोग करके, इस सूत्र को नीचे के कॉलम में संपूर्ण तालिका श्रेणी में कॉपी करें।

4. एक अलग सेल में, मानों के वर्गों के अंतर के योग की गणना करें आपतथा एनएक्स... ऐसा करने के लिए, बटन पर क्लिक करें "फ़ंक्शन सम्मिलित करें".



5. खुले में "फ़ंक्शन विज़ार्ड"एक रिकॉर्ड की तलाश में "सुमकव्रजन"... इसे चुनें और बटन पर क्लिक करें "ठीक है".

6. तर्क विंडो खुलती है। खेत मेँ "ऐरे_एक्स" आप... खेत मेँ "Array_y"हम कॉलम की कोशिकाओं की श्रेणी में प्रवेश करते हैं एनएक्स... मान दर्ज करने के लिए, बस कर्सर को फ़ील्ड में रखें और शीट पर संबंधित श्रेणी का चयन करें। दर्ज करने के बाद, बटन पर क्लिक करें "ठीक है".

7. टैब पर जाएं "आंकड़े"... टूलबॉक्स में रिबन पर "विश्लेषण"घुण्डी दबाना "समाधान खोजें".

8. इस टूल के लिए पैरामीटर विंडो खोली गई है। खेत मेँ "लक्ष्य फ़ंक्शन का अनुकूलन करें"हम सूत्र के साथ सेल का पता दर्शाते हैं "सुमकव्रजन"... पैरामीटर में "पहले"स्विच को स्थिति में सेट करना सुनिश्चित करें "न्यूनतम"... खेत मेँ "कोशिकाओं को बदलना"गुणांक के मान के साथ पता निर्दिष्ट करें एन... बटन पर क्लिक करें "इसका समाधान निकालो".

9. गुणांक के सेल में समाधान प्रदर्शित किया जाएगा एन... यह वह मान है जो फ़ंक्शन का सबसे छोटा वर्ग होगा। यदि परिणाम उपयोगकर्ता को संतुष्ट करता है, तो बटन दबाएं "ठीक है"एक अतिरिक्त विंडो में।

जैसा कि आप देख सकते हैं, कम से कम वर्ग विधि का अनुप्रयोग एक जटिल गणितीय प्रक्रिया है। हमने इसे सबसे सरल उदाहरण का उपयोग करते हुए दिखाया है, लेकिन बहुत अधिक जटिल मामले हैं। हालाँकि, Microsoft Excel टूलकिट को यथासंभव गणनाओं को सरल बनाने के लिए डिज़ाइन किया गया है।

http://multitest.semico.ru/mnk.htm

सामान्य प्रावधान

निरपेक्ष मान में संख्या जितनी छोटी होगी, उतनी ही अच्छी सीधी रेखा (2) का चयन किया जाएगा। सीधी रेखा (2) के चयन की सटीकता की विशेषता के रूप में, हम वर्गों का योग ले सकते हैं

S के लिए न्यूनतम शर्तें होंगी

(6)
(7)

समीकरण (6) और (7) को इस प्रकार लिखा जा सकता है:

(8)
(9)

समीकरण (8) और (9) से प्रयोगात्मक मानों x i और y i से a और b को खोजना आसान है। रेखा (2), समीकरणों (8) और (9) द्वारा परिभाषित, कम से कम वर्गों की विधि द्वारा प्राप्त रेखा कहलाती है (यह नाम इस तथ्य पर जोर देता है कि वर्ग एस का योग न्यूनतम है)। वे समीकरण (8) और (9), जिनसे सरल रेखा (2) निर्धारित होती है, प्रसामान्य समीकरण कहलाते हैं।

आप सामान्य समीकरण लिखने का एक सरल और सामान्य तरीका बता सकते हैं। प्रयोगात्मक बिंदुओं (1) और समीकरण (2) का उपयोग करके, हम समीकरणों की प्रणाली को a और b . के लिए लिख सकते हैं

वाई 1 = कुल्हाड़ी 1 + बी,
वाई 2 = कुल्हाड़ी 2 + बी, ... (10)
वाई एन = कुल्हाड़ी एन + बी,

हम इनमें से प्रत्येक समीकरण के बाएँ और दाएँ पक्षों को पहले अज्ञात a (यानी, x 1, x 2, ..., xn) के गुणांक से गुणा करते हैं और परिणामी समीकरण जोड़ते हैं, परिणाम पहला सामान्य समीकरण है ( 8)।

हम इनमें से प्रत्येक समीकरण के बाएँ और दाएँ पक्षों को दूसरे अज्ञात b के गुणांक से गुणा करते हैं, अर्थात। 1 से, और परिणामी समीकरण जोड़ें, परिणाम दूसरा सामान्य समीकरण (9) है।

सामान्य समीकरण प्राप्त करने की यह विधि सामान्य है: यह उपयुक्त है, उदाहरण के लिए, फ़ंक्शन के लिए

एक स्थिर मूल्य है और इसे प्रयोगात्मक डेटा (1) से निर्धारित किया जाना चाहिए।

k के समीकरणों की प्रणाली को लिखा जा सकता है:

न्यूनतम वर्ग विधि का प्रयोग करके रेखा (2) ज्ञात कीजिए।

समाधान।हम खोजें:

X i = 21, y i = 46.3, x i 2 = 91, x i y i = 179.1।

हम समीकरण (8) और (9) 91a + 21b = 179.1 लिखते हैं,

21a + 6b = 46.3, इसलिए हम पाते हैं
ए = 0.98 बी = 4.3।

इसे साझा करें