मेडिकल डेटा के विश्लेषण के बारे में मेडस्टैटिस्टिक पोस्ट लाइब्रेरी। वी

रूसी संघ के राष्ट्रपति के तहत लोक अर्थव्यवस्था और सार्वजनिक सेवा की रूसी अकादमी

ओरलोव शाखा

प्रबंधन में गणित और गणितीय तरीके विभाग

स्वतंत्र काम

गणित

"भिन्न श्रृंखला और इसकी विशेषताओं" विषय पर

अर्थशास्त्र और प्रबंधन संकाय के पूर्णकालिक छात्रों के लिए

प्रशिक्षण के क्षेत्र "कार्मिक प्रबंधन"


उद्देश्य:गणितीय आँकड़ों की अवधारणाओं और प्राथमिक डेटा प्रोसेसिंग के तरीकों में महारत हासिल करना।

विशिष्ट कार्यों को हल करने का एक उदाहरण।

उद्देश्य 1.

निम्नलिखित डेटा मतदान द्वारा प्राप्त किए गए थे ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

ज़रूरी:

1) एक विविधता श्रृंखला (नमूने का सांख्यिकीय वितरण) संकलित करें, जिसमें पहले से विकल्पों की एक क्रमबद्ध असतत श्रृंखला दर्ज की गई हो।

2) बारंबारता और संचयी बहुभुज की रचना कीजिए।

3) आपेक्षिक बारंबारताओं (आवृत्तियों) के वितरणों की एक श्रृंखला बनाइए।

4) भिन्नता श्रृंखला की मुख्य संख्यात्मक विशेषताओं का पता लगाएं (उन्हें खोजने के लिए सरलीकृत सूत्रों का उपयोग करें): ए) अंकगणितीय माध्य, बी) माध्यिका मैंऔर फैशन मो, सी) विचरण एस 2, डी) मानक विचलन एस, ई) भिन्नता का गुणांक वी.

5) प्राप्त परिणामों का अर्थ स्पष्ट करें।

समाधान।

1) रचना करना विकल्पों की श्रेणीबद्ध असतत श्रेणी सर्वेक्षण डेटा को आकार के अनुसार क्रमबद्ध करें और इसे आरोही क्रम में व्यवस्थित करें

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

आइए तालिका की पहली पंक्ति में प्रेक्षित मान (विकल्प), और दूसरे में संबंधित आवृत्तियों (तालिका 1) को लिखकर एक भिन्नता श्रृंखला की रचना करें।

तालिका नंबर एक।

2) बारंबारता बहुभुज बिंदुओं को जोड़ने वाली एक टूटी हुई रेखा है ( एक्स मैं; मैं), मैं=1, 2,…, एम, कहाँ पे एम एक्स.

आइए विभिन्नता श्रेणी की बारंबारताओं का बहुभुज बनाएं (चित्र 1)।

चित्र .1। आवृत्ति बहुभुज

असतत भिन्नता श्रृंखला के लिए संचयी वक्र (संचयी) बिंदुओं को जोड़ने वाली एक टूटी हुई रेखा है ( एक्स मैं; एन मैं नकी), मैं=1, 2,…, एम.

संचित आवृत्तियों का पता लगाएं एन मैं नकी(संचयी आवृत्ति से पता चलता है कि फीचर वैल्यू कम के साथ कितने वेरिएंट देखे गए थे एक्स) पाए गए मान तालिका 1 की तीसरी पंक्ति में दर्ज किए गए हैं।



आइए एक संचयी (चित्र 2) का निर्माण करें।

रेखा चित्र नम्बर 2। कमुलता

3) आइए सापेक्ष आवृत्तियों (आवृत्तियों) को खोजें, जहां, कहां एम- विशेषता के विभिन्न मूल्यों की संख्या एक्स, जिसकी गणना उसी सटीकता के साथ की जाएगी।

आइए तालिका 2 . के रूप में सापेक्ष आवृत्तियों (आवृत्तियों) के वितरण की एक श्रृंखला को लिखें

तालिका 2

4) आइए भिन्नता श्रृंखला की मुख्य संख्यात्मक विशेषताओं को खोजें:

ए) हम एक सरलीकृत सूत्र का उपयोग करके अंकगणितीय माध्य पाते हैं:

,

सशर्त विकल्प कहां हैं

हम रखतें है साथ= 3 (औसत देखे गए मानों में से एक), = 1 (दो आसन्न विकल्पों के बीच का अंतर) और एक गणना तालिका (तालिका 3) तैयार करें।

टेबल तीन।

एक्स मैं एनमैं आप मैं आप मैं और मैं आप मैं 2 एन मैं
-3 -12
-2 -26
-1 -14
योग -11

तब अंकगणित माध्य

बी) माध्यिका मैंएक भिन्नता श्रृंखला अवलोकनों की एक श्रृंखलाबद्ध श्रृंखला के बीच में आने वाली एक विशेषता का मान है। इस असतत भिन्नता श्रृंखला में समान संख्या में पद हैं ( एन= 80), जिसका अर्थ है कि माध्यिका दो माध्यिका विकल्पों के आधे योग के बराबर है।

पहनावा मोविविधता श्रृंखला वह प्रकार है जो उच्चतम आवृत्ति से मेल खाती है। किसी दी गई भिन्नता श्रृंखला के लिए, उच्चतम आवृत्ति एनअधिकतम = 24 प्रकार से मेल खाता है एक्स= 3 का अर्थ है फैशन मो=3.

सी) फैलाव एस 2, जो संकेतक के संभावित मूल्यों के फैलाव का एक उपाय है एक्सइसके माध्य के आसपास, हम एक सरलीकृत सूत्र का उपयोग करते हुए पाते हैं:

, कहाँ पे आप मैं- सशर्त विकल्प

हम तालिका 3 में मध्यवर्ती गणना भी दर्ज करेंगे।

फिर विचरण

घ) मानक विचलन एससूत्र द्वारा ज्ञात कीजिए:

.

ई) भिन्नता का गुणांक वी: (),

भिन्नता का गुणांक एक मापनीय मात्रा है; इसलिए, यह भिन्नता श्रृंखला के प्रकीर्णन की तुलना करने के लिए उपयुक्त है, जिसके विभिन्न आयाम हैं।

भिन्नता का गुणांक

.

5) प्राप्त परिणामों का अर्थ यह है कि मूल्य विशेषता के औसत मूल्य की विशेषता है एक्समाना नमूने के भीतर, यानी औसत मूल्य 2.86 था। मानक विचलन एससंकेतक मूल्यों के पूर्ण प्रसार का वर्णन करता है एक्सऔर इस मामले में है एस≈ 1.55। भिन्नता का गुणांक वीसंकेतक की सापेक्ष परिवर्तनशीलता की विशेषता है एक्स, अर्थात्, रिश्तेदार अपने औसत मूल्य के आसपास फैलता है, और इस मामले में है।

उत्तर: ; ; ; .

उद्देश्य 2.

मध्य रूस में 40 सबसे बड़े बैंकों की इक्विटी पूंजी पर निम्नलिखित डेटा उपलब्ध हैं:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

ज़रूरी:

1) अंतराल भिन्नता श्रृंखला की रचना कीजिए।

2) माध्य नमूना और नमूना प्रसरण की गणना करें

3) मानक विचलन और भिन्नता का गुणांक ज्ञात कीजिए।

4) वितरण आवृत्तियों का एक आयत चित्र बनाइए।

समाधान।

1) आइए अंतरालों की एक मनमाना संख्या चुनें, उदाहरण के लिए, 8. फिर अंतराल की चौड़ाई है:

.

आइए एक गणना तालिका बनाएं:

अंतराल विकल्प, एक्स के -एक्स के +1 आवृत्ति, मैं मध्य अंतराल एक्स मैं सशर्त विकल्प, और मैं और मैं और मैं और मैं 2 मैं (और मैं + 1) 2 मैं
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
योग – 5

मान को गलत शून्य के रूप में चुना गया था सी = 62.5 (यह विकल्प लगभग भिन्नता पंक्ति के मध्य में स्थित है) .

सशर्त विकल्प सूत्र द्वारा निर्धारित किए जाते हैं

  • परिचयात्मक पाठ मुफ्त है;
  • बड़ी संख्या में अनुभवी शिक्षक (देशी और रूसी भाषी);
  • पाठ्यक्रम एक विशिष्ट अवधि (महीने, छह महीने, एक वर्ष) के लिए नहीं हैं, बल्कि एक विशिष्ट संख्या में कक्षाओं (5, 10, 20, 50) के लिए हैं;
  • 10,000 से अधिक संतुष्ट ग्राहक।
  • एक रूसी भाषी शिक्षक के साथ एक पाठ की लागत - 600 रूबल से, एक देशी वक्ता के साथ - 1500 रूबल से

एक भिन्नता श्रृंखला की अवधारणा।सांख्यिकीय अवलोकन सामग्री के व्यवस्थितकरण में पहला कदम उन इकाइयों की संख्या की गणना करना है जिनमें यह या वह विशेषता है। इकाइयों को उनकी मात्रात्मक विशेषता के आरोही या अवरोही क्रम में व्यवस्थित करके और विशेषता के विशिष्ट मूल्य के साथ इकाइयों की संख्या की गणना करके, हम एक भिन्नता श्रृंखला प्राप्त करते हैं। भिन्नता श्रृंखला कुछ मात्रात्मक मानदंड के अनुसार एक निश्चित सांख्यिकीय आबादी की इकाइयों के वितरण की विशेषता है।

भिन्नता श्रृंखला में दो कॉलम होते हैं, बायां कॉलम अलग-अलग फीचर के मूल्यों को दिखाता है, जिसे वेरिएंट कहा जाता है और (x) द्वारा दर्शाया जाता है, और दाएं कॉलम में पूर्ण संख्याएं होती हैं जो दर्शाती हैं कि प्रत्येक संस्करण कितनी बार होता है। इस कॉलम में रीडिंग को बारंबारता कहा जाता है और इसे (f) द्वारा दर्शाया जाता है।

भिन्नता श्रृंखला को तालिका 5.1 के रूप में योजनाबद्ध रूप से प्रस्तुत किया जा सकता है:

तालिका 5.1

परिवर्तनशील श्रृंखला दृश्य

विकल्प (एक्स)

आवृत्तियों (एफ)

दाहिने कॉलम में, सापेक्ष संकेतकों का भी उपयोग किया जा सकता है जो कि आवृत्तियों के कुल योग में अलग-अलग वेरिएंट की आवृत्ति के हिस्से को चिह्नित करते हैं। इन सापेक्ष संकेतकों को बारंबारता कहा जाता है और इन्हें पारंपरिक रूप से निरूपित किया जाता है, अर्थात। ... सभी भागों का योग एक के बराबर होता है। आवृत्तियों को प्रतिशत के रूप में भी व्यक्त किया जा सकता है, और फिर उनका योग 100% के बराबर होगा।

अलग-अलग संकेत एक अलग प्रकृति के हो सकते हैं। कुछ चिन्हों के प्रकार पूर्ण संख्या में व्यक्त किए जाते हैं, उदाहरण के लिए, एक अपार्टमेंट में कमरों की संख्या, प्रकाशित पुस्तकों की संख्या आदि। इन संकेतों को असंतत, या असतत कहा जाता है। अन्य विशेषताओं के वेरिएंट किसी भी मूल्य को कुछ सीमाओं के भीतर ले सकते हैं, जैसे कि नियोजित लक्ष्यों की पूर्ति, मजदूरी आदि। इन विशेषताओं को निरंतर कहा जाता है।

असतत भिन्नता श्रृंखला।यदि भिन्नता श्रृंखला के रूपों को असतत मूल्यों के रूप में व्यक्त किया जाता है, तो ऐसी भिन्नता श्रृंखला को असतत कहा जाता है, इसकी उपस्थिति तालिका में प्रस्तुत की जाती है। 5.2:

तालिका 5.2

परीक्षा में प्राप्त अंकों के अनुसार छात्रों का वितरण

ग्रेड (एक्स)

छात्रों की संख्या (एफ)

कुल में% ()

असतत श्रृंखला में वितरण की प्रकृति को एक वितरण बहुभुज के रूप में ग्राफिक रूप से दर्शाया गया है, चित्र 5.1।

चावल। 5.1. परीक्षा में प्राप्त अंकों के अनुसार छात्रों का वितरण।

अंतराल भिन्नता श्रृंखला।निरंतर सुविधाओं के लिए, भिन्नता श्रृंखला का निर्माण अंतराल है, अर्थात। उनमें विशेषता के मान "से और से" अंतराल के रूप में व्यक्त किए जाते हैं। इस मामले में, ऐसे अंतराल में किसी विशेषता के न्यूनतम मान को अंतराल की निचली सीमा कहा जाता है, और अधिकतम को अंतराल की ऊपरी सीमा कहा जाता है।

इंटरवल वेरिएशन सीरीज़ का निर्माण असंतत (असतत) सुविधाओं और एक बड़ी रेंज में भिन्न दोनों के लिए किया जाता है। रिक्ति पंक्तियाँ समान या असमान रिक्ति पर हो सकती हैं। आर्थिक व्यवहार में, अधिकांश भाग के लिए, असमान अंतरालों का उपयोग किया जाता है, जो उत्तरोत्तर बढ़ते या घटते हैं। ऐसी आवश्यकता विशेष रूप से उन मामलों में उत्पन्न होती है जहां सुविधा की परिवर्तनशीलता असमान रूप से और व्यापक सीमाओं के भीतर की जाती है।

समान अंतराल वाली तालिका के अंतराल श्रृंखला के प्रकार पर विचार करें। 5.3:

तालिका 5.3

उत्पादन द्वारा श्रमिकों का वितरण

जनरेशन, ट्र. (एक्स)

श्रमिकों की संख्या (एफ)

संचयी आवृत्ति (f´)

वितरण की अंतराल श्रृंखला को एक हिस्टोग्राम के रूप में ग्राफिक रूप से दर्शाया गया है, चित्र 5.2।

चित्र 5.2. उत्पादन द्वारा श्रमिकों का वितरण

संचित (संचयी) आवृत्ति।व्यवहार में, वितरण श्रृंखला को में बदलने की आवश्यकता है संचयी श्रृंखला,संचित आवृत्तियों के आधार पर। उनका उपयोग संरचनात्मक साधनों को निर्धारित करने के लिए किया जा सकता है जो वितरण श्रृंखला के डेटा के विश्लेषण की सुविधा प्रदान करते हैं।

संचित आवृत्तियों को वितरण श्रृंखला के बाद के समूहों के इन संकेतकों के पहले समूह की आवृत्तियों (या भागों) में क्रमिक रूप से जोड़कर निर्धारित किया जाता है। वितरण श्रृंखला को चित्रित करने के लिए संचयी और तोरण का उपयोग किया जाता है। उन्हें प्लॉट करने के लिए, असतत विशेषता (या अंतराल के सिरों) के मूल्यों को भुज अक्ष पर चिह्नित किया जाता है, और आवृत्तियों के बढ़ते योग (संचयी) को समन्वय अक्ष पर चिह्नित किया जाता है, चित्र 5.3।

चावल। 5.3. उत्पादन द्वारा श्रमिकों का संचयी वितरण

यदि आवृत्तियों और भिन्नताओं के पैमाने को उलट दिया जाता है, अर्थात। एब्सिस्सा अक्ष पर संचित आवृत्तियों को प्रतिबिंबित करते हैं, और कोऑर्डिनेट अक्ष पर विकल्पों के मूल्यों को दर्शाते हैं, फिर समूह से समूह में आवृत्तियों में परिवर्तन को दर्शाने वाले वक्र को वितरण तोरण कहा जाएगा, चित्र 5.4।

चावल। 5.4. उत्पादन के लिए श्रमिकों के वितरण की सीमा

समान अंतराल वाली विविधता श्रृंखला सांख्यिकीय वितरण श्रृंखला के लिए सबसे महत्वपूर्ण आवश्यकताओं में से एक प्रदान करती है, जिससे समय और स्थान में उनकी तुलना सुनिश्चित होती है।

वितरण का घनत्व।हालांकि, इन श्रृंखलाओं में अलग-अलग असमान अंतरालों की आवृत्तियां सीधे तुलनीय नहीं हैं। ऐसे मामलों में, आवश्यक तुलनीयता सुनिश्चित करने के लिए, वितरण घनत्व की गणना की जाती है, अर्थात। निर्धारित करें कि प्रत्येक समूह में अंतराल की प्रति इकाई कितनी इकाइयाँ हैं।

असमान अंतराल के साथ भिन्नता श्रृंखला के वितरण के ग्राफ का निर्माण करते समय, आयतों की ऊंचाई आवृत्तियों के अनुपात में निर्धारित की जाती है, लेकिन संबंधित अंतराल में अध्ययन की गई विशेषता के मूल्यों के वितरण घनत्व के संकेतकों के लिए निर्धारित की जाती है। .

विविधता श्रृंखला का संकलन और इसका ग्राफिक प्रतिनिधित्व प्रारंभिक डेटा के प्रसंस्करण में पहला कदम है और अध्ययन की गई आबादी के विश्लेषण में पहला चरण है। विविधता श्रृंखला के विश्लेषण में अगला कदम मुख्य सामान्यीकरण संकेतकों को निर्धारित करना है, जिन्हें श्रृंखला की विशेषताएं कहा जाता है। इन विशेषताओं से जनसंख्या इकाइयों में किसी विशेषता के औसत मूल्य का अनुमान लगाना चाहिए।

औसत मूल्य... औसत मूल्य अध्ययन की गई जनसंख्या में अध्ययन की गई विशेषता की एक सामान्यीकृत विशेषता है, जो स्थान और समय की विशिष्ट परिस्थितियों में जनसंख्या की प्रति इकाई इसके विशिष्ट स्तर को दर्शाती है।

औसत हमेशा नामित किया जाता है, जनसंख्या की व्यक्तिगत इकाइयों के लिए विशेषता के समान आयाम होता है।

औसत मूल्यों की गणना करने से पहले, गुणात्मक रूप से सजातीय समूहों को उजागर करते हुए, अध्ययन की गई आबादी की इकाइयों को समूहित करना आवश्यक है।

समग्र रूप से जनसंख्या के लिए परिकलित औसत को समग्र औसत कहा जाता है, और प्रत्येक समूह के लिए, समूह औसत।

औसत दो प्रकार के होते हैं: शक्ति (अंकगणित माध्य, हार्मोनिक माध्य, ज्यामितीय माध्य, माध्य वर्ग); संरचनात्मक (फैशन, माध्यिका, चतुर्थक, डेसाइल)।

गणना के लिए औसत का चुनाव उद्देश्य पर निर्भर करता है।

शक्ति औसत के प्रकार और उनकी गणना के तरीके।एकत्रित सामग्री के सांख्यिकीय प्रसंस्करण के अभ्यास में, विभिन्न समस्याएं उत्पन्न होती हैं, जिनके समाधान के लिए विभिन्न औसत की आवश्यकता होती है।

गणितीय आँकड़े घात माध्य सूत्रों से विभिन्न साधन प्राप्त करते हैं:

औसत मूल्य कहां है; एक्स - अलग-अलग वेरिएंट (विशेषता मान); z - घातांक (z = 1 के लिए - अंकगणितीय माध्य, z = 0 ज्यामितीय माध्य, z = - 1 - हार्मोनिक माध्य, z = 2 - माध्य वर्ग)।

हालाँकि, प्रत्येक व्यक्तिगत मामले में किस प्रकार के औसत को लागू किया जाना चाहिए, इस सवाल का समाधान अध्ययन की गई आबादी के विशिष्ट विश्लेषण के माध्यम से किया जाता है।

आँकड़ों में सबसे सामान्य प्रकार का औसत है अंकगणित औसत... इसकी गणना उन मामलों में की जाती है जब अध्ययन की गई सांख्यिकीय आबादी की व्यक्तिगत इकाइयों के लिए औसत विशेषता का आयतन इसके मूल्यों के योग के रूप में बनता है।

प्रारंभिक डेटा की प्रकृति के आधार पर, अंकगणितीय माध्य विभिन्न तरीकों से निर्धारित किया जाता है:

यदि डेटा को समूहीकृत नहीं किया जाता है, तो गणना सरल औसत सूत्र के अनुसार की जाती है

एक असतत श्रृंखला में अंकगणितीय माध्य की गणनासूत्र 3.4 के अनुसार होता है।

अंतराल श्रृंखला में अंकगणितीय माध्य की गणना।अंतराल भिन्नता श्रृंखला में, जहां अंतराल के मध्य को पारंपरिक रूप से प्रत्येक समूह में एक विशेषता के मूल्य के रूप में लिया जाता है, अंकगणितीय माध्य गैर-समूहित डेटा से गणना किए गए औसत से भिन्न हो सकता है। इसके अलावा, समूहों में अंतराल का मूल्य जितना अधिक होगा, गैर-समूहित डेटा से गणना किए गए औसत से समूहीकृत डेटा से परिकलित औसत का संभावित विचलन उतना ही अधिक होगा।

अंतराल भिन्नता श्रृंखला पर औसत की गणना करते समय, आवश्यक गणना करने के लिए, वे अंतराल से अपने मध्य बिंदुओं पर जाते हैं। और फिर औसत की गणना अंकगणितीय भारित औसत के सूत्र का उपयोग करके की जाती है।

अंकगणित माध्य के गुण।अंकगणित माध्य में कुछ गुण होते हैं जो गणनाओं को सरल बनाना संभव बनाते हैं, उन पर विचार करें।

1. अचर संख्याओं का समांतर माध्य इस अचर संख्या के बराबर होता है।

अगर एक्स = ए। फिर .

2. यदि सभी प्रकारों के भार आनुपातिक रूप से बदले जाते हैं, अर्थात। एक ही संख्या में गुणा या वृद्धि करें, तो नई श्रृंखला का अंकगणितीय माध्य इससे नहीं बदलेगा।

यदि सभी भार f को k के गुणनखंड से कम कर दिया जाए, तो .

3. भार से गुणा किए गए माध्य से अलग-अलग रूपों के सकारात्मक और नकारात्मक विचलन का योग शून्य के बराबर है, अर्थात।

तो अगर। यहां से।

यदि सभी विकल्पों को किसी संख्या से घटाया या बढ़ाया जाता है, तो नई श्रृंखला का अंकगणितीय माध्य उसी राशि से घटेगा या बढ़ेगा।

सभी विकल्प कम करें एक्सपर , अर्थात। एक्स´ = एक्सए।

फिर

मूल श्रंखला का अंकगणितीय माध्य घटे हुए औसत में विकल्पों में से पहले घटाई गई संख्या को जोड़कर प्राप्त किया जा सकता है , अर्थात। ...

5. यदि सभी विकल्पों को घटाया या बढ़ाया जाए बार, तो नई श्रृंखला का अंकगणितीय माध्य उसी राशि से घटेगा या बढ़ेगा, अर्थात। वी एक बार।

चलो, फिर .

इसलिए, यानी। प्रारंभिक श्रृंखला का औसत प्राप्त करने के लिए, नई श्रृंखला के अंकगणितीय औसत (घटाए गए विकल्पों के साथ) को द्वारा बढ़ाया जाना चाहिए एक बार।

औसत हार्मोनिक।हार्मोनिक माध्य अंकगणित माध्य का व्युत्क्रम है। इसका उपयोग तब किया जाता है जब सांख्यिकीय जानकारी में जनसंख्या के अलग-अलग रूपों के लिए आवृत्तियों को शामिल नहीं किया जाता है, लेकिन उनके उत्पाद (एम = एक्सएफ) के रूप में प्रस्तुत किया जाता है। हार्मोनिक माध्य की गणना सूत्र 3.5 . द्वारा की जाएगी

हार्मोनिक माध्य का व्यावहारिक अनुप्रयोग - कुछ सूचकांकों की गणना के लिए, विशेष रूप से, मूल्य सूचकांक।

जियोमेट्रिक माध्य।ज्यामितीय माध्य का उपयोग करते समय, सुविधा के व्यक्तिगत मूल्य, एक नियम के रूप में, श्रृंखला में प्रत्येक स्तर के पिछले स्तर के संबंध के रूप में, श्रृंखला मात्रा के रूप में निर्मित गतिशीलता के सापेक्ष मूल्य हैं। गतिकी का। औसत इस प्रकार औसत विकास दर की विशेषता है।

ज्यामितीय माध्य का उपयोग किसी विशेषता के अधिकतम और न्यूनतम मानों से समदूरस्थ मान निर्धारित करने के लिए भी किया जाता है। उदाहरण के लिए, एक बीमा कंपनी ऑटो बीमा सेवाओं के प्रावधान के लिए अनुबंध करती है। विशिष्ट बीमित घटना के आधार पर, बीमा भुगतान प्रति वर्ष $ 10,000 से $ 100,000 तक हो सकता है। बीमा के लिए भुगतान की गई औसत राशि USD होगी।

एक ज्यामितीय माध्य एक मान होता है जिसका उपयोग अनुपात के औसत के रूप में या वितरण श्रृंखला में एक ज्यामितीय प्रगति के रूप में प्रस्तुत किया जाता है जब z = 0। यह औसत उपयोग करने के लिए सुविधाजनक होता है जब पूर्ण अंतर पर ध्यान नहीं दिया जाता है, लेकिन दो के अनुपात पर ध्यान दिया जाता है। संख्याएं।

गणना के सूत्र इस प्रकार हैं

औसत फीचर के वेरिएंट कहां हैं; - विकल्पों का उत्पाद; एफ- विकल्पों की आवृत्ति।

औसत वार्षिक वृद्धि दर की गणना में ज्यामितीय माध्य का उपयोग किया जाता है।

मध्य चौक।वितरण श्रृंखला में अंकगणित माध्य के आसपास किसी विशेषता के व्यक्तिगत मूल्यों की परिवर्तनशीलता की डिग्री को मापने के लिए रूट-माध्य-वर्ग सूत्र का उपयोग किया जाता है। इसलिए, भिन्नता के संकेतकों की गणना करते समय, औसत की गणना अंकगणित माध्य से विशेषता के व्यक्तिगत मूल्यों के विचलन के वर्गों से की जाती है।

मूल माध्य वर्ग की गणना सूत्र द्वारा की जाती है

आर्थिक अध्ययनों में, एक संशोधित रूप में मूल माध्य वर्ग का व्यापक रूप से एक विशेषता के भिन्नता के संकेतकों की गणना में उपयोग किया जाता है, जैसे कि विचरण, मानक विचलन।

बहुमत नियम।घात औसत के बीच निम्नलिखित संबंध है - घातांक जितना बड़ा होगा, माध्य का मान उतना ही अधिक होगा, तालिका 5.4:

तालिका 5.4

औसत के बीच का अनुपात

जेड मान

औसत के बीच का अनुपात

इस अनुपात को प्रमुख का नियम कहा जाता है।

संरचनात्मक औसत।जनसंख्या की संरचना को चिह्नित करने के लिए, विशेष संकेतकों का उपयोग किया जाता है, जिन्हें संरचनात्मक औसत कहा जा सकता है। इन संकेतकों में फैशन, माध्यिका, चतुर्थक और दशमांश शामिल हैं।

पहनावा।बहुलक (Mo) जनसंख्या इकाइयों में एक विशेषता का सबसे सामान्य मान है। फ़ैशन एक विशेषता का मूल्य है जो सैद्धांतिक वितरण वक्र के अधिकतम बिंदु से मेल खाता है।

उपभोक्ता मांग के अध्ययन में फैशन का व्यापक रूप से व्यावसायिक अभ्यास में उपयोग किया जाता है (जब कपड़ों और जूतों के आकार का निर्धारण उच्च मांग में होता है), कीमतों को दर्ज करना। समुच्चय में कई तरीके हो सकते हैं।

असतत पंक्ति में मोड गणना।असतत श्रृंखला में, मोड उच्चतम आवृत्ति वाला संस्करण है। एक असतत श्रृंखला में एक मोड खोजने पर विचार करें।

अंतराल श्रृंखला में बहुलक की गणना।अंतराल भिन्नता श्रृंखला में, बहुलक को लगभग मोडल अंतराल का केंद्रीय संस्करण माना जाता है, अर्थात। उच्चतम आवृत्ति (आवृत्ति) वाला अंतराल। अंतराल के भीतर, सुविधा के मूल्य का पता लगाना आवश्यक है, जो कि विधा है। एक अंतराल श्रृंखला के लिए, बहुलक सूत्र द्वारा निर्धारित किया जाएगा

मोडल अंतराल की निचली सीमा कहाँ है; - मोडल अंतराल का मान; - मोडल अंतराल के अनुरूप आवृत्ति; - मोडल अंतराल से पहले की आवृत्ति; मोडल के बाद अंतराल की आवृत्ति है।

माध्यिका।माध्यिका () रैंक की गई श्रृंखला की मध्य इकाई में विशेषता का मान है। एक क्रमबद्ध श्रृंखला एक श्रृंखला है जिसमें विशेषता मान आरोही या अवरोही क्रम में लिखे जाते हैं। या माध्यिका एक ऐसा मान है जो क्रमबद्ध विविधता श्रृंखला की संख्या को दो बराबर भागों में विभाजित करता है: एक भाग में एक चर का मान होता है जो औसत प्रकार से कम होता है, और दूसरा - बड़ा होता है।

माध्यिका ज्ञात करने के लिए सबसे पहले इसका क्रमसूचक निर्धारित किया जाता है। ऐसा करने के लिए, विषम संख्या में इकाइयों के साथ, सभी आवृत्तियों के योग में एक जोड़ा जाता है और सब कुछ दो से विभाजित किया जाता है। यदि इकाइयों की संख्या सम है, तो माध्यिका को इकाई के गुण के मान के रूप में पाया जाता है, जिसकी क्रमिक संख्या दो से विभाजित आवृत्तियों के कुल योग से निर्धारित होती है। माध्यिका की क्रमिक संख्या जानने के बाद, संचित आवृत्तियों से इसका मान ज्ञात करना आसान है।

एक असतत श्रृंखला में माध्यिका की गणना।नमूना सर्वेक्षण के अनुसार परिवारों के वितरण पर बच्चों की संख्या, टैब के अनुसार आंकड़े प्राप्त किए गए थे। 5.5. माध्यिका ज्ञात करने के लिए, हम पहले इसकी क्रम संख्या ज्ञात करते हैं

=

फिर हम संचित आवृत्तियों की एक श्रृंखला का निर्माण करेंगे (क्रमिक संख्या और संचित आवृत्ति से हम माध्य पाएंगे। संचित आवृत्ति 33 से पता चलता है कि 33 परिवारों में बच्चों की संख्या 1 बच्चे से अधिक नहीं है, लेकिन चूंकि औसत संख्या 50 है, इसलिए औसत 34 से 55 परिवारों के अंतराल में होगा।

तालिका 5.5

बच्चों की संख्या से परिवारों की संख्या का वितरण

परिवार में बच्चों की संख्या

परिवारों की संख्या माध्यिका अंतराल का मान है;

शक्ति माध्य के सभी माने गए रूपों में एक महत्वपूर्ण संपत्ति होती है (संरचनात्मक साधनों के विपरीत) - श्रृंखला के सभी मूल्यों को माध्य निर्धारित करने के सूत्र में शामिल किया जाता है, अर्थात। औसत का आकार प्रत्येक विकल्प के मूल्य से प्रभावित होता है।

एक ओर, यह एक बहुत ही सकारात्मक गुण है, क्योंकि इस मामले में, अध्ययन की गई आबादी की सभी इकाइयों को प्रभावित करने वाले सभी कारणों की कार्रवाई को ध्यान में रखा जाता है। दूसरी ओर, यहां तक ​​​​कि एक भी अवलोकन जो दुर्घटना से प्रारंभिक डेटा में गिर गया, विचारित जनसंख्या (विशेषकर लघु श्रृंखला में) में अध्ययन किए गए गुण के विकास के स्तर के विचार को महत्वपूर्ण रूप से विकृत कर सकता है।

चतुर्थक और दशमांश।परिवर्तनशील श्रृंखला में माध्यिका ज्ञात करने की सादृश्यता से, आप श्रेणीबद्ध श्रृंखला में किसी भी इकाई के लिए विशेषता का मान ज्ञात कर सकते हैं। इसलिए, विशेष रूप से, आप किसी श्रेणी को 4 बराबर भागों में, 10 आदि में विभाजित करने वाली इकाइयों में एक विशेषता का मान पा सकते हैं।

चतुर्थक।एक श्रेणीबद्ध श्रृंखला को चार बराबर भागों में विभाजित करने वाले प्रकार चतुर्थक कहलाते हैं।

साथ ही, वे भेद करते हैं: निम्न (या प्रथम) चतुर्थक (Q1) - से के अनुपात में जनसंख्या को विभाजित करने वाली श्रेणीबद्ध श्रृंखला की इकाई में विशेषता का मान और ऊपरी (या तीसरा) चतुर्थक (Q3) ) - से के अनुपात में जनसंख्या को विभाजित करके, रैंक की गई श्रृंखला की इकाई में विशेषता का मान।

दूसरा चतुर्थक माध्यिका Q2 = Me है। अंतराल श्रृंखला में निचले और ऊपरी चतुर्थक की गणना माध्यिका के समान सूत्र का उपयोग करके की जाती है।

क्रमशः निचले और ऊपरी चतुर्थक वाले अंतराल की निचली सीमा कहां है;

- निचले या ऊपरी चतुर्थक वाले अंतराल से पहले के अंतराल की संचयी आवृत्ति;

- चतुर्थक अंतराल की आवृत्ति (निचला और ऊपरी)

Q1 और Q3 वाले अंतराल संचित आवृत्तियों (या भागों) से निर्धारित होते हैं।

दशमांश।चतुर्थक के अलावा, दशमलव की गणना की जाती है - रैंक की गई श्रृंखला को 10 बराबर भागों में विभाजित करने वाले विकल्प।

उन्हें डी द्वारा निरूपित किया जाता है, पहला डेसाइल डी 1 पंक्ति को 1/10 और 9/10 के अनुपात में विभाजित करता है, दूसरा डी 2 - 2/10 और 8/10, आदि। उनकी गणना माध्यिका और चतुर्थक के समान योजना के अनुसार की जाती है।

और माध्यिका, चतुर्थक और दशमांश तथाकथित क्रमसूचक आँकड़ों से संबंधित हैं, जिसे एक प्रकार के रूप में समझा जाता है जो क्रमबद्ध श्रृंखला में एक निश्चित क्रमिक स्थान रखता है।

पंक्तियों का निर्माण मात्रात्मककहा जाता है परिवर्तन संबंधी.

वितरण श्रृंखला से मिलकर बनता है विकल्प(विशेषता मूल्य) और आवृत्तियों(समूहों की संख्या)। सापेक्ष मूल्यों (अंश, प्रतिशत) के रूप में व्यक्त आवृत्तियों को कहा जाता है बारंबार... सभी आवृत्तियों के योग को वितरण श्रृंखला का आयतन कहा जाता है।

प्रकार से, वितरण श्रृंखला को विभाजित किया जाता है अलग(विशेषता के असंतत मूल्यों के आधार पर निर्मित) और मध्यान्तर(विशेषता के निरंतर मूल्यों पर निर्मित)।

परिवर्तनशील श्रृंखलादो स्तंभों (या रेखाओं) का प्रतिनिधित्व करता है; जिनमें से एक में चर विशेषता के अलग-अलग मान दिए गए हैं, जिन्हें विकल्प कहा जाता है और X द्वारा दर्शाया जाता है; और दूसरे में - निरपेक्ष संख्याएँ यह दर्शाती हैं कि प्रत्येक विकल्प कितनी बार (कितनी बार) आता है। दूसरे कॉलम के संकेतकों को बारंबारता कहा जाता है और पारंपरिक रूप से f द्वारा निरूपित किया जाता है। एक बार फिर, हम ध्यान दें कि दूसरे कॉलम में, सापेक्ष संकेतकों का भी उपयोग किया जा सकता है, जो आवृत्तियों के कुल योग में अलग-अलग वेरिएंट की आवृत्ति के हिस्से की विशेषता है। इन सापेक्ष संकेतकों को आवृत्तियों कहा जाता है और पारंपरिक रूप से के माध्यम से निरूपित किया जाता है इस मामले में सभी आवृत्तियों का योग एक के बराबर होता है। हालांकि, आवृत्तियों को प्रतिशत के रूप में व्यक्त किया जा सकता है, और फिर सभी आवृत्तियों का योग 100% देता है।

यदि भिन्नता श्रृंखला के रूपों को असतत मात्रा के रूप में व्यक्त किया जाता है, तो ऐसी भिन्नता श्रृंखला कहलाती है असतत।

निरंतर सुविधाओं के लिए, परिवर्तनशील श्रृंखला का निर्माण इस प्रकार किया जाता है मध्यान्तर, अर्थात्, उनमें विशेषता के मान "से ... से ..." व्यक्त किए जाते हैं। इसी समय, ऐसे अंतराल में विशेषता के न्यूनतम मूल्यों को अंतराल की निचली सीमा कहा जाता है, और अधिकतम - ऊपरी सीमा।

इंटरवल वेरिएशन सीरीज़ का निर्माण भी एक बड़ी रेंज में अलग-अलग असतत विशेषताओं के लिए किया जाता है। अंतराल पंक्तियों के साथ हो सकता है बराबरी कातथा असमानअंतराल।

विचार करें कि समान अंतरालों का मान कैसे निर्धारित किया जाता है। आइए निम्नलिखित संकेतन का परिचय दें:

मैं- अंतराल का आकार;

- जनसंख्या की इकाइयों के लिए विशेषता का अधिकतम मूल्य;

- जनसंख्या की इकाइयों के लिए विशेषता का न्यूनतम मूल्य;

एन -आवंटित समूहों की संख्या

यदि n ज्ञात है।

यदि आवंटित समूहों की संख्या पहले से निर्धारित करना मुश्किल है, तो स्टर्गेस द्वारा 1926 में प्रस्तावित सूत्र को जनसंख्या की पर्याप्त मात्रा के साथ अंतराल के इष्टतम मूल्य की गणना के लिए अनुशंसित किया जा सकता है:

एन = 1+ 3.322 एलजी एन, जहां एन कुल में इकाइयों की संख्या है।

अध्ययन की वस्तु की विशेषताओं को ध्यान में रखते हुए, प्रत्येक व्यक्तिगत मामले में असमान अंतराल का आकार निर्धारित किया जाता है।

नमूने का सांख्यिकीय वितरणविकल्पों की सूची और उनकी संगत आवृत्तियों (या सापेक्ष आवृत्तियों) को कॉल करें।

नमूने के सांख्यिकीय वितरण को एक तालिका के रूप में सेट किया जा सकता है, जिसके पहले कॉलम में विकल्प स्थित हैं, और दूसरे में - इन विकल्पों के अनुरूप आवृत्तियों नी, या सापेक्ष आवृत्तियों अनुकरणीय .

नमूने का सांख्यिकीय वितरण

विविधता श्रृंखला को अंतराल श्रृंखला कहा जाता है, जिसमें उनके गठन में अंतर्निहित विशेषताओं के मूल्यों को कुछ सीमाओं (अंतराल) के भीतर व्यक्त किया जाता है। इस मामले में फ़्रीक्वेंसी व्यक्तिगत विशिष्ट मूल्यों को नहीं, बल्कि पूरे अंतराल को संदर्भित करती है।

अंतराल वितरण श्रृंखला निरंतर मात्रात्मक विशेषताओं के साथ-साथ महत्वपूर्ण सीमाओं के भीतर अलग-अलग विशेषताओं के अनुसार बनाई गई है।

अंतराल श्रृंखला को नमूने के सांख्यिकीय वितरण द्वारा दर्शाया जा सकता है, जो अंतराल और संबंधित आवृत्तियों को दर्शाता है। इस मामले में, इस अंतराल में आने वाले संस्करण की आवृत्तियों का योग अंतराल की आवृत्ति के रूप में लिया जाता है।

मात्रात्मक निरंतर विशेषताओं द्वारा समूहीकृत करते समय, अंतराल के आकार को निर्धारित करना महत्वपूर्ण है।

नमूना माध्य और नमूना विचरण के अलावा, भिन्नता श्रृंखला की अन्य विशेषताओं का भी उपयोग किया जाता है।

पहनावाउच्चतम आवृत्ति वाले विकल्प को कहते हैं।

सांख्यिकीय विश्लेषण में एक विशेष स्थान अध्ययन की गई विशेषता या घटना के औसत स्तर की परिभाषा के अंतर्गत आता है। किसी विशेषता का औसत स्तर औसत मानों से मापा जाता है।

औसत मूल्य अध्ययन की गई विशेषता के सामान्य मात्रात्मक स्तर की विशेषता है और यह सांख्यिकीय आबादी की एक समूह संपत्ति है। यह एक दिशा या किसी अन्य में व्यक्तिगत टिप्पणियों के यादृच्छिक विचलन को बेअसर करता है, कमजोर करता है और अध्ययन के तहत विशेषता की मुख्य, विशिष्ट संपत्ति को सामने लाता है।

औसत व्यापक रूप से उपयोग किए जाते हैं:

1. जनसंख्या के स्वास्थ्य की स्थिति का आकलन करने के लिए: शारीरिक विकास की विशेषताएं (ऊंचाई, वजन, छाती की परिधि, आदि), विभिन्न रोगों की व्यापकता और अवधि की पहचान करना, जनसांख्यिकीय संकेतकों का विश्लेषण (जनसंख्या की प्राकृतिक गति, औसत जीवन प्रत्याशा) , जनसंख्या का प्रजनन, औसत जनसंख्या और आदि)।

2. चिकित्सा संस्थानों, चिकित्सा कर्मियों की गतिविधियों का अध्ययन करना और उनके काम की गुणवत्ता का आकलन करना, योजना बनाना और विभिन्न प्रकार की चिकित्सा देखभाल में आबादी की जरूरतों का निर्धारण करना (प्रति निवासी प्रति वर्ष यात्राओं या यात्राओं की औसत संख्या, औसत लंबाई अस्पताल में रहने की अवधि, रोगी की जांच की औसत अवधि, डॉक्टरों की औसत व्यवस्था, बिस्तर आदि)।

3. स्वच्छता और महामारी विज्ञान की स्थिति (कार्यशाला में औसत धूल सामग्री, प्रति व्यक्ति औसत क्षेत्र, प्रोटीन, वसा और कार्बोहाइड्रेट की औसत खपत, आदि) की विशेषता के लिए।

4. स्वास्थ्य और रोग में चिकित्सा और शारीरिक मापदंडों को निर्धारित करने के लिए, प्रयोगशाला डेटा को संसाधित करते समय, सामाजिक और स्वच्छ, नैदानिक, प्रयोगात्मक अध्ययनों में एक नमूना अध्ययन के परिणामों की विश्वसनीयता स्थापित करने के लिए।

औसत मूल्यों की गणना भिन्नता श्रृंखला के आधार पर की जाती है। परिवर्तनशील श्रृंखलाएक गुणात्मक रूप से सजातीय सांख्यिकीय जनसंख्या है, जिसकी व्यक्तिगत इकाइयाँ अध्ययन के तहत विशेषता या घटना के मात्रात्मक अंतर को दर्शाती हैं।

मात्रात्मक भिन्नता दो प्रकार की हो सकती है: असंतत (असतत) और निरंतर।

एक असंतत (असतत) संकेत केवल एक पूर्णांक के रूप में व्यक्त किया जाता है और इसमें कोई मध्यवर्ती मान नहीं हो सकता है (उदाहरण के लिए, विज़िट की संख्या, साइट की जनसंख्या, परिवार में बच्चों की संख्या, अंकों में रोग की गंभीरता , आदि।)।

एक निरंतर संकेत कुछ सीमाओं के भीतर किसी भी मूल्य को ले सकता है, जिसमें भिन्नात्मक भी शामिल हैं, और केवल लगभग व्यक्त किया जाता है (उदाहरण के लिए, वजन - वयस्कों के लिए आप खुद को किलोग्राम तक सीमित कर सकते हैं, और नवजात शिशुओं के लिए - ग्राम; ऊंचाई, रक्तचाप, बिताया गया समय) एक रोगी को देखने पर, और आदि)।



भिन्नता श्रृंखला में शामिल प्रत्येक व्यक्तिगत विशेषता या घटना के संख्यात्मक मान को एक प्रकार कहा जाता है और इसे अक्षर द्वारा दर्शाया जाता है वी ... गणितीय साहित्य में अन्य पदनाम हैं, उदाहरण के लिए एक्स या वाई

भिन्नता श्रृंखला, जहाँ प्रत्येक विकल्प को एक बार इंगित किया जाता है, सरल कहलाती है।कंप्यूटर डेटा प्रोसेसिंग के मामले में अधिकांश सांख्यिकीय समस्याओं में ऐसी श्रृंखला का उपयोग किया जाता है।

टिप्पणियों की संख्या में वृद्धि के साथ, एक नियम के रूप में, वेरिएंट के बार-बार मूल्य होते हैं। इस मामले में, ए समूहीकृत भिन्नता श्रृंखला, जहां दोहराव की संख्या इंगित की गई है (आवृत्ति, अक्षर द्वारा निरूपित " आर »).

रैंक की गई विविधता श्रृंखलाआरोही या अवरोही क्रम में व्यवस्थित रूपांतरों से मिलकर बनता है। सरल और समूहीकृत दोनों श्रृंखलाओं को रैंक किया जा सकता है।

अंतराल भिन्नता श्रृंखलाबहुत बड़ी संख्या में अवलोकन इकाइयों (1000 से अधिक) के साथ कंप्यूटर के उपयोग के बिना किए गए बाद की गणना को सरल बनाने के लिए संकलित किया जाता है।

निरंतर भिन्नता श्रृंखलाभिन्न मान शामिल हैं, जिन्हें किसी भी मान के साथ व्यक्त किया जा सकता है।

यदि भिन्नता श्रृंखला में विशेषता के मान (विकल्प) अलग-अलग विशिष्ट संख्याओं के रूप में दिए जाते हैं, तो ऐसी श्रृंखला कहलाती है अलग.

विविधता श्रृंखला में परिलक्षित विशेषता के मूल्यों की सामान्य विशेषताएं औसत मूल्य हैं। उनमें से, सबसे अधिक उपयोग किया जाता है: अंकगणितीय माध्य एम,पहनावा मोऔर माध्यिका मैं।इनमें से प्रत्येक विशेषता अद्वितीय है। वे एक दूसरे के लिए स्थानापन्न नहीं कर सकते हैं, और केवल कुल मिलाकर, पूरी तरह से और संकुचित रूप में, क्या वे भिन्नता श्रृंखला की विशेषताओं का प्रतिनिधित्व करते हैं।

पहनावा (मो) सबसे आम विकल्पों के अर्थ को नाम दें।

मंझला (मैं) क्या भिन्नता का मान है, रैंक की गई विविधता श्रृंखला को आधे में विभाजित करना (माध्यिका के प्रत्येक पक्ष पर, आधा भिन्नता है)। दुर्लभ मामलों में, जब एक सममित भिन्नता श्रृंखला होती है, तो बहुलक और माध्यिका एक दूसरे के बराबर होते हैं और अंकगणितीय माध्य के मान के साथ मेल खाते हैं।

भिन्न मूल्यों की सबसे विशिष्ट विशेषता है अंकगणित औसतमात्रा ( एम ) गणितीय साहित्य में, इसे निरूपित किया जाता है .

अंकगणित औसत (एम, ) अध्ययन की गई घटना की एक निश्चित विशेषता की एक सामान्य मात्रात्मक विशेषता है जो गुणात्मक रूप से सजातीय सांख्यिकीय आबादी बनाती है। सरल और भारित अंकगणितीय माध्य के बीच अंतर करें। सरल अंकगणितीय माध्य की गणना सभी विकल्पों को जोड़कर और इस योग को दी गई विविधता श्रृंखला में शामिल विकल्पों की कुल संख्या से विभाजित करके एक साधारण भिन्नता श्रृंखला के लिए की जाती है। गणना सूत्र के अनुसार की जाती है:

कहाँ पे: एम - सरल अंकगणितीय माध्य;

Σ वी - विकल्प की राशि;

एन- अवलोकनों की संख्या।

समूहीकृत भिन्नता श्रृंखला में, भारित अंकगणितीय माध्य निर्धारित किया जाता है। इसकी गणना का सूत्र:

कहाँ पे: एम - भारित अंकगणितीय माध्य;

Σ वीपी - उनकी आवृत्ति पर संस्करण के कार्यों का योग;

एन- अवलोकनों की संख्या।

मैनुअल गणना के मामले में बड़ी संख्या में टिप्पणियों के साथ, क्षणों की विधि का उपयोग किया जा सकता है।

अंकगणितीय माध्य में निम्नलिखित गुण होते हैं:

माध्य से भिन्न के विचलन का योग ( Σ डी ) शून्य के बराबर है (तालिका 15 देखें);

· जब सभी विकल्पों को एक ही कारक (भाजक) से गुणा (विभाजित) किया जाता है, तो अंकगणितीय माध्य को उसी कारक (भाजक) से गुणा (विभाजित) किया जाता है;

· यदि आप सभी विकल्पों में एक ही संख्या को जोड़ते (घटाना) करते हैं, तो अंकगणितीय माध्य उसी संख्या से बढ़ता (घटता) है।

अंकगणितीय माध्य मान, स्वयं द्वारा लिए गए, उस श्रृंखला की परिवर्तनशीलता को ध्यान में रखे बिना, जिससे उनकी गणना की जाती है, वे भिन्नता श्रृंखला के गुणों को पूरी तरह से प्रतिबिंबित नहीं कर सकते हैं, खासकर जब अन्य औसत के साथ तुलना आवश्यक हो। औसत जो मूल्य के करीब हैं, श्रृंखला से बिखरने की अलग-अलग डिग्री के साथ प्राप्त किए जा सकते हैं। व्यक्तिगत विकल्प अपनी मात्रात्मक विशेषताओं के संदर्भ में एक दूसरे के जितने करीब होंगे, उतना ही कम फैलाव (दोलन, परिवर्तनशीलता)पंक्ति, अधिक विशिष्ट इसका औसत।

मुख्य पैरामीटर जो हमें विशेषता की परिवर्तनशीलता का आकलन करने की अनुमति देते हैं:

· स्वाइप करें;

· आयाम;

· मानक विचलन;

· भिन्नता का गुणांक।

विशेषता की अनुमानित परिवर्तनशीलता को भिन्नता श्रृंखला की सीमा और आयाम से आंका जा सकता है। स्विंग पंक्ति में अधिकतम (वी अधिकतम) और न्यूनतम (वी मिनट) विकल्पों को इंगित करता है। आयाम (ए एम) इन विकल्पों के बीच का अंतर है: ए एम = वी अधिकतम - वी मिनट।

भिन्नता श्रृंखला की परिवर्तनशीलता के मुख्य, आम तौर पर स्वीकृत उपाय हैं: फैलाव (डी ) लेकिन सबसे अधिक इस्तेमाल किया जाने वाला एक अधिक सुविधाजनक पैरामीटर है जो विचरण के आधार पर गणना की जाती है - मानक विचलन ( σ ) यह विचलन की मात्रा को ध्यान में रखता है ( डी ) इसके अंकगणितीय माध्य से भिन्नता श्रृंखला का प्रत्येक प्रकार ( डी = वी - एम ).

चूँकि माध्य से भिन्न का विचलन धनात्मक और ऋणात्मक हो सकता है, इसलिए जब उन्हें संक्षेप में प्रस्तुत किया जाता है तो वे "0" (S) मान देते हैं। डी = 0) इससे बचने के लिए, विचलन मान ( डी) दूसरी शक्ति तक बढ़ाए जाते हैं और औसत होते हैं। इस प्रकार, भिन्नता श्रृंखला का प्रसरण अंकगणित माध्य से भिन्न के विचलन का माध्य वर्ग है और इसकी गणना सूत्र द्वारा की जाती है:

यह परिवर्तनशीलता की सबसे महत्वपूर्ण विशेषता है और इसका उपयोग कई सांख्यिकीय मानदंडों की गणना के लिए किया जाता है।

चूंकि विचरण को विचलन के वर्ग में व्यक्त किया जाता है, इसलिए इसके मान का उपयोग अंकगणितीय माध्य की तुलना में नहीं किया जा सकता है। इन उद्देश्यों के लिए, इसे लागू किया जाता है मानक विचलन, जिसे "सिग्मा" चिह्न द्वारा दर्शाया गया है ( σ ) यह एक ही इकाइयों में अंकगणितीय माध्य से भिन्नता श्रृंखला के सभी रूपों के औसत विचलन की विशेषता है, इसलिए उन्हें एक साथ उपयोग किया जा सकता है।

मानक विचलन सूत्र द्वारा निर्धारित किया जाता है:

संकेतित सूत्र तब लागू होता है जब प्रेक्षणों की संख्या ( एन ) 30 से बड़ा है। छोटी संख्या के लिए एन मानक विचलन के मान में गणितीय पूर्वाग्रह से जुड़ी एक त्रुटि होगी ( एन - एक)। इस संबंध में, मानक विचलन की गणना के लिए सूत्र में इस तरह के पूर्वाग्रह को ध्यान में रखते हुए अधिक सटीक परिणाम प्राप्त किया जा सकता है:

मानक विचलन (एस ) एक यादृच्छिक चर के मानक विचलन का अनुमान है एक्सइसके विचरण के निष्पक्ष अनुमान के आधार पर इसकी गणितीय अपेक्षा के सापेक्ष।

मूल्यों के साथ एन > 30 मानक विचलन ( σ ) और मानक विचलन ( एस ) एक ही हो जाएगा ( = एस ). इसलिए, अधिकांश व्यावहारिक मैनुअल में, इन मानदंडों को अस्पष्ट माना जाता है।एक्सेल में, मानक विचलन की गणना फ़ंक्शन = एसटीडीईवी (रेंज) द्वारा की जा सकती है। और मानक विचलन की गणना करने के लिए, आपको एक उपयुक्त सूत्र बनाने की आवश्यकता है।

मूल माध्य वर्ग या मानक विचलन आपको यह निर्धारित करने की अनुमति देता है कि किसी विशेषता के मान माध्य से कितने भिन्न हो सकते हैं। मान लीजिए कि गर्मियों के दौरान एक ही औसत दिन के तापमान वाले दो शहर हैं। इनमें से एक शहर तट पर और दूसरा महाद्वीप पर स्थित है। यह ज्ञात है कि तट पर स्थित शहरों में, दिन के तापमान में अंतर महाद्वीप के आंतरिक भाग में स्थित शहरों की तुलना में कम है। इसलिए, तटीय शहर के लिए दिन के तापमान का मानक विचलन दूसरे शहर की तुलना में कम होगा। व्यवहार में, इसका मतलब यह है कि महाद्वीप पर स्थित एक शहर में प्रत्येक विशिष्ट दिन के लिए औसत हवा का तापमान तट पर एक शहर की तुलना में औसत मूल्य से अधिक भिन्न होगा। इसके अलावा, मानक विचलन औसत से तापमान के संभावित विचलन का अनुमान लगाने के लिए आवश्यक स्तर की संभावना के साथ संभव बनाता है।

संभाव्यता के सिद्धांत के अनुसार, सामान्य वितरण कानून का पालन करने वाली घटनाओं में, अंकगणितीय माध्य, मानक विचलन और विकल्पों के मूल्यों के बीच एक सख्त संबंध है ( तीन सिग्मा नियम) उदाहरण के लिए, चर विशेषता के 68.3% मान M ± 1 . की सीमा के भीतर हैं σ , 95.5% - एम ± 2 . के भीतर σ और 99.7% - एम ± 3 . के भीतर σ .

मानक विचलन का मान हमें भिन्नता श्रृंखला और अध्ययन किए गए समूह की एकरूपता की प्रकृति का न्याय करने की अनुमति देता है। यदि मानक विचलन का मान छोटा है, तो यह अध्ययन के तहत घटना की पर्याप्त उच्च समरूपता को इंगित करता है। इस मामले में, अंकगणितीय माध्य को दी गई भिन्नता श्रृंखला की काफी विशेषता के रूप में पहचाना जाना चाहिए। हालांकि, बहुत कम सिग्मा मान किसी को प्रेक्षणों के कृत्रिम चयन के बारे में सोचने पर मजबूर कर देता है। एक बहुत बड़े सिग्मा के साथ, अंकगणितीय माध्य भिन्नता श्रृंखला को कुछ हद तक दर्शाता है, जो अध्ययन किए गए गुण या घटना की महत्वपूर्ण परिवर्तनशीलता या अध्ययन किए गए समूह की विविधता को इंगित करता है। हालांकि, मानक विचलन के मूल्य की तुलना केवल उसी आयाम की विशेषताओं के लिए संभव है। दरअसल, अगर हम नवजात शिशुओं और वयस्कों के बीच वजन की विविधता की तुलना करते हैं, तो हमें वयस्कों में हमेशा उच्च सिग्मा मान मिलते हैं।

विभिन्न आयामों की विशेषताओं की परिवर्तनशीलता की तुलना का उपयोग करके किया जा सकता है गुणांक का परिवर्तन... यह विविधता को औसत के प्रतिशत के रूप में व्यक्त करता है, जो विभिन्न लक्षणों की तुलना की अनुमति देता है। चिकित्सा साहित्य में भिन्नता का गुणांक संकेत द्वारा दर्शाया गया है " साथ ", और गणितीय में" वी"और सूत्र द्वारा गणना की गई:

10% से कम भिन्नता के गुणांक के मान एक छोटे से बिखरने का संकेत देते हैं, 10 से 20% तक - औसत के बारे में, 20% से अधिक - अंकगणितीय माध्य के आसपास एक मजबूत बिखरने वाले संस्करण के बारे में।

अंकगणित माध्य, एक नियम के रूप में, नमूना जनसंख्या के आंकड़ों के आधार पर गणना की जाती है। बार-बार अध्ययन के साथ, यादृच्छिक घटनाओं के प्रभाव में, अंकगणितीय माध्य बदल सकता है। यह इस तथ्य के कारण है कि, एक नियम के रूप में, संभावित अवलोकन इकाइयों का केवल एक हिस्सा, यानी नमूना आबादी की जांच की जाती है। अध्ययन के तहत घटना का प्रतिनिधित्व करने वाली सभी संभावित इकाइयों के बारे में जानकारी पूरी सामान्य आबादी का अध्ययन करके प्राप्त की जा सकती है, जो हमेशा संभव नहीं होती है। इसी समय, प्रयोगात्मक डेटा को सामान्य बनाने के लिए, सामान्य आबादी में औसत का मूल्य रुचि का है। इसलिए, अध्ययन के तहत घटना के बारे में एक सामान्य निष्कर्ष तैयार करने के लिए, नमूना आबादी के आधार पर प्राप्त परिणामों को सांख्यिकीय विधियों द्वारा सामान्य आबादी में स्थानांतरित किया जाना चाहिए।

नमूना अध्ययन और सामान्य आबादी के बीच संयोग की डिग्री निर्धारित करने के लिए, नमूना अवलोकन में अनिवार्य रूप से होने वाली त्रुटि के परिमाण का अनुमान लगाना आवश्यक है। इस त्रुटि को कहा जाता है " प्रतिनिधित्व की त्रुटि"या" अंकगणित माध्य की औसत त्रुटि। " वास्तव में, यह चयनात्मक सांख्यिकीय अवलोकन के दौरान प्राप्त औसत और समान मूल्यों के बीच का अंतर है जो एक ही वस्तु के निरंतर अध्ययन के दौरान प्राप्त होगा, अर्थात। सामान्य जनसंख्या का अध्ययन करते समय। चूंकि नमूना माध्य एक यादृच्छिक चर है, इसलिए ऐसा पूर्वानुमान शोधकर्ता के लिए स्वीकार्य स्तर की संभावना के साथ किया जाता है। चिकित्सा अनुसंधान में, यह कम से कम 95% है।

प्रतिनिधित्व की त्रुटि को पंजीकरण की त्रुटियों या ध्यान की त्रुटियों (लिपिकीय त्रुटियों, गलत गणना, टाइपो इत्यादि) के साथ भ्रमित नहीं किया जाना चाहिए, जिसे प्रयोग में उपयोग की जाने वाली पर्याप्त तकनीक और उपकरणों द्वारा कम किया जाना चाहिए।

प्रतिनिधित्व त्रुटि का परिमाण नमूना आकार और विशेषता की परिवर्तनशीलता दोनों पर निर्भर करता है। प्रेक्षणों की संख्या जितनी अधिक होगी, प्रतिदर्श सामान्य जनसंख्या के उतना ही निकट होगा और त्रुटि उतनी ही कम होगी। विशेषता जितनी अधिक अस्थिर होगी, सांख्यिकीय त्रुटि का परिमाण उतना ही अधिक होगा।

व्यवहार में, विविधताओं की श्रृंखला में प्रतिनिधित्व की त्रुटि को निर्धारित करने के लिए निम्न सूत्र का उपयोग किया जाता है:

कहाँ पे: एम - प्रतिनिधित्व की त्रुटि;

σ - मानक विचलन;

एन- नमूने में टिप्पणियों की संख्या।

यह सूत्र से देखा जा सकता है कि माध्य त्रुटि का आकार मानक विचलन के सीधे आनुपातिक है, अर्थात, अध्ययन के तहत विशेषता की परिवर्तनशीलता, और अवलोकनों की संख्या के वर्गमूल के व्युत्क्रमानुपाती है।

सापेक्ष मूल्यों की गणना के आधार पर सांख्यिकीय विश्लेषण करते समय, भिन्नता श्रृंखला का निर्माण वैकल्पिक होता है। इस मामले में, सापेक्ष संकेतकों के लिए औसत त्रुटि का निर्धारण एक सरलीकृत सूत्र का उपयोग करके किया जा सकता है:

कहाँ पे: आर- सापेक्ष संकेतक का मूल्य, प्रतिशत, पीपीएम, आदि के रूप में व्यक्त किया गया;

क्यू- पी का व्युत्क्रम और (1-पी), (100-पी), (1000-पी), आदि के रूप में व्यक्त किया जाता है, जिसके आधार पर संकेतक की गणना की जाती है;

एन- नमूने में टिप्पणियों की संख्या।

हालांकि, सापेक्ष मूल्यों के लिए प्रतिनिधित्व त्रुटि की गणना के लिए संकेतित सूत्र केवल तभी लागू किया जा सकता है जब संकेतक मूल्य उसके आधार से कम हो। गहन संकेतकों की गणना के कुछ मामलों में, ऐसी स्थिति पूरी नहीं होती है, और संकेतक को 100% या 1000% से अधिक की संख्या के रूप में व्यक्त किया जा सकता है। ऐसी स्थिति में, एक भिन्नता श्रृंखला का निर्माण किया जाता है और मानक विचलन के आधार पर माध्य मानों के सूत्र का उपयोग करके प्रतिनिधित्व त्रुटि की गणना की जाती है।

सामान्य जनसंख्या में अंकगणितीय माध्य के मूल्य का पूर्वानुमान दो मूल्यों के संकेत के साथ किया जाता है - न्यूनतम और अधिकतम। संभावित विचलन के ये चरम मूल्य, जिसके भीतर सामान्य जनसंख्या के मांगे गए औसत मूल्य में उतार-चढ़ाव हो सकता है, कहलाते हैं " आत्मविश्वास की सीमा».

संभाव्यता के सिद्धांत के अभिधारणाओं ने साबित कर दिया कि 99.7% की संभावना के साथ एक विशेषता के सामान्य वितरण के साथ, माध्य के विचलन के चरम मूल्य प्रतिनिधित्व की त्रुटि के तीन गुना के मूल्य से अधिक नहीं होंगे ( एम ± 3 एम ); 95.5% में - माध्य की दोगुनी माध्य त्रुटि से अधिक नहीं ( एम ± 2 एम ); 68.3% में - एक से अधिक औसत त्रुटि नहीं ( एम ± 1 एम ) (अंजीर। 9)।

पी%

चावल। 9. सामान्य वितरण की संभावना घनत्व।

ध्यान दें कि उपरोक्त कथन केवल उस विशेषता के लिए मान्य है जो सामान्य गाऊसी वितरण का पालन करता है।

चिकित्सा के क्षेत्र में अधिकांश प्रायोगिक अनुसंधान, माप के साथ जुड़े हुए हैं, जिसके परिणाम किसी दिए गए अंतराल में लगभग कोई भी मूल्य ले सकते हैं, इसलिए, एक नियम के रूप में, उन्हें निरंतर यादृच्छिक चर के एक मॉडल द्वारा वर्णित किया जाता है। इस संबंध में, अधिकांश सांख्यिकीय विधियां निरंतर वितरण पर विचार करती हैं। इनमें से एक वितरण, जिसकी गणितीय आँकड़ों में मौलिक भूमिका है, है सामान्य, या गाऊसी, वितरण.

इसके कई कारण हैं।

1. सबसे पहले, सामान्य वितरण का उपयोग करके कई प्रयोगात्मक अवलोकनों का सफलतापूर्वक वर्णन किया जा सकता है। यह तुरंत ध्यान दिया जाना चाहिए कि अनुभवजन्य डेटा का कोई वितरण नहीं है जो बिल्कुल सामान्य है, क्योंकि सामान्य रूप से वितरित यादृच्छिक चर पर्वतमाला से लेकर, जो व्यवहार में कभी नहीं होता है। हालांकि, सामान्य वितरण अक्सर एक अच्छा सन्निकटन होता है।

क्या मानव शरीर के वजन, ऊंचाई और अन्य शारीरिक मापदंडों का मापन किया जाता है - हर जगह परिणाम बहुत बड़ी संख्या में यादृच्छिक कारकों (प्राकृतिक कारणों और माप त्रुटियों) से प्रभावित होते हैं। इसके अलावा, एक नियम के रूप में, इनमें से प्रत्येक कारक का प्रभाव नगण्य है। अनुभव से पता चलता है कि ऐसे मामलों में परिणाम लगभग सामान्य रूप से वितरित किए जाएंगे।

2. यादृच्छिक नमूने से जुड़े कई वितरण, बाद के आकार में वृद्धि के साथ, सामान्य में बदल जाते हैं।

3. सामान्य वितरण अन्य निरंतर वितरण (उदाहरण के लिए, असममित) के अनुमानित विवरण के रूप में उपयुक्त है।

4. सामान्य वितरण में कई अनुकूल गणितीय गुण होते हैं, जो बड़े पैमाने पर आंकड़ों में इसका व्यापक उपयोग सुनिश्चित करते हैं।

साथ ही, यह ध्यान दिया जाना चाहिए कि चिकित्सा डेटा में कई प्रयोगात्मक वितरण हैं जिन्हें सामान्य वितरण मॉडल द्वारा वर्णित नहीं किया जा सकता है। इसके लिए आँकड़ों ने ऐसी विधियाँ विकसित की हैं जिन्हें सामान्यतः "नॉनपैरामीट्रिक" कहा जाता है।

किसी विशेष प्रयोग के डेटा को संसाधित करने के लिए उपयुक्त सांख्यिकीय पद्धति का चुनाव इस आधार पर किया जाना चाहिए कि प्राप्त डेटा सामान्य वितरण कानून से संबंधित है या नहीं। सामान्य वितरण कानून के लिए सुविधा की अधीनता के लिए परिकल्पना का परीक्षण आवृत्ति वितरण (ग्राफ) के हिस्टोग्राम के साथ-साथ कई सांख्यिकीय मानदंडों का उपयोग करके किया जाता है। उनमें से:

विषमता मानदंड ( बी );

कर्टोसिस की जांच के लिए मानदंड ( जी );

शापिरो - विल्क्स मानदंड ( वू ) .

डेटा के वितरण की प्रकृति का विश्लेषण (इसे सामान्य वितरण के लिए चेक भी कहा जाता है) प्रत्येक पैरामीटर के लिए किया जाता है। सामान्य कानून के लिए पैरामीटर के वितरण के पत्राचार का आत्मविश्वास से न्याय करने के लिए, पर्याप्त रूप से बड़ी संख्या में अवलोकन इकाइयों (कम से कम 30 मान) की आवश्यकता होती है।

एक सामान्य वितरण के लिए, तिरछापन और कर्टोसिस के मानदंड 0 का मान लेते हैं। यदि वितरण को दाईं ओर स्थानांतरित किया जाता है बी > 0 (सकारात्मक विषमता), के लिए बी < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона जी = 0. पर जी > 0, वितरण वक्र तेज होता है यदि जी < 0 пик более сглаженный, чем функция нормального распределения.

शापिरो-विल्क्स परीक्षण के अनुसार सामान्यता की जांच करने के लिए, आवश्यक स्तर पर महत्व के स्तर पर और अवलोकन इकाइयों (स्वतंत्रता की डिग्री) के आधार पर सांख्यिकीय तालिकाओं का उपयोग करके इस मानदंड का मूल्य खोजना आवश्यक है। परिशिष्ट 1. इस मानदंड के छोटे मूल्यों पर सामान्यता की परिकल्पना को एक नियम के रूप में खारिज कर दिया जाता है वू <0,8.

सांख्यिकीय वितरण श्रृंखला- यह एक निश्चित भिन्न विशेषता के अनुसार समूहों में जनसंख्या की इकाइयों का एक क्रमबद्ध वितरण है।
वितरण श्रृंखला के निर्माण में अंतर्निहित विशेषता के आधार पर, वहाँ हैं वितरण की विशेषता और भिन्नता श्रृंखला.

एक सामान्य विशेषता की उपस्थिति एक सांख्यिकीय आबादी के गठन का आधार है, जो अनुसंधान की वस्तुओं की सामान्य विशेषताओं के विवरण या माप का परिणाम है।

आंकड़ों में अध्ययन का विषय बदल रहा है (अलग-अलग) संकेत या सांख्यिकीय संकेत।

सांख्यिकीय संकेतों के प्रकार.

वितरण श्रृंखला को गुणकारी कहा जाता हैगुणवत्ता मानदंड के आधार पर। ठहरावएक संकेत है जिसका एक नाम है (उदाहरण के लिए, पेशा: सीमस्ट्रेस, शिक्षक, आदि)।
तालिकाओं के रूप में कई वितरणों को व्यवस्थित करने की प्रथा है। टेबल 2.8 वितरण की जिम्मेदार श्रृंखला को दर्शाता है।
तालिका 2.8 - रूसी संघ के क्षेत्रों में से एक के नागरिकों को वकीलों द्वारा प्रदान की जाने वाली कानूनी सहायता के प्रकारों का वितरण।

परिवर्तनशील श्रृंखलाविशेषता के मान (या मानों के अंतराल) और उनकी आवृत्तियाँ हैं।
वितरण श्रृंखला को भिन्नता श्रृंखला कहा जाता हैमात्रात्मक आधार पर निर्मित। किसी भी भिन्नता श्रृंखला में दो तत्व होते हैं: विकल्प और आवृत्तियाँ।
वैरिएंट को उस विशेषता के व्यक्तिगत मान माना जाता है जो इसे भिन्नता श्रृंखला में लेता है।
फ़्रीक्वेंसी अलग-अलग वेरिएंट या विविधता श्रृंखला के प्रत्येक समूह की संख्या है, अर्थात। ये संख्याएँ दर्शाती हैं कि वितरण श्रृंखला में एक या दूसरा संस्करण कितनी बार आता है। सभी आवृत्तियों का योग संपूर्ण जनसंख्या की संख्या, इसकी मात्रा निर्धारित करता है।
फ़्रीक्वेंसी एक के अंशों में या कुल के प्रतिशत के रूप में व्यक्त की जाने वाली आवृत्तियाँ हैं। तदनुसार, आवृत्तियों का योग 1 या 100% है। विविधताओं की श्रृंखला हमें वास्तविक डेटा का उपयोग करके वितरण कानून के आकार का अनुमान लगाने की अनुमति देती है।

विशेषता की भिन्नता की प्रकृति के आधार पर, उन्हें प्रतिष्ठित किया जाता है असतत और अंतराल भिन्नता श्रृंखला.
असतत भिन्नता श्रृंखला का एक उदाहरण तालिका में दिया गया है। 2.9.
तालिका 2.9 - रूसी संघ में 1989 में व्यक्तिगत अपार्टमेंट में कब्जे वाले कमरों की संख्या से परिवारों का वितरण।

तालिका का पहला कॉलम असतत भिन्नता श्रृंखला के वेरिएंट दिखाता है, दूसरा - भिन्नता श्रृंखला की आवृत्तियां, तीसरा - आवृत्ति संकेतक।

परिवर्तनशील श्रृंखला

सामान्य जनसंख्या में, एक निश्चित मात्रात्मक विशेषता की जांच की जा रही है। आयतन का एक नमूना उसमें से यादृच्छिक रूप से निकाला जाता है एन, यानी नमूने में तत्वों की संख्या है एन... सांख्यिकीय प्रसंस्करण के पहले चरण में, लेकरनमूनाकरण, अर्थात् आदेश संख्या एक्स 1, एक्स 2, ..., एक्स एनआरोही। प्रत्येक मनाया मूल्य एक्स मैंबुलाया प्रकार... आवृत्ति मैं मैंमूल्य के अवलोकनों की संख्या है एक्स मैंनमूने में। सापेक्ष आवृत्ति (आवृत्ति) मैंआवृत्ति अनुपात है मैं मैंनमूना आकार के लिए एन: .
परिवर्तन श्रृंखला का अध्ययन करते समय संचित आवृत्ति और संचित आवृत्ति की अवधारणाओं का भी उपयोग किया जाता है। होने देना एक्सकुछ संख्या। फिर विकल्पों की संख्या , जिनका मान कम है एक्स, संचित आवृत्ति कहलाती है: x i . के लिए एनअधिकतम संचित आवृत्ति w i कहलाती है।
एक विशेषता को असतत रूप से भिन्न कहा जाता है यदि उसके व्यक्तिगत मान (वेरिएंट) एक दूसरे से कुछ परिमित मान (आमतौर पर एक पूर्णांक) से भिन्न होते हैं। ऐसी विशेषता की विविधता श्रृंखला को असतत भिन्नता श्रृंखला कहा जाता है।

तालिका 1. आवृत्तियों की असतत भिन्नता श्रृंखला का सामान्य दृश्य

विशेषता मूल्यएक्स मैं एक्स 1 एक्स 2 एक्स एन
आवृत्तियोंमैं मैं एम 1 एम 2 मैं नहीं

एक विशेषता को लगातार अलग-अलग कहा जाता है यदि उसके मान एक दूसरे से मनमाने ढंग से छोटी राशि से भिन्न होते हैं, अर्थात। विशेषता एक निश्चित अंतराल में किसी भी मान को ले सकती है। ऐसी विशेषता के लिए एक सतत भिन्नता श्रृंखला को अंतराल कहा जाता है।

तालिका 2. आवृत्तियों की अंतराल भिन्नता श्रृंखला का सामान्य दृश्य

तालिका 3. भिन्नता श्रृंखला की ग्राफिक छवियां

पंक्तिबहुभुज या हिस्टोग्रामअनुभवजन्य वितरण समारोह
अलग
मध्यान्तर
टिप्पणियों के परिणामों को देखते हुए, वे निर्धारित करते हैं कि प्रत्येक विशिष्ट अंतराल में विकल्पों के कितने मूल्य गिरे। यह माना जाता है कि प्रत्येक अंतराल इसके एक छोर से संबंधित है: या तो सभी मामलों में इसे छोड़ दिया जाता है (अधिक बार), या सभी मामलों में यह सही होता है, और आवृत्तियों या आवृत्तियों में संकेतित सीमाओं में संलग्न विकल्पों की संख्या दिखाई देती है। मतभेद एक मैं - एक मैं +1आंशिक अंतराल कहलाते हैं। बाद की गणनाओं को सरल बनाने के लिए, अंतराल भिन्नता श्रृंखला को पारंपरिक रूप से असतत एक द्वारा प्रतिस्थापित किया जा सकता है। इस मामले में, औसत मूल्य मैं-वें अंतराल को एक प्रकार के रूप में लिया जाता है एक्स मैं, और इसी अंतराल आवृत्ति मैं मैं- इस अंतराल की आवृत्ति के लिए।
विविधता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए, बहुभुज, हिस्टोग्राम, संचयी वक्र और अनुभवजन्य वितरण फ़ंक्शन का सबसे अधिक उपयोग किया जाता है।

टेबल 2.3 (अप्रैल 1994 में औसत प्रति व्यक्ति आय के आधार पर रूस की जनसंख्या का समूहन) प्रस्तुत किया गया है अंतराल भिन्नता श्रृंखला.
एक ग्राफिक छवि की मदद से वितरण श्रृंखला का विश्लेषण करना सुविधाजनक है, जिससे वितरण के आकार का न्याय करना संभव हो जाता है। परिवर्तन श्रृंखला की आवृत्तियों में परिवर्तन की प्रकृति का एक स्पष्ट विचार किसके द्वारा दिया गया है बहुभुज और हिस्टोग्राम.
असतत भिन्नता श्रृंखला प्रदर्शित करते समय बहुभुज का उपयोग किया जाता है.
आइए, उदाहरण के लिए, अपार्टमेंट के प्रकार (तालिका 2.10) द्वारा आवास स्टॉक के वितरण को ग्राफिक रूप से चित्रित करें।
तालिका 2.10 - अपार्टमेंट के प्रकार (मनमाना संख्या) द्वारा शहरी क्षेत्र के आवास स्टॉक का वितरण।


चावल। आवास स्टॉक आवंटन बहुभुज


निर्देशांक अक्ष पर, न केवल आवृत्तियों के मान, बल्कि भिन्नता श्रृंखला की आवृत्तियों को भी प्लॉट किया जा सकता है।
अंतराल भिन्नता श्रृंखला की छवि के लिए हिस्टोग्राम लिया जाता है... हिस्टोग्राम का निर्माण करते समय, अंतराल के मूल्यों को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और आवृत्तियों को संबंधित अंतराल पर निर्मित आयतों द्वारा दर्शाया जाता है। समान दूरी के मामले में सलाखों की ऊंचाई आवृत्तियों के समानुपाती होनी चाहिए। एक हिस्टोग्राम एक ग्राफ होता है जिसमें एक श्रृंखला को एक दूसरे से सटे बार के रूप में दिखाया जाता है।
आइए तालिका में दी गई अंतराल वितरण श्रृंखला को आलेखीय रूप से चित्रित करें। 2.11.
तालिका 2.11 - प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों का वितरण (मनमाना संख्या)।
एन पी / पी प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों के समूह रहने की जगह के दिए गए आकार वाले परिवारों की संख्या परिवारों की संचित संख्या
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
कुल 115 ----


चावल। 2.2. प्रति व्यक्ति रहने की जगह के आकार से परिवारों के वितरण का हिस्टोग्राम


संचित श्रृंखला (तालिका 2.11) के डेटा का उपयोग करके, हम निर्माण करते हैं संचयी वितरण।


चावल। 2.3. प्रति व्यक्ति रहने की जगह द्वारा परिवारों का संचयी वितरण


संचयी के रूप में भिन्नता श्रृंखला का प्रतिनिधित्व भिन्नता श्रृंखला के लिए विशेष रूप से प्रभावी है, जिसकी आवृत्तियों को अंशों या प्रतिशत में श्रृंखला की आवृत्तियों के योग के रूप में व्यक्त किया जाता है।
यदि हम संचयन के रूप में भिन्नता श्रृंखला को रेखांकन करते हुए अक्षों को बदलते हैं, तो हम प्राप्त करते हैं औजाइव... अंजीर में। 2.4 तालिका में डेटा के आधार पर निर्मित तोरण को दर्शाता है। 2.11.
आयतों की भुजाओं के मध्य बिंदुओं को ढूंढकर और फिर इन बिंदुओं को सीधी रेखाओं से जोड़कर एक हिस्टोग्राम को वितरण बहुभुज में परिवर्तित किया जा सकता है। परिणामी वितरण बहुभुज अंजीर में दिखाया गया है। 2.2 एक बिंदीदार रेखा के साथ।
समन्वय अक्ष के साथ असमान अंतराल के साथ भिन्नता श्रृंखला के वितरण के हिस्टोग्राम का निर्माण करते समय, आवृत्तियों को प्लॉट नहीं किया जाता है, लेकिन इसी अंतराल में सुविधा वितरण का घनत्व।
वितरण घनत्व प्रति इकाई अंतराल चौड़ाई की गणना की गई आवृत्ति है, अर्थात। प्रत्येक समूह में कितनी इकाइयाँ अंतराल की इकाई पर पड़ती हैं। वितरण घनत्व की गणना का एक उदाहरण तालिका में प्रस्तुत किया गया है। 2.12.
तालिका 2.12 - कर्मचारियों की संख्या (सशर्त संख्या) द्वारा उद्यमों का वितरण
एन पी / पी कर्मचारियों, लोगों की संख्या से उद्यमों के समूह उद्यमों की संख्या अंतराल का आकार, व्यक्ति वितरण घनत्व
1 2 3=1/2
1 20 तक 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
कुल 147 ---- ----

भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए भी इस्तेमाल किया जा सकता है संचयी वक्र... क्यूम्युलेट्स (योग वक्र) की मदद से संचित आवृत्तियों की एक श्रृंखला प्रदर्शित होती है। संचित आवृत्तियों को समूहों द्वारा आवृत्तियों को क्रमिक रूप से जोड़कर निर्धारित किया जाता है और यह दर्शाता है कि जनसंख्या की कितनी इकाइयों का एक विशिष्ट मान माना गया मान से अधिक नहीं है।


चावल। 2.4. प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों के वितरण की सीमा

अंतराल भिन्नता श्रृंखला के संचयी का निर्माण करते समय, श्रृंखला के वेरिएंट को एब्सिस्सा अक्ष के साथ प्लॉट किया जाता है, और संचित आवृत्तियों को ऑर्डिनेट अक्ष के साथ प्लॉट किया जाता है।

निरंतर भिन्नता श्रृंखला

निरंतर भिन्नता श्रृंखला एक मात्रात्मक सांख्यिकीय विशेषता के आधार पर निर्मित एक श्रृंखला है। एक उदाहरण। चालू वर्ष में शरद-सर्दियों की अवधि में दोषियों (प्रति व्यक्ति दिन) की बीमारी की औसत अवधि थी:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5
इसे साझा करें