The IGNOU BPC-004 Solved Question Paper PDF Download page is designed to help students access high-quality exam resources in one place. Here, you can find ignou solved question paper IGNOU Previous Year Question paper solved PDF that covers all important questions with detailed answers. This page provides IGNOU all Previous year Question Papers in one PDF format, making it easier for students to prepare effectively.
- IGNOU BPC-004 Solved Question Paper in Hindi
- IGNOU BPC-004 Solved Question Paper in English
- IGNOU Previous Year Solved Question Papers (All Courses)
Whether you are looking for IGNOU Previous Year Question paper solved in English or ignou previous year question paper solved in hindi, this page offers both options to suit your learning needs. These solved papers help you understand exam patterns, improve answer writing skills, and boost confidence for upcoming exams.
IGNOU BPC-004 Solved Question Paper PDF

This section provides IGNOU BPC-004 Solved Question Paper PDF in both Hindi and English. These ignou solved question paper IGNOU Previous Year Question paper solved PDF include detailed answers to help you understand exam patterns and improve your preparation. You can also access IGNOU all Previous year Question Papers in one PDF for quick and effective revision before exams.
IGNOU BPC-004 Previous Year Solved Question Paper in Hindi
Q1. केंद्रीय प्रवृत्ति के मापों के अर्थ और इसके कार्यों की व्याख्या कीजिए। 4+6
Ans.
केंद्रीय प्रवृत्ति के मापों का अर्थ केंद्रीय प्रवृत्ति के माप, या औसत, एक एकल मान है जो डेटा के एक सेट का वर्णन करने का प्रयास करता है। यह डेटा के केंद्र या विशिष्ट मान की पहचान करके ऐसा करता है। यह एक संक्षिप्त आँकड़ा है जो स्कोर के वितरण के केंद्र का प्रतिनिधित्व करता है। संक्षेप में, यह एक ऐसा मान है जो डेटा सेट में “सबसे विशिष्ट” या “सबसे प्रतिनिधि” होता है। मनोविज्ञान और अन्य क्षेत्रों में, इसका उपयोग बड़ी मात्रा में डेटा को एक सार्थक और आसानी से समझने योग्य संख्या में सारांशित करने के लिए किया जाता है।
केंद्रीय प्रवृत्ति के तीन मुख्य माप हैं:
- माध्य (Mean): यह सबसे सामान्य माप है, जिसकी गणना सभी मानों को जोड़कर और फिर मानों की संख्या से विभाजित करके की जाती है।
- माध्यिका (Median): यह मध्य मान है जब डेटा सेट को क्रम में व्यवस्थित किया जाता है। यह डेटा को दो बराबर हिस्सों में विभाजित करता है।
- बहुलक (Mode): यह वह मान है जो डेटा सेट में सबसे अधिक बार आता है।
सही माप का चुनाव डेटा के प्रकार (नाममात्र, क्रमिक, अंतराल, अनुपात) और वितरण के आकार पर निर्भर करता है।
केंद्रीय प्रवृत्ति के मापों के कार्य केंद्रीय प्रवृत्ति के मापों के कई महत्वपूर्ण कार्य हैं:
- डेटा का सारांश: इसका सबसे महत्वपूर्ण कार्य बड़ी मात्रा में डेटा को एक प्रतिनिधि मान में संघनित करना है। उदाहरण के लिए, 100 छात्रों के परीक्षा अंकों को देखने के बजाय, हम समूह के प्रदर्शन को समझने के लिए औसत अंक (माध्य) को देख सकते हैं।
- समूहों की तुलना: ये माप हमें विभिन्न समूहों की तुलना करने की अनुमति देते हैं। उदाहरण के लिए, एक शोधकर्ता दो अलग-अलग शिक्षण विधियों का उपयोग करके पढ़ाए गए दो छात्र समूहों के औसत परीक्षा अंकों की तुलना कर सकता है ताकि यह निर्धारित किया जा सके कि कौन सी विधि अधिक प्रभावी है।
- एक व्यक्ति के प्रदर्शन का मूल्यांकन: समूह के औसत के संबंध में एक व्यक्ति के स्कोर को देखकर, हम उनके प्रदर्शन का मूल्यांकन कर सकते हैं। यदि कोई छात्र औसत से काफी ऊपर स्कोर करता है, तो उसे अच्छा प्रदर्शन करने वाला माना जाता है।
- आनुमानिक सांख्यिकी के लिए आधार: केंद्रीय प्रवृत्ति के माप, विशेष रूप से माध्य, कई आनुमानिक सांख्यिकीय परीक्षणों (जैसे टी-टेस्ट, एनोवा) के लिए आधार बनाते हैं। ये परीक्षण नमूनों के माध्य की तुलना करके आबादी के बारे में अनुमान लगाते हैं।
- विषमता का संकेत: माध्य, माध्यिका और बहुलक के बीच संबंध डेटा के वितरण के आकार (विषमता) के बारे में जानकारी प्रदान करता है। एक सामान्य वितरण में, ये तीनों मान समान होते हैं। एक सकारात्मक विषम वितरण में, माध्य > माध्यिका > बहुलक; एक नकारात्मक विषम वितरण में, माध्य < माध्यिका < बहुलक।
- डेटा को संक्षिप्त विवरण प्रदान करना: यह पूरे डेटा सेट का एक संक्षिप्त और त्वरित अवलोकन प्रदान करता है, जिससे गैर-विशेषज्ञों के लिए भी जानकारी को समझना आसान हो जाता है। यह निर्णय लेने और आगे के विश्लेषण के लिए एक महत्वपूर्ण उपकरण है।
Q2. विचरणशीलता के मापों के प्रकारों की व्याख्या कीजिए, चतुर्थक विचलन और औसत विचलन के गुणों और सीमाओं पर प्रकाश डालिए। 6+4
Ans.
विचरणशीलता के मापों के प्रकार विचरणशीलता के माप (या प्रसरण के माप) बताते हैं कि डेटा सेट में स्कोर एक दूसरे से और केंद्रीय प्रवृत्ति के माप से कितने भिन्न या फैले हुए हैं। जबकि केंद्रीय प्रवृत्ति का माप डेटा के केंद्र बिंदु का वर्णन करता है, विचरणशीलता का माप अंकों के फैलाव का वर्णन करता है।
विचरणशीलता के मुख्य प्रकार हैं:
- परास (Range): यह सबसे सरल माप है, जिसकी गणना उच्चतम स्कोर से निम्नतम स्कोर को घटाकर की जाती है। यह केवल दो चरम मानों पर विचार करता है।
- चतुर्थक विचलन (Quartile Deviation – QD): इसे अर्ध-अंतश्चतुर्थक परास के रूप में भी जाना जाता है। यह तीसरे चतुर्थक (Q3) और पहले चतुर्थक (Q1) के बीच के अंतर का आधा है। सूत्र है: QD = (Q3 – Q1) / 2। यह वितरण के मध्य 50% अंकों के फैलाव को मापता है।
- औसत विचलन (Average Deviation – AD): इसे माध्य विचलन भी कहा जाता है। यह माध्य या माध्यिका से अंकों के विचलनों का औसत है, जिसमें बीजगणितीय संकेतों (प्लस या माइनस) को नजरअंदाज किया जाता है। सूत्र है: AD = Σ|X – M| / N, जहाँ M माध्य या माध्यिका है।
- मानक विचलन (Standard Deviation – SD): यह विचरणशीलता का सबसे व्यापक रूप से इस्तेमाल किया जाने वाला और स्थिर माप है। यह माध्य से अंकों के औसत विचलन का प्रतिनिधित्व करता है। इसकी गणना प्रसरण (variance) के वर्गमूल के रूप में की जाती है।
चतुर्थक विचलन (QD) के गुण और सीमाएँ
गुण:
- यह चरम मानों (outliers) से प्रभावित नहीं होता है क्योंकि यह डेटा के मध्य 50% पर आधारित होता है।
- यह खुले अंत वाले वितरणों (open-ended distributions) के लिए उपयोगी है जहाँ चरम मान ज्ञात नहीं होते हैं।
- विषम वितरणों के लिए यह परास से बेहतर माप है।
- इसकी गणना करना और समझना अपेक्षाकृत आसान है।
सीमाएँ:
- यह वितरण के सभी मानों पर आधारित नहीं है; यह केवल Q1 और Q3 पर निर्भर करता है और डेटा के 50% हिस्से को नजरअंदाज करता है।
- यह आगे के बीजगणितीय उपचार के लिए उपयुक्त नहीं है, जो इसकी सांख्यिकीय उपयोगिता को सीमित करता है।
- यह मानक विचलन की तुलना में कम स्थिर होता है क्योंकि यह नमूने से नमूने में अधिक भिन्न होता है।
औसत विचलन (AD) के गुण और सीमाएँ
गुण:
- यह चतुर्थक विचलन से बेहतर है क्योंकि यह डेटा सेट के सभी मानों को ध्यान में रखता है।
- यह समझना और गणना करना अपेक्षाकृत सरल है।
- यह चरम मानों को मानक विचलन की तुलना में कम महत्व देता है।
सीमाएँ:
- इसकी सबसे बड़ी सीमा यह है कि यह बीजगणितीय संकेतों (प्लस और माइनस) को नजरअंदाज करता है, जो एक तार्किक रूप से गैर-गणितीय प्रक्रिया है।
- संकेतों को नजरअंदाज करने के कारण, यह आगे के उन्नत सांख्यिकीय विश्लेषण (जैसे आनुमानिक सांख्यिकी) के लिए अनुपयुक्त है। इस कमी के कारण, इसे मानक विचलन की तुलना में बहुत कम उपयोग किया जाता है।
Q3. कोटि क्रम सहसंबंध के लिए शर्तों का वर्णन कीजिए। निम्नलिखित डेटा के लिए स्पीयरमैन का rho (p) की गणना कीजिए: 3+7 डेटा 1: 5, 8, 4, 7, 5, 3, 4, 9 डेटा 2: 3, 2, 6, 9, 8, 7, 8, 8
Ans.
कोटि क्रम सहसंबंध के लिए शर्तें स्पीयरमैन का कोटि क्रम सहसंबंध गुणांक, जिसे स्पीयरमैन के rho (ρ) के रूप में दर्शाया जाता है, दो चरों के बीच संबंध की ताकत और दिशा को मापने के लिए उपयोग किया जाने वाला एक गैर-पैरामीट्रिक परीक्षण है। इसका उपयोग करने के लिए कुछ शर्तें हैं:
- क्रमसूचक डेटा (Ordinal Data): स्पीयरमैन का rho विशेष रूप से तब उपयोग के लिए डिज़ाइन किया गया है जब चर कम से कम क्रमसूचक पैमाने पर मापे जाते हैं। इसका मतलब है कि डेटा को रैंक या क्रमबद्ध किया जा सकता है।
- अरैखिक संबंध (Non-linear Relationship): यदि दो चरों के बीच संबंध अरैखिक (मोनोटोनिक) है, तो पियर्सन के सहसंबंध की तुलना में स्पीयरमैन का rho अधिक उपयुक्त होता है। एक मोनोटोनिक संबंध वह है जहाँ चर एक ही दिशा में चलते हैं, लेकिन जरूरी नहीं कि एक स्थिर दर पर।
- छोटे नमूना आकार (Small Sample Size): जब नमूना आकार छोटा होता है (आमतौर पर N < 30) और डेटा सामान्य रूप से वितरित नहीं होता है, तो स्पीयरमैन का rho पियर्सन के सहसंबंध का एक मजबूत विकल्प है।
- चरम मान (Outliers): पियर्सन के सहसंबंध के विपरीत, स्पीयरमैन का rho चरम मानों से बहुत कम प्रभावित होता है क्योंकि यह वास्तविक मानों के बजाय रैंकों का उपयोग करता है।
स्पीयरमैन के rho (ρ) की गणना दिए गए डेटा के लिए स्पीयरमैन के rho की गणना करने के चरण निम्नलिखित हैं:
चरण 1: डेटा को सूचीबद्ध करें और दोनों सेटों को रैंक करें। जब समान मान होते हैं, तो हम उन्हें औसत रैंक देते हैं।
- डेटा 1 में: 4 दो बार आता है (रैंक 2 और 3)। औसत रैंक = (2+3)/2 = 2.5। 5 दो बार आता है (रैंक 4 और 5)। औसत रैंक = (4+5)/2 = 4.5।
- डेटा 2 में: 8 तीन बार आता है (रैंक 5, 6, 7)। औसत रैंक = (5+6+7)/3 = 6।
डेटा 1 (X) डेटा 2 (Y) रैंक X (R1) रैंक Y (R2) D = R1 – R2 D² 5 3 4.5 2 2.5 6.25 8 2 7 1 6 36.00 4 6 2.5 3 -0.5 0.25 7 9 6 8 -2 4.00 5 8 4.5 6 -1.5 2.25 3 7 1 4 -3 9.00 4 8 2.5 6 -3.5 12.25 9 8 8 6 2 4.00 कुल ΣD² = 74.00
चरण 2: स्पीयरमैन के rho सूत्र का उपयोग करें। सूत्र है: ρ = 1 – [6 ΣD²] / [N (N² – 1)]
यहाँ, N = 8 और ΣD² = 74.00।
ρ = 1 – [6 74] / [8 (8² – 1)] ρ = 1 – [444] / [8 (64 – 1)] ρ = 1 – [444] / [8 63] ρ = 1 – [444] / [504] ρ = 1 – 0.8809 ρ = 0.1191
उत्तर: स्पीयरमैन का rho (ρ) लगभग 0.12 है। यह दो डेटा सेटों के बीच एक बहुत कमजोर, सकारात्मक सहसंबंध का संकेत देता है।
Q4. काई-स्क्वेयर को समंजन-उत्तमता परीक्षण (goodness of fit) के रूप में समझाइए। निम्नलिखित डेटा के लिए काई-स्क्वेयर की गणना कीजिए: 3+7 लिंग: पुरुष, प्रतिक्रियाएँ: हाँ: 4, नहीं: 6
Ans.
काई-स्क्वेयर एक समंजन-उत्तमता परीक्षण के रूप में काई-स्क्वेयर (χ²) समंजन-उत्तमता परीक्षण एक गैर-पैरामीट्रिक सांख्यिकीय परिकल्पना परीक्षण है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या एक श्रेणीबद्ध चर के लिए मनाया गया आवृत्ति वितरण एक अपेक्षित आवृत्ति वितरण से भिन्न है। संक्षेप में, यह परीक्षण करता है कि नमूना डेटा “कितनी अच्छी तरह से” एक सैद्धांतिक वितरण से “फिट” होता है।
इसकी प्रक्रिया में शामिल हैं:
- परिकल्पना तैयार करना: शून्य परिकल्पना (H₀) यह बताती है कि देखे गए और अपेक्षित आवृत्तियों के बीच कोई महत्वपूर्ण अंतर नहीं है (यानी, नमूना डेटा सैद्धांतिक वितरण में फिट बैठता है)। वैकल्पिक परिकल्पना (H₁) यह बताती है कि एक महत्वपूर्ण अंतर मौजूद है।
- अपेक्षित आवृत्तियों की गणना: अपेक्षित आवृत्तियों की गणना शून्य परिकल्पना के आधार पर की जाती है। उदाहरण के लिए, यदि हम परीक्षण कर रहे हैं कि क्या एक सिक्के का उछाल निष्पक्ष है, तो हम 50% शीर्ष और 50% पुच्छ की उम्मीद करेंगे।
- काई-स्क्वेयर मान की गणना: परीक्षण सांख्यिकी की गणना सूत्र का उपयोग करके की जाती है: χ² = Σ [(O – E)² / E], जहाँ O = प्रेक्षित आवृत्ति और E = अपेक्षित आवृत्ति।
- निर्णय लेना: परिकलित χ² मान की तुलना एक निश्चित महत्व स्तर (जैसे, α = 0.05) और स्वतंत्रता की डिग्री (df) के लिए χ² वितरण तालिका से एक महत्वपूर्ण मान से की जाती है। यदि परिकलित मान महत्वपूर्ण मान से अधिक है, तो हम शून्य परिकल्पना को अस्वीकार करते हैं।
काई-स्क्वेयर की गणना दिए गए डेटा में पुरुषों की प्रतिक्रियाएँ हैं: हाँ = 4, नहीं = 6। यहाँ कुल प्रतिक्रियाएँ 10 हैं।
धारणा: चूँकि कोई अपेक्षित वितरण नहीं दिया गया है, हम समंजन-उत्तमता परीक्षण के लिए सबसे आम शून्य परिकल्पना का उपयोग करेंगे: कि प्रतिक्रियाओं के लिए कोई वरीयता नहीं है, जिसका अर्थ है कि “हाँ” और “नहीं” प्रतिक्रियाओं को समान रूप से होने की उम्मीद है (एक 50/50 विभाजन)।
चरण 1: प्रेक्षित (O) और अपेक्षित (E) आवृत्तियों को निर्धारित करें।
- कुल प्रतिक्रियाएँ (N) = 4 (हाँ) + 6 (नहीं) = 10।
- प्रेक्षित आवृत्तियाँ (O):
- हाँ = 4
- नहीं = 6
- अपेक्षित आवृत्तियाँ (E): शून्य परिकल्पना के तहत, हम उम्मीद करते हैं कि 50% हाँ कहेंगे और 50% नहीं।
- हाँ = 10 * 0.50 = 5
- नहीं = 10 * 0.50 = 5
चरण 2: काई-स्क्वेयर (χ²) मान की गणना करें। सूत्र: χ² = Σ [(O – E)² / E]
1. “हाँ” श्रेणी के लिए: (O – E)² / E = (4 – 5)² / 5 = (-1)² / 5 = 1 / 5 = 0.2
2. “नहीं” श्रेणी के लिए: (O – E)² / E = (6 – 5)² / 5 = (1)² / 5 = 1 / 5 = 0.2
3. कुल χ² मान: χ² = 0.2 + 0.2 = 0.4
चरण 3: स्वतंत्रता की डिग्री (df) की गणना करें। df = k – 1, जहाँ k श्रेणियों की संख्या है। df = 2 – 1 = 1
निष्कर्ष: परिकलित काई-स्क्वेयर मान 0.4 है। इस मान की तुलना 1 स्वतंत्रता की डिग्री के लिए एक महत्वपूर्ण χ² मान से की जाएगी (उदाहरण के लिए, α = 0.05 पर, महत्वपूर्ण मान 3.84 है)। चूँकि 0.4 < 3.84 है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं और यह निष्कर्ष निकालते हैं कि “हाँ” और “नहीं” प्रतिक्रियाओं के बीच कोई सांख्यिकीय रूप से महत्वपूर्ण अंतर नहीं है।
Q5. निम्नलिखित डेटा के लिए माध्य, माध्यिका और बहुलक की गणना कीजिए: 2+2+2 0, 2, 0, 5, 8, 7, 0, 5, 0, 7, 20, 0, 25, 3, 5, 0, 7, 9, 25, 30
Ans. दिए गए डेटा के लिए माध्य, माध्यिका और बहुलक की गणना करने के लिए, हम निम्नलिखित कदम उठाएंगे। डेटा सेट: 0, 2, 0, 5, 8, 7, 0, 5, 0, 7, 20, 0, 25, 3, 5, 0, 7, 9, 25, 30
1. माध्य (Mean) की गणना माध्य की गणना सभी मानों को जोड़कर और मानों की कुल संख्या से विभाजित करके की जाती है। मानों की कुल संख्या (N) = 20 मानों का योग (ΣX) = 0+2+0+5+8+7+0+5+0+7+20+0+25+3+5+0+7+9+25+30 = 158
माध्य = ΣX / N माध्य = 158 / 20 माध्य = 7.9
2. माध्यिका (Median) की गणना माध्यिका मध्य मान है जब डेटा को आरोही क्रम में व्यवस्थित किया जाता है। सबसे पहले, डेटा को क्रमबद्ध करें: 0, 0, 0, 0, 0, 0, 2, 3, 5, 5, 5, 7, 7, 7, 8, 9, 20, 25, 25, 30
चूँकि N = 20 (एक सम संख्या), माध्यिका दो मध्य मानों का औसत होगी। ये (N/2)वें और (N/2 + 1)वें मान हैं। (20/2) = 10वां मान (20/2 + 1) = 11वां मान
क्रमबद्ध डेटा में:
- 10वां मान = 5
- 11वां मान = 5
माध्यिका = (10वां मान + 11वां मान) / 2 माध्यिका = (5 + 5) / 2 माध्यिका = 5
3. बहुलक (Mode) की गणना बहुलक वह मान है जो डेटा सेट में सबसे अधिक बार आता है। हम प्रत्येक मान की आवृत्ति की गणना करेंगे:
- 0 6 बार आता है।
- 2 1 बार आता है।
- 3 1 बार आता है।
- 5 3 बार आता है।
- 7 3 बार आता है।
- 8 1 बार आता है।
- 9 1 बार आता है।
- 20 1 बार आता है।
- 25 2 बार आता है।
- 30 1 बार आता है।
सबसे अधिक बार आने वाला मान 0 है, जो 6 बार आता है। बहुलक = 0
Q6. उपयुक्त आरेखों की सहायता से आयतचित्र (histogram) और आवृत्ति बहुभुज (frequency polygon) का वर्णन कीजिए। 3+3
Ans.
आयतचित्र (Histogram) एक आयतचित्र एक ग्राफिकल प्रतिनिधित्व है जो एक सतत चर के आवृत्ति वितरण को प्रदर्शित करता है। यह एक बार चार्ट के समान दिखता है, लेकिन महत्वपूर्ण अंतर हैं। एक आयतचित्र में, प्रत्येक बार डेटा के एक अंतराल (या बिन) का प्रतिनिधित्व करता है, और बार की ऊंचाई उस अंतराल के भीतर आने वाले मानों की आवृत्ति (या गिनती) का प्रतिनिधित्व करती है।
मुख्य विशेषताऐं:
- सतत बार: आयतचित्र में बार एक दूसरे से सटे होते हैं, जो डेटा की सतत प्रकृति को इंगित करता है। बार के बीच कोई अंतराल नहीं होता है।
- एक्स-अक्ष (X-axis): क्षैतिज अक्ष (एक्स-अक्ष) चर के पैमाने का प्रतिनिधित्व करता है और इसे बराबर वर्ग अंतरालों में विभाजित किया जाता है।
- वाई-अक्ष (Y-axis): ऊर्ध्वाधर अक्ष (वाई-अक्ष) आवृत्ति या प्रतिशत का प्रतिनिधित्व करता है।
- क्षेत्रफल: प्रत्येक आयत का क्षेत्रफल उस वर्ग अंतराल की आवृत्ति के समानुपाती होता है।
उदाहरण का विवरण: एक आयतचित्र बनाने के लिए, आप एक्स-अक्ष पर छात्रों के परीक्षा अंकों के वर्ग अंतराल (जैसे 0-10, 10-20, 20-30) को प्लॉट करेंगे। वाई-अक्ष पर, आप प्रत्येक अंतराल में स्कोर करने वाले छात्रों की संख्या (आवृत्ति) को प्लॉट करेंगे। फिर आप प्रत्येक अंतराल के लिए एक बार बनाएंगे जिसकी ऊंचाई उसकी आवृत्ति के अनुरूप होगी। उदाहरण के लिए, यदि 8 छात्रों ने 10 और 20 के बीच स्कोर किया है, तो 10-20 अंतराल के ऊपर का बार 8 की ऊंचाई तक जाएगा।
आवृत्ति बहुभुज (Frequency Polygon) एक आवृत्ति बहुभुज एक लाइन ग्राफ है जिसका उपयोग सतत डेटा के आकार और वितरण को प्रदर्शित करने के लिए भी किया जाता है। इसे एक आयतचित्र से प्राप्त किया जा सकता है या सीधे आवृत्ति वितरण से बनाया जा सकता है।
मुख्य विशेषताऐं:
- मध्य बिंदु: एक आवृत्ति बहुभुज बनाने के लिए, प्रत्येक वर्ग अंतराल के मध्य बिंदु को एक्स-अक्ष पर प्लॉट किया जाता है, और संबंधित आवृत्ति को वाई-अक्ष पर प्लॉट किया जाता है।
- जुड़ी हुई रेखाएँ: इन बिंदुओं (मध्य बिंदु, आवृत्ति) को सीधी रेखाओं से जोड़ा जाता है।
- क्लोजर: बहुभुज को आमतौर पर एक्स-अक्ष पर “बंद” किया जाता है। यह पहले अंतराल से पहले एक अंतराल और अंतिम अंतराल के बाद एक अंतराल जोड़कर किया जाता है, दोनों की आवृत्ति शून्य होती है। यह सुनिश्चित करता है कि बहुभुज का कुल क्षेत्रफल आयतचित्र के कुल क्षेत्रफल के बराबर हो।
उदाहरण का विवरण: आयतचित्र के उदाहरण को जारी रखते हुए, आप प्रत्येक वर्ग अंतराल का मध्य बिंदु ज्ञात करेंगे (जैसे, 0-10 के लिए 5, 10-20 के लिए 15)। आप प्रत्येक मध्य बिंदु के ऊपर उसकी संबंधित आवृत्ति पर एक बिंदु प्लॉट करेंगे। फिर आप इन बिंदुओं को एक सीधी रेखा से जोड़ेंगे। बहुभुज को बंद करने के लिए, आप -5 (शून्य आवृत्ति पर) से शुरू करेंगे और अंतिम अंतराल के बाद एक और मध्य बिंदु (शून्य आवृत्ति पर) पर समाप्त करेंगे, दोनों बिंदुओं को एक्स-अक्ष से जोड़ेंगे। आवृत्ति बहुभुज कई वितरणों की एक ही ग्राफ पर तुलना करने के लिए विशेष रूप से उपयोगी है।
Q7. निम्नलिखित डेटा के लिए परास और मानक विचलन की गणना कीजिए: 6 0, 5, 7, 8, 20
Ans. दिए गए डेटा के लिए परास और मानक विचलन की गणना नीचे दी गई है। डेटा सेट: 0, 5, 7, 8, 20 (नोट: प्रश्न में “7, , 20” में एक संभावित टाइपो को “7, 8, 20” के रूप में व्याख्या किया गया है, जो एक तार्किक अनुक्रम प्रतीत होता है। यदि यह “7, 20” है, तो गणना भिन्न होगी। हम 5 डेटा बिंदुओं के साथ आगे बढ़ रहे हैं: 0, 5, 7, 8, 20।)
1. परास (Range) की गणना परास डेटा सेट में उच्चतम मान और निम्नतम मान के बीच का अंतर है। सूत्र: परास = उच्चतम मान – निम्नतम मान
उच्चतम मान (H) = 20 निम्नतम मान (L) = 0
परास = 20 – 0 परास = 20
2. मानक विचलन (Standard Deviation) की गणना मानक विचलन (SD) माध्य से अंकों के औसत फैलाव को मापता है। हम नमूना मानक विचलन सूत्र का उपयोग करेंगे, जो मनोविज्ञान में आम है।
चरण 1: माध्य (Mean, M) की गणना करें। मानों का योग (ΣX) = 0 + 5 + 7 + 8 + 20 = 40 मानों की संख्या (n) = 5 माध्य (M) = ΣX / n = 40 / 5 = 8
चरण 2: प्रत्येक मान के लिए माध्य से विचलन (X – M) की गणना करें और इसे वर्ग करें (X – M)²।
मान (X) विचलन (X – M) वर्गित विचलन (X – M)² 0 0 – 8 = -8 64 5 5 – 8 = -3 9 7 7 – 8 = -1 1 8 8 – 8 = 0 0 20 20 – 8 = 12 144 कुल Σ(X – M)² = 218
चरण 3: प्रसरण (Variance, s²) की गणना करें। नमूना प्रसरण सूत्र: s² = Σ(X – M)² / (n – 1) s² = 218 / (5 – 1) s² = 218 / 4 s² = 54.5
चरण 4: मानक विचलन (Standard Deviation, s) की गणना करें। मानक विचलन प्रसरण का वर्गमूल है। s = √54.5 s ≈ 7.38
उत्तर: दिए गए डेटा के लिए, परास 20 है और मानक विचलन लगभग 7.38 है।
Q8. प्रायिकता को परिभाषित कीजिए और सामान्य वितरण की अवधारणा को इसके गुणों के साथ समझाइए। 2+4
Ans.
प्रायिकता की परिभाषा
प्रायिकता किसी घटना के घटित होने की संभावना का एक संख्यात्मक माप है। यह 0 और 1 के बीच का एक मान है, जहाँ 0 इंगित करता है कि घटना घटित नहीं होगी (असंभव घटना) और 1 इंगित करता है कि घटना निश्चित रूप से घटित होगी (निश्चित घटना)। शास्त्रीय परिभाषा के अनुसार, यदि किसी यादृच्छिक प्रयोग के सभी परिणाम समान रूप से संभावित हैं, तो किसी घटना A की प्रायिकता (P(A)) इस प्रकार दी जाती है: P(A) = घटना A के अनुकूल परिणामों की संख्या / कुल संभावित परिणामों की संख्या उदाहरण के लिए, एक निष्पक्ष पासे को फेंकने पर ‘4’ आने की प्रायिकता 1/6 है, क्योंकि एक अनुकूल परिणाम (‘4’) है और छह कुल संभावित परिणाम (1, 2, 3, 4, 5, 6) हैं। प्रायिकता सिद्धांत आनुमानिक सांख्यिकी का आधार बनता है, जो हमें नमूना डेटा के आधार पर जनसंख्या के बारे में निष्कर्ष निकालने में मदद करता है।
सामान्य वितरण की अवधारणा और गुण
अवधारणा: सामान्य वितरण, जिसे गॉसियन वितरण या घंटी वक्र (bell curve) भी कहा जाता है, एक सतत प्रायिकता वितरण है जो कई प्राकृतिक और सामाजिक घटनाओं का वर्णन करता है। यह एक सैद्धांतिक वितरण है जो इस विचार पर आधारित है कि कई यादृच्छिक चर के मान केंद्र के चारों ओर क्लस्टर होते हैं। मनोविज्ञान में, बुद्धिमत्ता (IQ), ऊंचाई और प्रतिक्रिया समय जैसे कई चर लगभग सामान्य रूप से वितरित माने जाते हैं। यह सांख्यिकीय सिद्धांत में सबसे महत्वपूर्ण वितरण है क्योंकि केंद्रीय सीमा प्रमेय कहता है कि पर्याप्त बड़े नमूनों के लिए नमूना माध्यों का वितरण लगभग सामान्य होगा, भले ही मूल जनसंख्या का वितरण सामान्य न हो।
गुण:
- घंटी के आकार का (Bell-Shaped): वक्र का आकार एक घंटी जैसा होता है, जो केंद्र में उच्चतम और दोनों सिरों की ओर घटता जाता है।
- सममित (Symmetrical): वक्र अपने केंद्र के चारों ओर पूरी तरह से सममित है। इसका मतलब है कि वक्र का बायाँ आधा हिस्सा दाएँ आधे हिस्से का दर्पण प्रतिबिंब है।
- एकल-बहुलकी (Unimodal): इसमें केवल एक शिखर या बहुलक होता है, जो वितरण के केंद्र में होता है।
- माध्य, माध्यिका और बहुलक बराबर होते हैं: एक पूर्ण सामान्य वितरण में, माध्य, माध्यिका और बहुलक सभी एक ही बिंदु पर स्थित होते हैं, जो वक्र का केंद्र और उच्चतम बिंदु होता है।
- अनंतस्पर्शी (Asymptotic): वक्र दोनों दिशाओं में क्षैतिज अक्ष (एक्स-अक्ष) के करीब और करीब आता जाता है लेकिन इसे कभी नहीं छूता है। सैद्धांतिक रूप से, यह अनंत तक फैला हुआ है।
- क्षेत्रफल: वक्र के नीचे का कुल क्षेत्रफल 1 (या 100%) के बराबर होता है। माध्य के चारों ओर का क्षेत्र मानक विचलन (SD) की इकाइयों में परिभाषित किया गया है:
- माध्य ± 1 SD के भीतर लगभग 68% क्षेत्र आता है।
- माध्य ± 2 SD के भीतर लगभग 95% क्षेत्र आता है।
- माध्य ± 3 SD के भीतर लगभग 99.7% क्षेत्र आता है।
Q9. आनुमानिक सांख्यिकी की अवधारणा और अर्थ का वर्णन कीजिए। आनुमानिक प्रक्रियाओं पर प्रकाश डालिए। 3+3
Ans.
आनुमानिक सांख्यिकी की अवधारणा और अर्थ
आनुमानिक सांख्यिकी (Inferential Statistics) सांख्यिकी की एक शाखा है जो एक छोटे समूह, जिसे नमूना (sample) कहा जाता है, से एकत्र किए गए डेटा का उपयोग करके एक बड़े समूह, जिसे जनसंख्या (population) कहा जाता है, के बारे में अनुमान लगाने, निष्कर्ष निकालने या भविष्यवाणी करने से संबंधित है। वर्णनात्मक सांख्यिकी के विपरीत, जो केवल डेटा का सारांश और वर्णन करती है, आनुमानिक सांख्यिकी उस डेटा से आगे जाती है ताकि यह अनुमान लगाया जा सके कि पूरी जनसंख्या के लिए क्या सच हो सकता है।
इसका मूल विचार यह है कि पूरी जनसंख्या का अध्ययन करना अक्सर अव्यावहारिक या असंभव होता है। इसलिए, शोधकर्ता जनसंख्या का एक प्रतिनिधि नमूना लेते हैं और उस नमूने का अध्ययन करते हैं। फिर, वे नमूना निष्कर्षों को जनसंख्या पर लागू करने के लिए आनुमानिक सांख्यिकी का उपयोग करते हैं। यह प्रक्रिया हमेशा कुछ हद तक अनिश्चितता या नमूनाकरण त्रुटि के साथ आती है, और आनुमानिक सांख्यिकी हमें उस अनिश्चितता की मात्रा निर्धारित करने के लिए प्रायिकता सिद्धांत का उपयोग करने की अनुमति देती है। इसके मुख्य लक्ष्यों में परिकल्पना परीक्षण और पैरामीटर अनुमान शामिल हैं।
आनुमानिक प्रक्रियाएं आनुमानिक सांख्यिकी में जनसंख्या के बारे में निष्कर्ष निकालने के लिए एक व्यवस्थित प्रक्रिया का पालन किया जाता है। मुख्य चरण इस प्रकार हैं:
- एक शोध प्रश्न तैयार करना: प्रक्रिया एक स्पष्ट प्रश्न से शुरू होती है जिसे शोधकर्ता उत्तर देना चाहता है (उदाहरण के लिए, “क्या दवा A दवा B से अधिक प्रभावी है?”)।
- परिकल्पना तैयार करना: शोध प्रश्न को दो प्रतिस्पर्धी परिकल्पनाओं में अनुवादित किया जाता है:
- शून्य परिकल्पना (H₀): यह एक कथन है कि कोई प्रभाव, कोई अंतर या कोई संबंध नहीं है। (जैसे, “दवा A और दवा B की प्रभावशीलता में कोई अंतर नहीं है।”)
- वैकल्पिक परिकल्पना (H₁): यह एक कथन है कि एक प्रभाव, अंतर या संबंध मौजूद है। (जैसे, “दवा A और दवा B की प्रभावशीलता में अंतर है।”)
- महत्व स्तर (अल्फा, α) निर्धारित करना: यह शून्य परिकल्पना को गलत तरीके से अस्वीकार करने की अधिकतम स्वीकार्य संभावना है (टाइप I त्रुटि)। आमतौर पर, α = 0.05 या 0.01 पर सेट किया जाता है।
- एक उपयुक्त सांख्यिकीय परीक्षण चुनना: परीक्षण का चुनाव शोध प्रश्न, डेटा के प्रकार (जैसे, अंतराल, क्रमसूचक), और डेटा की विशेषताओं (जैसे, नमूना आकार, वितरण) पर निर्भर करता है। सामान्य परीक्षणों में टी-टेस्ट, एनोवा, काई-स्क्वेयर परीक्षण और सहसंबंध शामिल हैं।
- परीक्षण सांख्यिकी की गणना करना: नमूना डेटा का उपयोग करके चुने गए परीक्षण के लिए एक मान की गणना की जाती है। यह मान बताता है कि नमूना परिणाम शून्य परिकल्पना के तहत अपेक्षित परिणाम से कितना दूर है।
- निर्णय लेना: परिकलित परीक्षण सांख्यिकी की तुलना एक महत्वपूर्ण मान (एक सांख्यिकीय तालिका से) या पी-मान (p-value) की गणना करके की जाती है।
- पी-मान दृष्टिकोण: पी-मान यह संभावना है कि यदि शून्य परिकल्पना सच थी तो देखे गए परिणाम (या अधिक चरम परिणाम) प्राप्त होंगे। यदि पी-मान ≤ α, तो शून्य परिकल्पना को अस्वीकार कर दिया जाता है।
अंतिम चरण में, शोधकर्ता सांख्यिकीय निर्णय के आधार पर अपने शोध प्रश्न के बारे में एक निष्कर्ष निकालता है।
Q10. रैखिक संबंध 3
Ans. एक रैखिक संबंध (Linear Relationship) दो चरों (variables) के बीच एक प्रकार का संबंध है जिसे एक सीधी रेखा द्वारा ग्राफिक रूप से दर्शाया जा सकता है। इस संबंध में, जैसे-जैसे एक चर का मान बदलता है, दूसरे चर का मान एक स्थिर दर से बदलता है। इस संबंध की विशेषता इसकी दिशा और ताकत है।
- दिशा (Direction):
- सकारात्मक रैखिक संबंध: जब एक चर बढ़ता है, तो दूसरा चर भी बढ़ता है। उदाहरण के लिए, अध्ययन के घंटे और परीक्षा के अंकों के बीच आमतौर पर एक सकारात्मक संबंध होता है। ग्राफ पर, यह एक ऊपर की ओर ढलान वाली रेखा के रूप में दिखाई देता है।
- नकारात्मक रैखिक संबंध: जब एक चर बढ़ता है, तो दूसरा चर घटता है। उदाहरण के लिए, व्यायाम की मात्रा और शरीर के वजन के बीच एक नकारात्मक संबंध हो सकता है। ग्राफ पर, यह एक नीचे की ओर ढलान वाली रेखा के रूप में दिखाई देता है।
- ताकत (Strength): संबंध की ताकत यह बताती है कि डेटा बिंदु सीधी रेखा के कितने करीब हैं। पियर्सन सहसंबंध गुणांक (r) जैसे सांख्यिकीय माप का उपयोग रैखिक संबंध की ताकत और दिशा को मापने के लिए किया जाता है। ‘r’ का मान -1 से +1 तक होता है। +1 एक पूर्ण सकारात्मक रैखिक संबंध को इंगित करता है, -1 एक पूर्ण नकारात्मक रैखिक संबंध को इंगित करता है, और 0 कोई रैखिक संबंध नहीं दर्शाता है।
मनोविज्ञान में, प्रतिगमन विश्लेषण (regression analysis) में रैखिक संबंधों का व्यापक रूप से उपयोग किया जाता है ताकि एक चर के आधार पर दूसरे चर के मान की भविष्यवाणी की जा सके।
Q11. मानक त्रुटि 3
Ans.
मानक त्रुटि (Standard Error – SE) एक सांख्यिकीय माप है जो एक नमूना आँकड़े (जैसे नमूना माध्य) की सटीकता को दर्शाता है जब यह एक जनसंख्या पैरामीटर (जैसे जनसंख्या माध्य) का अनुमान लगाता है। यह अनिवार्य रूप से एक नमूनाकरण वितरण (sampling distribution) का मानक विचलन है। एक नमूनाकरण वितरण एक ही जनसंख्या से बार-बार लिए गए अनगिनत नमूनों के आँकड़ों का सैद्धांतिक वितरण है।
सरल शब्दों में, मानक त्रुटि हमें बताती है कि हम उम्मीद कर सकते हैं कि हमारा नमूना माध्य जनसंख्या माध्य से औसतन कितना भिन्न होगा। एक छोटी मानक त्रुटि इंगित करती है कि नमूना आँकड़ा जनसंख्या पैरामीटर का एक अधिक सटीक अनुमान है।
माध्य की मानक त्रुटि (Standard Error of the Mean – SEM) के लिए सूत्र है: SEM = σ / √n जहाँ ‘σ’ जनसंख्या का मानक विचलन है और ‘n’ नमूना आकार है।
इस सूत्र से, हम देख सकते हैं कि मानक त्रुटि नमूना आकार से विपरीत रूप से संबंधित है। जैसे-जैसे नमूना आकार (n) बढ़ता है, मानक त्रुटि घटती है, जिसका अर्थ है कि बड़े नमूने जनसंख्या का अधिक सटीक अनुमान प्रदान करते हैं। मानक त्रुटि परिकल्पना परीक्षण और विश्वास अंतराल (confidence intervals) के निर्माण में एक महत्वपूर्ण अवधारणा है।
Q12. पाई आरेख 3
Ans. एक पाई आरेख (Pie Diagram) या पाई चार्ट एक गोलाकार सांख्यिकीय ग्राफिक है जिसे संख्यात्मक अनुपात को दर्शाने के लिए स्लाइस (टुकड़ों) में विभाजित किया जाता है। इस चार्ट में, प्रत्येक स्लाइस की चाप लंबाई (और फलस्वरूप इसका केंद्रीय कोण और क्षेत्रफल) उस मात्रा के समानुपाती होती है जिसका वह प्रतिनिधित्व करता है। पूरा पाई 100% का प्रतिनिधित्व करता है, और प्रत्येक स्लाइस कुल का एक प्रतिशत या अंश होता है।
पाई आरेख विशेष रूप से एक समग्र के भागों (parts-of-a-whole) के बीच तुलना दिखाने के लिए उपयोगी होते हैं। उदाहरण के लिए, एक शोधकर्ता एक सर्वेक्षण के परिणामों को प्रदर्शित करने के लिए एक पाई आरेख का उपयोग कर सकता है, जहाँ प्रत्येक स्लाइस उत्तरदाताओं के प्रतिशत का प्रतिनिधित्व करता है जिन्होंने एक विशेष विकल्प (जैसे, “सहमत,” “असहमत,” “तटस्थ”) चुना।
पाई आरेख बनाने के लिए:
- प्रत्येक श्रेणी के लिए प्रतिशत की गणना करें।
- प्रत्येक प्रतिशत को 360° से गुणा करके प्रत्येक स्लाइस के लिए डिग्री की गणना करें (उदाहरण के लिए, 25% = 0.25 * 360° = 90°)।
- एक वृत्त बनाएं और इन कोणों का उपयोग करके स्लाइस को चिह्नित करें।
जबकि वे नेत्रहीन रूप से आकर्षक होते हैं, जब कई श्रेणियां होती हैं या जब श्रेणियों के बीच के मान बहुत समान होते हैं तो उनकी व्याख्या करना मुश्किल हो सकता है। इन मामलों में, एक बार चार्ट अधिक प्रभावी हो सकता है।
IGNOU BPC-004 Previous Year Solved Question Paper in English
Q1. Explain the meaning of measures of central tendency and its functions. 4+6
Ans. Meaning of Measures of Central Tendency A measure of central tendency, or an average, is a single value that attempts to describe a set of data. It does this by identifying the central position or typical value within that data. It is a summary statistic that represents the center of a distribution of scores. In essence, it is a value that is “most typical” or “most representative” of the data set. In psychology and other fields, it is used to summarize a large amount of data into one meaningful and easily understandable number. The three main measures of central tendency are:
- Mean: This is the most common measure, calculated by adding all the values and then dividing by the number of values.
- Median: This is the middle value when a data set is arranged in order. It divides the data into two equal halves.
- Mode: This is the value that appears most frequently in a data set.
The choice of the correct measure depends on the type of data (nominal, ordinal, interval, ratio) and the shape of the distribution.
Functions of Measures of Central Tendency
Measures of central tendency serve several crucial functions:
- To summarize data: Its most important function is to condense a large amount of data into a single representative value. For example, instead of looking at the exam scores of 100 students, we can look at the average score (mean) to understand the group’s performance.
- To compare groups: These measures allow us to compare different groups. For instance, a researcher can compare the average test scores of two groups of students taught using two different teaching methods to determine which method is more effective.
- To evaluate an individual’s performance: By looking at an individual’s score in relation to the group’s average, we can evaluate their performance. If a student scores significantly above the average, they are considered to have performed well.
- Basis for inferential statistics: Measures of central tendency, particularly the mean, form the basis for many inferential statistical tests (e.g., t-test, ANOVA). These tests draw conclusions about populations by comparing the means of samples.
- Indication of Skewness: The relationship between the mean, median, and mode provides information about the shape (skewness) of the data’s distribution. In a normal distribution, all three values are equal. In a positively skewed distribution, Mean > Median > Mode; in a negatively skewed distribution, Mean < Median < Mode.
- To provide a concise description: It provides a brief and quick overview of the entire dataset, making it easier for even non-specialists to grasp the information. It is a vital tool for decision-making and further analysis.
Q2. Explain the types of measures of variability, elucidating the properties and limitations of quartile deviation and average deviation. 6+4
Ans. Types of Measures of Variability Measures of variability (or measures of dispersion) describe how spread out or different the scores in a data set are from each other and from the measure of central tendency. While a measure of central tendency describes the center point of the data, a measure of variability describes the spread of the scores. The main types of variability measures are:
- Range: This is the simplest measure, calculated by subtracting the lowest score from the highest score. It only considers the two extreme values.
- Quartile Deviation (QD): Also known as the semi-interquartile range. It is half the difference between the third quartile (Q3) and the first quartile (Q1). The formula is: QD = (Q3 – Q1) / 2. It measures the spread of the middle 50% of the scores.
- Average Deviation (AD): Also called the Mean Deviation. It is the average of the deviations of scores from the mean or median, ignoring the algebraic signs (plus or minus). The formula is: AD = Σ|X – M| / N, where M is the mean or median.
- Standard Deviation (SD): This is the most widely used and stable measure of variability. It represents the average deviation of scores from the mean. It is calculated as the square root of the variance.
Properties and Limitations of Quartile Deviation (QD)
Properties:
- It is not affected by extreme values (outliers) because it is based on the middle 50% of the data.
- It is useful for open-ended distributions where extreme values are not known.
- It is a better measure than range for skewed distributions.
- It is relatively easy to calculate and understand.
Limitations:
- It is not based on all the values in the distribution; it depends only on Q1 and Q3 and ignores 50% of the data.
- It is not amenable to further algebraic treatment, which limits its statistical utility.
- It is less stable than the standard deviation as it varies more from sample to sample.
Properties and Limitations of Average Deviation (AD)
Properties:
- It is superior to quartile deviation as it takes into account all the values in the data set.
- It is relatively simple to understand and compute.
- It gives less weight to extreme values compared to the standard deviation.
Limitations:
- Its major limitation is that it ignores the algebraic signs (plus and minus), which is a logically non-mathematical procedure.
- Due to the ignorance of signs, it is not suitable for further advanced statistical analysis (like inferential statistics). This drawback has led to it being used much less frequently than the standard deviation.
Q3. Describe the conditions for rank order correlations. Compute Spearman’s rho (p) for the following data : 3+7 Data 1: 5, 8, 4, 7, 5, 3, 4, 9 Data 2: 3, 2, 6, 9, 8, 7, 8, 8
Ans. Conditions for Rank Order Correlation Spearman’s rank-order correlation coefficient, denoted as Spearman’s rho (ρ), is a non-parametric test used to measure the strength and direction of the association between two variables. There are certain conditions for its use:
- Ordinal Data: Spearman’s rho is specifically designed for use when the variables are measured on at least an ordinal scale. This means the data can be ranked or ordered.
- Non-linear Relationship: If the relationship between two variables is non-linear (but monotonic), Spearman’s rho is more appropriate than Pearson’s correlation. A monotonic relationship is one where the variables move in the same direction, but not necessarily at a constant rate.
- Small Sample Size: When the sample size is small (typically N < 30) and the data are not normally distributed, Spearman’s rho is a robust alternative to Pearson’s correlation.
- Outliers: Unlike Pearson’s correlation, Spearman’s rho is much less affected by extreme values (outliers) because it uses ranks instead of the actual values.
Computation of Spearman’s rho (ρ)
The steps to compute Spearman’s rho for the given data are as follows:
Step 1: List the data and rank both sets.
When there are tied values, we assign them the average rank.
- In Data 1: 4 appears twice (ranks 2 and 3). Average rank = (2+3)/2 = 2.5. 5 appears twice (ranks 4 and 5). Average rank = (4+5)/2 = 4.5.
- In Data 2: 8 appears three times (ranks 5, 6, 7). Average rank = (5+6+7)/3 = 6.
Data 1 (X) |
Data 2 (Y) |
Rank X (R1) |
Rank Y (R2) |
D = R1 – R2 |
D² |
| 5 | 3 | 4.5 | 2 | 2.5 | 6.25 |
| 8 | 2 | 7 | 1 | 6 | 36.00 |
| 4 | 6 | 2.5 | 3 | -0.5 | 0.25 |
| 7 | 9 | 6 | 8 | -2 | 4.00 |
| 5 | 8 | 4.5 | 6 | -1.5 | 2.25 |
| 3 | 7 | 1 | 4 | -3 | 9.00 |
| 4 | 8 | 2.5 | 6 | -3.5 | 12.25 |
| 9 | 8 | 8 | 6 | 2 | 4.00 |
Total |
ΣD² = 74.00 |
Step 2: Use the Spearman’s rho formula.
The formula is: ρ = 1 – [6
ΣD²] / [N
(N² – 1)]
Here, N = 8 and ΣD² = 74.00.
ρ = 1 – [6
74] / [8
(8² – 1)]
ρ = 1 – [444] / [8 ρ = 1 – [444] / [8
(64 – 1)]
63]
ρ = 1 – [444] / [504]
ρ = 1 – 0.8809
ρ = 0.1191
Answer:
The Spearman’s rho (ρ) is approximately
0.12
. This indicates a very weak, positive correlation between the two data sets.
Q4. Explain Chi-square as a test of goodness of fit. Compute Chi-square for the following data : 3+7 Gender: Males, Responses: Yes: 4, No: 6
Ans. Chi-Square as a Test of Goodness of Fit The Chi-square (χ²) goodness-of-fit test is a non-parametric statistical hypothesis test used to determine whether an observed frequency distribution for a categorical variable differs from an expected frequency distribution. In short, it tests how “good” the “fit” is between the sample data and a theoretical distribution. The process involves:
- Formulating Hypotheses: The null hypothesis (H₀) states that there is no significant difference between the observed and expected frequencies (i.e., the sample data fits the theoretical distribution). The alternative hypothesis (H₁) states that a significant difference exists.
- Calculating Expected Frequencies: The expected frequencies are calculated based on the null hypothesis. For example, if we are testing whether a coin flip is fair, we would expect 50% heads and 50% tails.
- Calculating the Chi-Square Value: The test statistic is calculated using the formula: χ² = Σ [(O – E)² / E], where O = Observed frequency and E = Expected frequency.
- Making a Decision: The calculated χ² value is compared to a critical value from a χ² distribution table for a given significance level (e.g., α = 0.05) and degrees of freedom (df). If the calculated value is greater than the critical value, we reject the null hypothesis.
Computation of Chi-Square
The data given is for Males’ responses: Yes = 4, No = 6. The total number of responses is 10.
Assumption:
Since no expected distribution is given, we will use the most common null hypothesis for a goodness-of-fit test: that there is no preference for the responses, meaning “Yes” and “No” responses are expected to occur equally (a 50/50 split).
Step 1: Determine Observed (O) and Expected (E) frequencies.
- Total responses (N) = 4 (Yes) + 6 (No) = 10.
- Observed Frequencies (O):
- Yes = 4
- No = 6
- Expected Frequencies (E): Under the null hypothesis, we expect 50% to say Yes and 50% to say No.
- Yes = 10 * 0.50 = 5
- No = 10 * 0.50 = 5
Step 2: Calculate the Chi-Square (χ²) value.
Formula: χ² = Σ [(O – E)² / E]
1. For the
“Yes”
category:
(O – E)² / E = (4 – 5)² / 5 = (-1)² / 5 = 1 / 5 = 0.2
2. For the
“No”
category:
(O – E)² / E = (6 – 5)² / 5 = (1)² / 5 = 1 / 5 = 0.2
3.
Total χ² value:
χ² = 0.2 + 0.2 = 0.4
Step 3: Calculate Degrees of Freedom (df).
df = k – 1, where k is the number of categories.
df = 2 – 1 = 1
Conclusion:
The calculated Chi-square value is
0.4
. This value would be compared to a critical χ² value for 1 degree of freedom (e.g., at α = 0.05, the critical value is 3.84). Since 0.4 < 3.84, we fail to reject the null hypothesis and conclude that there is no statistically significant difference between the “Yes” and “No” responses.
Q5. Compute mean, median and mode for the following data : 2+2+2 0, 2, 0, 5, 8, 7, 0, 5, 0, 7, 20, 0, 25, 3, 5, 0, 7, 9, 25, 30
Ans. To compute the mean, median, and mode for the given data, we will take the following steps. Data set: 0, 2, 0, 5, 8, 7, 0, 5, 0, 7, 20, 0, 25, 3, 5, 0, 7, 9, 25, 30 1. Computation of Mean The mean is calculated by summing all the values and dividing by the total number of values. Total number of values (N) = 20 Sum of values (ΣX) = 0+2+0+5+8+7+0+5+0+7+20+0+25+3+5+0+7+9+25+30 = 158 Mean = ΣX / N Mean = 158 / 20 Mean = 7.9 2. Computation of Median The median is the middle value when the data is arranged in ascending order. First, sort the data: 0, 0, 0, 0, 0, 0, 2, 3, 5, 5, 5, 7, 7, 7, 8, 9, 20, 25, 25, 30 Since N = 20 (an even number), the median will be the average of the two middle values. These are the (N/2)th and (N/2 + 1)th values. (20/2) = 10th value (20/2 + 1) = 11th value In the sorted data:
- 10th value = 5
- 11th value = 5
Median = (10th value + 11th value) / 2
Median = (5 + 5) / 2
Median = 5
3. Computation of Mode
The mode is the value that appears most frequently in the data set.
We will count the frequency of each value:
- 0 appears 6 times.
- 2 appears 1 time.
- 3 appears 1 time.
- 5 appears 3 times.
- 7 appears 3 times.
- 8 appears 1 time.
- 9 appears 1 time.
- 20 appears 1 time.
- 25 appears 2 times.
- 30 appears 1 time.
The most frequent value is 0, which appears 6 times.
Mode = 0
Q6. Describe histogram and frequency polygon with the help of suitable diagrams. 3+3
Ans. Histogram A histogram is a graphical representation that displays the frequency distribution of a continuous variable. It looks similar to a bar chart, but there are important differences. In a histogram, each bar represents an interval (or bin) of data, and the height of the bar represents the frequency (or count) of values falling within that interval. Key Features:
- Continuous Bars: The bars in a histogram are adjacent to each other, indicating the continuous nature of the data. There are no gaps between the bars.
- X-axis: The horizontal axis (x-axis) represents the scale of the variable and is divided into equal class intervals.
- Y-axis: The vertical axis (y-axis) represents the frequency or percentage.
- Area: The area of each rectangle is proportional to the frequency of that class interval.
Description of a Diagram:
To create a histogram, you would plot class intervals of student exam scores (e.g., 0-10, 10-20, 20-30) on the x-axis. On the y-axis, you would plot the number of students (frequency) who scored in each interval. You would then draw a bar for each interval with a height corresponding to its frequency. For example, if 8 students scored between 10 and 20, the bar above the 10-20 interval would go up to a height of 8.
Frequency Polygon
A frequency polygon is a line graph also used to display the shape and distribution of continuous data. It can be derived from a histogram or constructed directly from a frequency distribution.
Key Features:
- Midpoints: To construct a frequency polygon, the midpoint of each class interval is plotted on the x-axis, and the corresponding frequency is plotted on the y-axis.
- Joined Lines: These plotted points (midpoint, frequency) are joined by straight lines.
- Closure: The polygon is typically “closed” at the x-axis. This is done by adding an interval before the first interval and one after the last interval, both with a frequency of zero. This ensures the total area of the polygon is equal to the total area of the histogram.
Description of a Diagram:
Continuing the histogram example, you would find the midpoint of each class interval (e.g., 5 for 0-10, 15 for 10-20). You would plot a point above each midpoint at its corresponding frequency. You then connect these points with a straight line. To close the polygon, you would start from -5 (at zero frequency) and end at another midpoint after the last interval (at zero frequency), connecting both points to the x-axis. A frequency polygon is particularly useful for comparing several distributions on the same graph.
Q7. Compute range and standard deviation for the following data : 6 0, 5, 7, 8, 20
Ans. The calculation for the range and standard deviation for the given data is below. Data set: 0, 5, 7, 8, 20 (Note: A possible typo in the question “7, , 20” has been interpreted as “7, 8, 20” which seems like a logical sequence. If it was “7, 20”, the calculations would differ. We are proceeding with 5 data points: 0, 5, 7, 8, 20.) 1. Computation of Range The range is the difference between the highest and lowest value in the data set. Formula: Range = Highest Value – Lowest Value Highest Value (H) = 20 Lowest Value (L) = 0 Range = 20 – 0 Range = 20 2. Computation of Standard Deviation The standard deviation (SD) measures the average spread of scores from the mean. We will use the sample standard deviation formula, which is common in psychology. Step 1: Calculate the Mean (M). Sum of values (ΣX) = 0 + 5 + 7 + 8 + 20 = 40 Number of values (n) = 5 Mean (M) = ΣX / n = 40 / 5 = 8 Step 2: Calculate the deviation from the mean for each value (X – M) and square it (X – M)².
Value (X) |
Deviation (X – M) |
Squared Deviation (X – M)² |
| 0 | 0 – 8 = -8 | 64 |
| 5 | 5 – 8 = -3 | 9 |
| 7 | 7 – 8 = -1 | 1 |
| 8 | 8 – 8 = 0 | 0 |
| 20 | 20 – 8 = 12 | 144 |
Total |
Σ(X – M)² = 218 |
Step 3: Calculate the Variance (s²).
Sample variance formula: s² = Σ(X – M)² / (n – 1)
s² = 218 / (5 – 1)
s² = 218 / 4
s² = 54.5
Step 4: Calculate the Standard Deviation (s).
Standard deviation is the square root of the variance.
s = √54.5
s ≈ 7.38
Answer:
For the given data, the
Range is 20
and the
Standard Deviation is approximately 7.38
.
Q8. Define probability and explain the concept of normal distribution with its properties. 2+4
Ans. Definition of Probability Probability is a numerical measure of the likelihood that an event will occur. It is a value between 0 and 1, where 0 indicates that the event will not happen (an impossible event) and 1 indicates that the event is certain to happen (a certain event). According to the classical definition, if all outcomes of a random experiment are equally likely, then the probability of an event A (P(A)) is given by: P(A) = Number of outcomes favorable to event A / Total number of possible outcomes For example, the probability of rolling a ‘4’ on a fair die is 1/6, as there is one favorable outcome (‘4’) and six total possible outcomes (1, 2, 3, 4, 5, 6). Probability theory forms the foundation of inferential statistics, which helps us draw conclusions about a population based on sample data. Concept and Properties of Normal Distribution Concept: The normal distribution, also known as the Gaussian distribution or the bell curve, is a continuous probability distribution that describes many natural and social phenomena. It is a theoretical distribution based on the idea that the values of many random variables cluster around a central value. In psychology, many variables such as intelligence (IQ), height, and reaction times are assumed to be approximately normally distributed. It is the most important distribution in statistical theory because the Central Limit Theorem states that for large enough samples, the distribution of sample means will be approximately normal, even if the distribution of the original population is not. Properties:
- Bell-Shaped: The curve has the shape of a bell, being highest in the center and tapering off towards both ends.
- Symmetrical: The curve is perfectly symmetrical around its center. This means the left half of the curve is a mirror image of the right half.
- Unimodal: It has only one peak or mode, which is at the center of the distribution.
- Mean, Median, and Mode are Equal: In a perfect normal distribution, the mean, median, and mode are all located at the same point, which is the center and highest point of the curve.
- Asymptotic: The curve gets closer and closer to the horizontal axis (x-axis) in both directions but never touches it. Theoretically, it extends to infinity.
- Area: The total area under the curve is equal to 1 (or 100%). The area around the mean is defined in units of standard deviation (SD):
- Approximately 68% of the area falls within ±1 SD of the mean.
- Approximately 95% of the area falls within ±2 SD of the mean.
- Approximately 99.7% of the area falls within ±3 SD of the mean.
Q9. Describe the concept and meaning of inferential statistics. Elucidate the inferential procedures. 3+3
Ans. Concept and Meaning of Inferential Statistics Inferential Statistics is a branch of statistics that deals with making inferences, drawing conclusions, or making predictions about a larger group, called a population, by using data collected from a smaller group, called a sample. Unlike descriptive statistics, which only summarizes and describes the data at hand, inferential statistics goes beyond that data to infer what might be true for the whole population. The core idea is that it is often impractical or impossible to study an entire population. Therefore, researchers take a representative sample from the population and study that sample. They then use inferential statistics to generalize the sample findings to the population. This process always comes with a degree of uncertainty or sampling error, and inferential statistics allows us to use probability theory to quantify that uncertainty. Its main goals include hypothesis testing and parameter estimation. Inferential Procedures Inferential statistics follows a systematic procedure to draw conclusions about a population. The main steps are as follows:
- Formulating a Research Question: The process begins with a clear question the researcher wants to answer (e.g., “Is drug A more effective than drug B?”).
- Stating Hypotheses: The research question is translated into two competing hypotheses:
- The Null Hypothesis (H₀): This is a statement of no effect, no difference, or no relationship. (e.g., “There is no difference in the effectiveness of drug A and drug B.”)
- The Alternative Hypothesis (H₁): This is a statement that an effect, difference, or relationship exists. (e.g., “There is a difference in the effectiveness of drug A and drug B.”)
- Setting the Significance Level (alpha, α): This is the maximum acceptable probability of wrongly rejecting the null hypothesis (a Type I error). Commonly, α is set at 0.05 or 0.01.
- Choosing an Appropriate Statistical Test: The choice of test depends on the research question, the type of data (e.g., interval, ordinal), and the characteristics of the data (e.g., sample size, distribution). Common tests include t-tests, ANOVA, chi-square tests, and correlation.
- Calculating the Test Statistic: A value is calculated for the chosen test using the sample data. This value indicates how far the sample result deviates from the result expected under the null hypothesis.
- Making a Decision: The calculated test statistic is compared to a critical value (from a statistical table) or by calculating a p-value.
- P-value approach: The p-value is the probability of obtaining the observed results (or more extreme results) if the null hypothesis were true. If the p-value ≤ α, the null hypothesis is rejected.
In the final step, the researcher draws a conclusion about their research question based on the statistical decision.
Q10. Linear relationship 3
Ans. A linear relationship is a type of association between two variables that can be graphically represented by a straight line. In this relationship, as the value of one variable changes, the value of the other variable changes at a constant rate. This relationship is characterized by its direction and strength.
- Direction:
- Positive Linear Relationship: When one variable increases, the other variable also increases. For example, there is typically a positive relationship between hours of study and exam scores. On a graph, this appears as an upward-sloping line.
- Negative Linear Relationship: When one variable increases, the other variable decreases. For example, there might be a negative relationship between the amount of exercise and body weight. On a graph, this appears as a downward-sloping line.
- Strength: The strength of the relationship refers to how closely the data points cluster around the straight line. Statistical measures like the Pearson correlation coefficient (r) are used to quantify the strength and direction of a linear relationship. The value of ‘r’ ranges from -1 to +1. +1 indicates a perfect positive linear relationship, -1 indicates a perfect negative linear relationship, and 0 indicates no linear relationship.
In psychology, linear relationships are widely used in regression analysis to predict the value of one variable based on another.
Q11. Standard error 3
Ans. The Standard Error (SE) is a statistical measure that indicates the accuracy of a sample statistic (like the sample mean) in estimating a population parameter (like the population mean). It is essentially the standard deviation of a sampling distribution. A sampling distribution is the theoretical distribution of a statistic from countless samples taken repeatedly from the same population. In simpler terms, the standard error tells us how much, on average, we can expect our sample mean to vary from the actual population mean. A small standard error indicates that the sample statistic is a more accurate estimate of the population parameter. The formula for the Standard Error of the Mean (SEM) is: SEM = σ / √n where ‘σ’ is the population standard deviation and ‘n’ is the sample size. From this formula, we can see that the standard error is inversely related to the sample size . As the sample size (n) increases, the standard error decreases, meaning larger samples provide more accurate estimates of the population. The standard error is a crucial concept in hypothesis testing and the construction of confidence intervals.
Q12. Pie diagram 3
Ans. A pie diagram or pie chart is a circular statistical graphic that is divided into slices to illustrate numerical proportion. In this chart, the arc length of each slice (and consequently its central angle and area) is proportional to the quantity it represents. The entire pie represents 100%, and each slice is a percentage or fraction of the total. Pie diagrams are particularly useful for showing comparisons between parts of a whole. For example, a researcher might use a pie diagram to display the results of a survey, where each slice represents the percentage of respondents who chose a particular option (e.g., “Agree,” “Disagree,” “Neutral”). To construct a pie diagram:
- Calculate the percentage for each category.
- Calculate the degrees for each slice by multiplying each percentage by 360° (e.g., 25% = 0.25 * 360° = 90°).
- Draw a circle and mark out the slices using these angles.
While they are visually appealing, they can be difficult to interpret when there are many categories or when the values between categories are very similar. In these cases, a bar chart may be more effective.
Download IGNOU previous Year Question paper download PDFs for BPC-004 to improve your preparation. These ignou solved question paper IGNOU Previous Year Question paper solved PDF in Hindi and English help you understand the exam pattern and score better.
Thanks!
Leave a Reply