The IGNOU BPCC-104 Solved Question Paper PDF Download page is designed to help students access high-quality exam resources in one place. Here, you can find ignou solved question paper IGNOU Previous Year Question paper solved PDF that covers all important questions with detailed answers. This page provides IGNOU all Previous year Question Papers in one PDF format, making it easier for students to prepare effectively.
- IGNOU BPCC-104 Solved Question Paper in Hindi
- IGNOU BPCC-104 Solved Question Paper in English
- IGNOU Previous Year Solved Question Papers (All Courses)
Whether you are looking for IGNOU Previous Year Question paper solved in English or ignou previous year question paper solved in hindi, this page offers both options to suit your learning needs. These solved papers help you understand exam patterns, improve answer writing skills, and boost confidence for upcoming exams.
IGNOU BPCC-104 Solved Question Paper PDF

This section provides IGNOU BPCC-104 Solved Question Paper PDF in both Hindi and English. These ignou solved question paper IGNOU Previous Year Question paper solved PDF include detailed answers to help you understand exam patterns and improve your preparation. You can also access IGNOU all Previous year Question Papers in one PDF for quick and effective revision before exams.
IGNOU BPCC-104 Previous Year Solved Question Paper in Hindi
Q1. सांख्यिकी की सीमाएँ और अपनिर्वचन (गलत व्याख्या) पर चर्चा कीजिए। उपयुक्त उदाहरणों की सहायता से मापने के विभिन्न पैमानों का वर्णन कीजिए। 4+6
Ans. सांख्यिकी मनोवैज्ञानिक शोध में एक शक्तिशाली उपकरण है, लेकिन इसकी कुछ सीमाएँ और गलत व्याख्या की संभावनाएँ हैं।
सांख्यिकी की सीमाएँ और अपनिर्वचन:
- गुणात्मक डेटा पर लागू नहीं: सांख्यिकी मुख्य रूप से संख्यात्मक डेटा से संबंधित है। यह ईमानदारी, सुंदरता या बुद्धिमत्ता जैसे गुणात्मक घटनाओं का सीधे अध्ययन नहीं कर सकती, जब तक कि उन्हें मात्रात्मक रूप में परिवर्तित न किया जाए।
- व्यक्तिगत मामलों का अध्ययन नहीं: सांख्यिकी समूहों और समग्र प्रवृत्तियों से संबंधित है, न कि व्यक्तिगत मामलों से। एक समूह का औसत स्कोर किसी एक व्यक्ति के बारे में सटीक जानकारी नहीं देता है।
- कारण-कार्य संबंध स्थापित न करना: सहसंबंध कार्य-कारण संबंध को नहीं दर्शाता है। उदाहरण के लिए, आइसक्रीम की बिक्री और अपराध दर में सकारात्मक सहसंबंध हो सकता है, लेकिन इसका मतलब यह नहीं है कि आइसक्रीम खाने से अपराध होता है। एक तीसरा कारक (जैसे, गर्म मौसम) दोनों को प्रभावित कर सकता है।
- दुरुपयोग की संभावना: आँकड़ों का चयन करके या उन्हें भ्रामक तरीके से प्रस्तुत करके परिणामों में हेरफेर किया जा सकता है। उदाहरण के लिए, एक ग्राफ़ के Y-अक्ष को छोटा करने से मामूली अंतर बहुत बड़ा दिख सकता है।
- अति-सरलीकरण: जटिल मनोवैज्ञानिक घटनाओं को संख्याओं तक सीमित करने से उनकी समृद्धि और बारीकियां खो सकती हैं।
मापने के पैमाने: मनोविज्ञान में, चरों को मापने के लिए चार मुख्य पैमानों का उपयोग किया जाता है:
- नामित पैमाना (Nominal Scale): यह सबसे सरल पैमाना है। यह डेटा को श्रेणियों में वर्गीकृत करने के लिए लेबलों का उपयोग करता है, जिसमें कोई अंतर्निहित क्रम नहीं होता है। उदाहरण: लिंग (1=पुरुष, 2=महिला), वैवाहिक स्थिति (1=विवाहित, 2=अविवाहित, 3=तलाकशुदा)। यहाँ संख्याएँ केवल श्रेणियाँ दर्शाती हैं, उनका कोई गणितीय मूल्य नहीं है।
- क्रमसूचक पैमाना (Ordinal Scale): यह पैमाना डेटा को एक क्रम या रैंक में व्यवस्थित करता है, लेकिन श्रेणियों के बीच का अंतर समान या ज्ञात नहीं होता है। उदाहरण: किसी प्रतियोगिता में रैंक (प्रथम, द्वितीय, तृतीय), या संतुष्टि का स्तर (1=बहुत असंतुष्ट, 2=असंतुष्ट, 3=तटस्थ, 4=संतुष्ट, 5=बहुत संतुष्ट)। हम जानते हैं कि रैंक 1 रैंक 2 से बेहतर है, लेकिन हम यह नहीं कह सकते कि कितना बेहतर है।
- अंतराल पैमाना (Interval Scale): इस पैमाने में क्रम होता है और इकाइयों के बीच का अंतराल समान और मापने योग्य होता है। हालाँकि, इसमें एक वास्तविक शून्य बिंदु (absolute zero) नहीं होता है। उदाहरण: सेल्सियस या फ़ारेनहाइट में तापमान, या मानकीकृत IQ स्कोर। 20°C और 30°C के बीच का अंतर 30°C और 40°C के बीच के अंतर के बराबर है, लेकिन 0°C का मतलब “कोई तापमान नहीं” नहीं है।
- अनुपात पैमाना (Ratio Scale): यह सबसे उन्नत पैमाना है। इसमें क्रम, समान अंतराल और एक वास्तविक शून्य बिंदु होता है, जो चर की पूर्ण अनुपस्थिति को इंगित करता है। उदाहरण: आयु, ऊँचाई, वज़न, या प्रतिक्रिया समय। 20 वर्ष की आयु 10 वर्ष की आयु से दोगुनी है। शून्य प्रतिक्रिया समय का मतलब है कि कोई प्रतिक्रिया नहीं हुई। इस पैमाने पर सभी गणितीय संक्रियाएँ संभव हैं।
Q2. आवृत्ति वितरण की विभिन्न श्रेणियों का वर्णन कीजिए। उपयुक्त उदाहरणों के साथ समूहीकृत और असमूहीकृत आवृत्ति वितरण की व्याख्या कीजिए। 4+6
Ans.
आवृत्ति वितरण की विभिन्न श्रेणियाँ: आवृत्ति वितरण एक तालिका या ग्राफ़ है जो दिखाता है कि डेटासेट में प्रत्येक मान या मानों का समूह कितनी बार आता है। वितरण का आकार डेटा की प्रकृति के बारे में महत्वपूर्ण जानकारी प्रदान करता है। मुख्य श्रेणियाँ हैं:
- सामान्य वितरण (Normal Distribution): इसे “बेल कर्व” (घंटी के आकार का वक्र) भी कहा जाता है। इस सममित वितरण में, अधिकांश स्कोर केंद्र (माध्य) के आसपास केंद्रित होते हैं, और जैसे-जैसे हम माध्य से दूर जाते हैं, आवृत्तियाँ कम होती जाती हैं। माध्य, माध्यिका और बहुलक सभी एक ही बिंदु पर होते हैं। कई मनोवैज्ञानिक विशेषताएँ, जैसे कि IQ, सामान्य रूप से वितरित मानी जाती हैं।
- विषम वितरण (Skewed Distribution): यह एक असममित वितरण है जहाँ स्कोर एक छोर पर अधिक एकत्रित होते हैं।
- धनात्मक विषमता (Positively Skewed): इसमें अधिकांश स्कोर निचले सिरे पर होते हैं और पूंछ दाईं ओर लंबी होती है। उदाहरण: एक बहुत कठिन परीक्षा के स्कोर, जहाँ अधिकांश छात्रों को कम अंक मिलते हैं और कुछ को ही उच्च अंक प्राप्त होते हैं।
- ऋणात्मक विषमता (Negatively Skewed): इसमें अधिकांश स्कोर उच्च सिरे पर होते हैं और पूंछ बाईं ओर लंबी होती है। उदाहरण: एक बहुत ही आसान परीक्षा के स्कोर, जहाँ अधिकांश छात्रों को उच्च अंक मिलते हैं।
- द्विबाहुलकी वितरण (Bimodal Distribution): इस वितरण में दो शिखर (modes) होते हैं, जो यह दर्शाते हैं कि डेटा में दो अलग-अलग उपसमूह हो सकते हैं। उदाहरण: एक कक्षा में छात्रों की ऊँचाई का वितरण, जहाँ पुरुषों और महिलाओं के लिए अलग-अलग शिखर हो सकते हैं।
समूहीकृत और असमूहीकृत आवृत्ति वितरण: आवृत्ति वितरण को दो मुख्य तरीकों से प्रस्तुत किया जा सकता है:
1. असमूहीकृत आवृत्ति वितरण (Ungrouped Frequency Distribution): इस प्रकार के वितरण में, डेटासेट में प्रत्येक व्यक्तिगत स्कोर को सूचीबद्ध किया जाता है और प्रत्येक स्कोर की आवृत्ति (यह कितनी बार आता है) दिखाई जाती है। यह तब उपयोगी होता है जब डेटासेट में मानों की सीमा छोटी होती है। उदाहरण: मान लीजिए 20 छात्रों की एक क्विज़ के स्कोर (10 में से) इस प्रकार हैं: 7, 8, 9, 7, 8, 6, 5, 8, 7, 9, 10, 8, 7, 6, 8, 8, 7, 9, 8, 7। असमूहीकृत आवृत्ति वितरण तालिका इस तरह दिखेगी:
स्कोर (x) | आवृत्ति (f) 5 | 1 6 | 2 7 | 6 8 | 7 9 | 3 10 | 1
2. समूहीकृत आवृत्ति वितरण (Grouped Frequency Distribution): जब डेटा की सीमा बड़ी होती है, तो प्रत्येक व्यक्तिगत स्कोर को सूचीबद्ध करना अव्यावहारिक होता है। इस मामले में, डेटा को वर्ग अंतरालों (class intervals) नामक समूहों में व्यवस्थित किया जाता है, और प्रत्येक अंतराल में आने वाले स्कोर की आवृत्ति दर्ज की जाती है। उदाहरण: मान लीजिए 50 छात्रों के सांख्यिकी परीक्षा के स्कोर (100 में से) हैं। हम 10 अंकों के वर्ग अंतराल बना सकते हैं। समूहीकृत आवृत्ति वितरण तालिका इस तरह दिख सकती है:
वर्ग अंतराल | आवृत्ति (f) 40-49 | 3 50-59 | 5 60-69 | 12 70-79 | 18 80-89 | 9 90-99 | 3
यह डेटा को अधिक संक्षिप्त और प्रबंधनीय तरीके से सारांशित करता है, जिससे समग्र पैटर्न को देखना आसान हो जाता है, हालाँकि कुछ व्यक्तिगत स्कोर जानकारी खो जाती है।
Q3. निम्नलिखित डेटा के लिए माध्य, माध्यिका व बहुलक की गणना कीजिए: 5+5
xX Y
3 1
4 2
5 3
5 4
6 5
0 5
5 3
8 1
0 2
2 0
Ans. इस प्रश्न में दो डेटा सेट, X और Y दिए गए हैं। हम प्रत्येक डेटा सेट के लिए केंद्रीय प्रवृत्ति के तीन मापों – माध्य, माध्यिका और बहुलक की गणना करेंगे।
डेटा सेट X के लिए गणना: X के मान हैं: 3, 4, 5, 5, 6, 0, 5, 8, 0, 2 अवलोकनों की संख्या (N) = 10
1. माध्य (Mean): माध्य की गणना सभी मानों को जोड़कर और मानों की कुल संख्या से विभाजित करके की जाती है। माध्य (μ) = ΣX / N ΣX = 3 + 4 + 5 + 5 + 6 + 0 + 5 + 8 + 0 + 2 = 38 माध्य = 38 / 10 = 3.8
2. माध्यिका (Median): माध्यिका वह मध्य मान है जब डेटा को आरोही क्रम में व्यवस्थित किया जाता है। आरोही क्रम में डेटा: 0, 0, 2, 3, 4, 5, 5, 5, 6, 8 चूंकि N = 10 (एक सम संख्या), माध्यिका 5वें और 6वें मान का औसत होगी। 5वां मान = 4 6वां मान = 5 माध्यिका = (4 + 5) / 2 = 9 / 2 = 4.5
3. बहुलक (Mode): बहुलक वह मान है जो डेटा सेट में सबसे अधिक बार आता है। डेटा सेट (0, 0, 2, 3, 4, 5, 5, 5, 6, 8) में, मान ‘5’ तीन बार आता है, जो किसी भी अन्य मान से अधिक है। अतः, बहुलक = 5
—
डेटा सेट Y के लिए गणना: Y के मान हैं: 1, 2, 3, 4, 5, 5, 3, 1, 2, 0 अवलोकनों की संख्या (N) = 10
1. माध्य (Mean): माध्य (μ) = ΣY / N ΣY = 1 + 2 + 3 + 4 + 5 + 5 + 3 + 1 + 2 + 0 = 26 माध्य = 26 / 10 = 2.6
2. माध्यिका (Median): आरोही क्रम में डेटा: 0, 1, 1, 2, 2, 3, 3, 4, 5, 5 चूंकि N = 10 (एक सम संख्या), माध्यिका 5वें और 6वें मान का औसत होगी। 5वां मान = 2 6वां मान = 3 माध्यिका = (2 + 3) / 2 = 5 / 2 = 2.5
3. बहुलक (Mode): बहुलक वह मान है जो सबसे अधिक बार आता है। इस डेटा सेट में, मान 1, 2, 3, और 5 सभी दो-दो बार आते हैं। चूंकि कोई एक मान दूसरों की तुलना में अधिक बार नहीं आता है, और कई मान समान उच्चतम आवृत्ति साझा करते हैं, इसलिए यह एक बहु-बहुलकी (multimodal) वितरण है। बहुलक = 1, 2, 3, और 5
Q4. निम्नलिखित आँकड़ों के लिए स्पीयरमैन के कोटि अनुक्रम सहसम्बन्ध की गणना कीजिए: 10
आँकड़ा A | आँकड़ा B
2 | 1
3 | 2
1 | 3
4 | 5
7 | 8
6 | 9
0 | 6
9 | 7
1 | 0
5 | 4
Ans. स्पीयरमैन का कोटि अनुक्रम सहसंबंध गुणांक (rho या ρ) दो चरों के बीच संबंध की ताकत और दिशा को मापता है जो क्रमसूचक पैमाने पर मापा जाता है। इसकी गणना के लिए निम्नलिखित चरण हैं:
चरण 1: दोनों डेटा सेटों को रैंक करना हम डेटा A (इसे X कहेंगे) और डेटा B (इसे Y कहेंगे) के प्रत्येक मान को अलग-अलग रैंक देंगे। सबसे छोटे मान को रैंक 1 दिया जाएगा। यदि मान बराबर (टाई) होते हैं, तो हम उनके रैंकों का औसत लेंगे।
डेटा A के लिए रैंकिग (Rx): मूल स्कोर (A): 2, 3, 1, 4, 7, 6, 0, 9, 1, 5 आरोही क्रम: 0, 1, 1, 2, 3, 4, 5, 6, 7, 9 रैंक: 1, (2+3)/2=2.5, 2.5, 4, 5, 6, 7, 8, 9, 10
डेटा B के लिए रैंकिग (Ry): मूल स्कोर (B): 1, 2, 3, 5, 8, 9, 6, 7, 0, 4 आरोही क्रम: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 रैंक: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 (कोई टाई नहीं)
चरण 2: रैंकों के बीच अंतर (d) और उनके वर्ग (d²) की गणना करना अब हम प्रत्येक जोड़ी के लिए एक तालिका बनाएंगे।
डेटा A (X)
डेटा B (Y)
रैंक A (Rx)
रैंक B (Ry)
अंतर (d = Rx – Ry)
d²
2
1
4
2
2
4.00
3
2
5
3
2
4.00
1
3
2.5
4
-1.5
2.25
4
5
6
6
0
0.00
7
8
9
9
0
0.00
6
9
8
10
-2
4.00
0
6
1
7
-6
36.00
9
7
10
8
2
4.00
1
0
2.5
1
1.5
2.25
5
4
7
5
2
4.00
कुल (Σd²)
60.50
चरण 3: स्पीयरमैन के Rho (ρ) सूत्र का उपयोग करना सूत्र है: ρ = 1 – [ (6 Σd²) / (N (N² – 1)) ] यहाँ, N = 10 (जोड़ियों की संख्या) और Σd² = 60.50
N (N² – 1) = 10 (10² – 1) = 10 (100 – 1) = 10 99 = 990
अब मानों को सूत्र में रखें: ρ = 1 – [ (6 * 60.50) / 990 ] ρ = 1 – [ 363 / 990 ] ρ = 1 – 0.3667 ρ ≈ 0.633
निष्कर्ष: स्पीयरमैन का Rho (ρ) लगभग 0.633 है। यह एक मध्यम से मजबूत सकारात्मक सहसंबंध को इंगित करता है, जिसका अर्थ है कि जैसे-जैसे डेटा A में मान बढ़ते हैं, डेटा B में भी मान बढ़ने की प्रवृत्ति होती है।
Q5. मानक विचलन के गुणों और सीमाओं की व्याख्या कीजिए। निम्नलिखित आँकड़ों के लिए मानक विचलन (S.D.) की गणना कीजिए: 5+5 5, 4, 6, 0, 9
Ans. मानक विचलन (Standard Deviation – SD) विचरणशीलता का सबसे अधिक उपयोग किया जाने वाला और विश्वसनीय माप है। यह बताता है कि डेटा के मान अपने माध्य से औसतन कितनी दूर हैं।
मानक विचलन के गुण (Merits):
- सभी मानों पर आधारित: रेंज या चतुर्थक विचलन के विपरीत, मानक विचलन की गणना में डेटा सेट के प्रत्येक स्कोर का उपयोग किया जाता है, जिससे यह विचरणशीलता का एक व्यापक माप बन जाता है।
- स्थिरता: यह विचरणशीलता का सबसे स्थिर माप है। यदि एक ही जनसंख्या से कई नमूने लिए जाते हैं, तो उनके मानक विचलन अन्य मापों की तुलना में कम भिन्न होंगे।
- आगे के सांख्यिकीय विश्लेषण का आधार: यह कई उन्नत सांख्यिकीय तकनीकों, जैसे टी-टेस्ट, एनोवा, सहसंबंध और प्रतिगमन विश्लेषण का एक मूलभूत घटक है।
- सुपरिभाषित गणितीय गुण: इसका एक निश्चित गणितीय सूत्र है, जो इसे बीजगणितीय हेरफेर के लिए उपयुक्त बनाता है। सामान्य वितरण के साथ संयुक्त होने पर, यह डेटा के प्रतिशत को समझने में मदद करता है जो माध्य से एक निश्चित दूरी के भीतर आते हैं।
मानक विचलन की सीमाएँ (Limitations):
- चरम मानों से प्रभावित: चूँकि यह सभी मानों पर आधारित है, यह चरम मानों या आउटलायर्स (outliers) से बहुत अधिक प्रभावित हो सकता है, जो विचरणशीलता के माप को विकृत कर सकता है।
- समझने में कठिनाई: रेंज की तुलना में, मानक विचलन की अवधारणा और गणना गैर-विशेषज्ञों के लिए समझना अधिक कठिन हो सकती है।
- खुले-अंत वाले वितरण के लिए अनुपयुक्त: यदि किसी आवृत्ति वितरण में खुले-अंत वाले वर्ग हैं (जैसे “80 से अधिक”), तो मानक विचलन की गणना नहीं की जा सकती क्योंकि सभी मानों का उपयोग करना संभव नहीं है।
मानक विचलन की गणना: दिए गए आँकड़े: 5, 4, 6, 0, 9 अवलोकनों की संख्या (N) = 5
चरण 1: माध्य (Mean) की गणना करें। माध्य (M) = (5 + 4 + 6 + 0 + 9) / 5 माध्य (M) = 24 / 5 = 4.8
चरण 2: प्रत्येक मान के लिए विचलन (X – M) और उसके वर्ग (X – M)² की गणना करें।
स्कोर (X)
माध्य (M)
विचलन (X – M)
वर्गित विचलन (X – M)²
5
4.8
0.2
0.04
4
4.8
-0.8
0.64
6
4.8
1.2
1.44
0
4.8
-4.8
23.04
9
4.8
4.2
17.64
वर्गित विचलनों का योग (SS)
42.80
चरण 3: प्रसरण (Variance) की गणना करें। नमूना प्रसरण (s²) = SS / (N – 1) s² = 42.80 / (5 – 1) = 42.80 / 4 = 10.7
चरण 4: मानक विचलन (SD) की गणना करें। मानक विचलन (s) प्रसरण का वर्गमूल है। s = √10.7 ≈ 3.27
अतः, दिए गए आँकड़ों के लिए मानक विचलन लगभग 3.27 है।
Q6. निम्नलिखित पर लगभग 50 शब्दों में (प्रत्येक) संक्षिप्त टिप्पणियाँ लिखिए: 6+4 (क) पियर्सन का गुणन आघूर्ण सहसम्बन्ध के अन्तर्निहित अभिग्रह और ‘r’ की गणना (ख) परिवर्तनशीलता के कार्य
Ans. (क) पियर्सन का गुणन आघूर्ण सहसम्बन्ध के अन्तर्निहित अभिग्रह और ‘r’ की गणना
पियर्सन का ‘r’ दो सतत चरों के बीच रैखिक संबंध की डिग्री और दिशा को मापता है। इसके मुख्य अभिग्रह हैं: रैखिक संबंध (चरों का संबंध एक सीधी रेखा द्वारा सर्वोत्तम रूप से वर्णित हो), अंतराल या अनुपात पैमाना , द्विचर सामान्यता (दोनों चर एक साथ सामान्य रूप से वितरित हों), और समरूपता (homoscedasticity)। ‘r’ की गणना कच्चे स्कोर, विचलन स्कोर या z-स्कोर का उपयोग करके की जा सकती है, जो अनिवार्य रूप से दो चरों के सह-प्रसरण को उनके मानक विचलनों के गुणनफल से विभाजित करता है।
(ख) परिवर्तनशीलता के कार्य
परिवर्तनशीलता (Variability), या फैलाव, के कई महत्वपूर्ण कार्य हैं। यह बताता है कि एक वितरण में स्कोर कितने फैले हुए हैं। यह केंद्रीय प्रवृत्ति के माप की प्रतिनिधिता का आकलन करने में मदद करता है (कम परिवर्तनशीलता का मतलब है कि माध्य अधिक प्रतिनिधि है)। यह स्कोर की स्थिरता का एक संकेतक है और दो या दो से अधिक समूहों की संगति की तुलना करने की अनुमति देता है। अंत में, यह आनुमानिक सांख्यिकी के लिए महत्वपूर्ण है, क्योंकि टी-टेस्ट और एनोवा जैसे परीक्षण समूहों के बीच अंतर का मूल्यांकन करने के लिए समूह के भीतर की परिवर्तनशीलता पर विचार करते हैं।
Q7. सहसम्बन्ध के गुणों, उपयोग और सीमाओं का वर्णन कीजिए। 10
Ans. सहसंबंध एक सांख्यिकीय माप है जो दो या दो से अधिक चरों के बीच संबंध की सीमा और दिशा को व्यक्त करता है। इसके महत्वपूर्ण गुण, उपयोग और सीमाएँ हैं।
सहसंबंध के गुण (Properties):
- सीमा: सहसंबंध गुणांक, जिसे ‘r’ द्वारा दर्शाया जाता है, हमेशा -1.00 और +1.00 के बीच होता है।
- दिशा: गुणांक का चिह्न संबंध की दिशा को इंगित करता है। एक धनात्मक चिह्न (+) एक सकारात्मक संबंध को इंगित करता है (जैसे, एक चर बढ़ता है, तो दूसरा भी बढ़ता है)। एक ऋणात्मक चिह्न (-) एक नकारात्मक या व्युत्क्रम संबंध को इंगित करता है (जैसे, एक चर बढ़ता है, तो दूसरा घटता है)।
- परिमाण: गुणांक का संख्यात्मक मान (चिह्न के बिना) संबंध की ताकत को इंगित करता है। 0 के करीब का मान एक कमजोर संबंध को इंगित करता है, जबकि 1 (या -1) के करीब का मान एक मजबूत संबंध को इंगित करता है। 0 का सहसंबंध कोई रैखिक संबंध नहीं दर्शाता है।
- समरूपता: चर X और Y के बीच का सहसंबंध, चर Y और X के बीच के सहसंबंध के समान होता है (r_xy = r_yx)।
सहसंबंध के उपयोग (Uses):
- संबंध का वर्णन: इसका प्राथमिक उपयोग दो चरों के बीच संबंध की ताकत और दिशा का वर्णन करना है, जैसे कि अध्ययन के घंटे और परीक्षा के अंकों के बीच।
- भविष्यवाणी: यदि दो चरों के बीच एक मजबूत सहसंबंध मौजूद है, तो एक चर के मान का उपयोग दूसरे चर के मान की भविष्यवाणी के लिए किया जा सकता है। यह प्रतिगमन विश्लेषण (regression analysis) का आधार है।
- सिद्धांत परीक्षण: शोधकर्ता मनोवैज्ञानिक सिद्धांतों का परीक्षण करने के लिए सहसंबंध का उपयोग करते हैं। उदाहरण के लिए, एक सिद्धांत का परीक्षण करना कि आत्म-सम्मान और अवसाद के बीच एक नकारात्मक संबंध है।
- विश्वसनीयता और वैधता: साइकोमेट्रिक्स में, सहसंबंध का उपयोग परीक्षणों और उपायों की विश्वसनीयता (जैसे, परीक्षण-पुनः परीक्षण विश्वसनीयता) और वैधता (जैसे, कसौटी वैधता) स्थापित करने के लिए किया जाता है।
सहसंबंध की सीमाएँ (Limitations):
- कारण-कार्य संबंध का अभाव: यह सबसे महत्वपूर्ण सीमा है। सहसंबंध कार्य-कारण संबंध को सिद्ध नहीं करता है। यदि दो चर सहसंबद्ध हैं, तो यह हो सकता है कि A, B का कारण है; B, A का कारण है; या एक तीसरा अज्ञात चर C, A और B दोनों का कारण है।
- रैखिकता: पियर्सन सहसंबंध केवल रैखिक (सीधी-रेखा) संबंधों को मापता है। यह वक्ररेखीय संबंधों (curvilinear relationships) का पता नहीं लगा सकता, जहाँ सहसंबंध गुणांक शून्य के करीब हो सकता है, भले ही एक मजबूत संबंध मौजूद हो।
- सीमा का प्रतिबंध: यदि एक या दोनों चरों पर डेटा की सीमा प्रतिबंधित है, तो सहसंबंध गुणांक कृत्रिम रूप से कम हो सकता है, जो संबंध की वास्तविक ताकत को कम आंकता है।
- आउटलायर्स का प्रभाव: चरम स्कोर या आउटलायर्स सहसंबंध गुणांक के मान और दिशा को बहुत अधिक प्रभावित कर सकते हैं।
Q8. मानक प्राप्तांक (Z-प्राप्तांक) की अवधारणा को स्पष्ट कीजिए। मानक प्राप्तांक के गुणों और उपयोग की व्याख्या कीजिए। 5+5
Ans.
मानक प्राप्तांक (Z-प्राप्तांक) की अवधारणा:
एक मानक प्राप्तांक, जिसे आमतौर पर Z-प्राप्तांक (Z-score) के रूप में जाना जाता है, एक सांख्यिकीय माप है जो बताता है कि एक कच्चा प्राप्तांक (raw score) अपने वितरण के माध्य से कितने मानक विचलन (standard deviations) दूर है। यह एक कच्चे प्राप्तांक को एक मानकीकृत पैमाने पर रूपांतरित करता है, जो विभिन्न वितरणों से प्राप्तांकों की तुलना करने की अनुमति देता है।
Z-प्राप्तांक की गणना के लिए सूत्र है: Z = (X – μ) / σ
जहाँ:
- X = व्यक्तिगत कच्चा प्राप्तांक
- μ = वितरण का माध्य (mean)
- σ = वितरण का मानक विचलन (standard deviation)
एक Z-प्राप्तांक का चिह्न (धनात्मक या ऋणात्मक) बताता है कि कच्चा प्राप्तांक माध्य से ऊपर है या नीचे। एक धनात्मक Z-प्राप्तांक इंगित करता है कि प्राप्तांक माध्य से ऊपर है, जबकि एक ऋणात्मक Z-प्राप्तांक इंगित करता है कि यह माध्य से नीचे है। Z-प्राप्तांक का परिमाण यह बताता है कि प्राप्तांक माध्य से कितने मानक विचलन दूर है। उदाहरण के लिए, Z = +1.5 का मतलब है कि प्राप्तांक माध्य से 1.5 मानक विचलन ऊपर है।
मानक प्राप्तांक के गुण और उपयोग:
गुण (Properties):
- माध्य शून्य होता है: जब किसी भी कच्चे प्राप्तांकों के वितरण को Z-प्राप्तांकों में परिवर्तित किया जाता है, तो नए Z-प्राप्तांकों के वितरण का माध्य हमेशा 0 होगा।
- मानक विचलन एक होता है: Z-प्राप्तांकों के वितरण का मानक विचलन हमेशा 1 होता है। यह मानकीकरण का एक प्रमुख परिणाम है।
- आकार अपरिवर्तित रहता है: कच्चे प्राप्तांकों को Z-प्राप्तांकों में बदलने से वितरण का आकार नहीं बदलता है। यदि मूल वितरण धनात्मक रूप से विषम था, तो Z-प्राप्तांकों का वितरण भी धनात्मक रूप से विषम होगा।
- प्रत्यक्ष तुलना: Z-प्राप्तांक इकाई-मुक्त होते हैं, जो विभिन्न पैमानों पर मापे गए प्राप्तांकों की सीधी तुलना को सक्षम करते हैं।
उपयोग (Uses):
- विभिन्न वितरणों से प्राप्तांकों की तुलना: Z-प्राप्तांकों का सबसे आम उपयोग विभिन्न परीक्षणों या मापों से प्राप्तांकों की तुलना करना है। उदाहरण के लिए, एक छात्र के गणित (माध्य=70, SD=5) में 80 के स्कोर और इतिहास (माध्य=75, SD=10) में 80 के स्कोर की तुलना करने के लिए, हम Z-प्राप्तांकों की गणना कर सकते हैं।
- आउटलायर्स की पहचान: Z-प्राप्तांकों का उपयोग उन डेटा बिंदुओं की पहचान के लिए किया जा सकता है जो बाकी डेटा से काफी अलग हैं। आमतौर पर, ±3.0 से परे के Z-प्राप्तांकों को आउटलायर्स माना जाता है।
- सामान्य वक्र के तहत संभाव्यता की गणना: सामान्य रूप से वितरित डेटा के लिए, Z-प्राप्तांकों का उपयोग यह निर्धारित करने के लिए किया जा सकता है कि किसी विशेष प्राप्तांक से ऊपर या नीचे स्कोर का क्या प्रतिशत आता है।
- सांख्यिकीय सूत्रों में उपयोग: Z-प्राप्तांक कई उन्नत सांख्यिकीय सूत्रों, जैसे पियर्सन सहसंबंध गुणांक के एक संस्करण, का एक महत्वपूर्ण घटक हैं।
IGNOU BPCC-104 Previous Year Solved Question Paper in English
Q1. Discuss the limitations and misinterpretations of statistics. Describe the various scales of measurement with the help of suitable examples. 4+6
Ans. Statistics is a powerful tool in psychological research, but it has certain limitations and is prone to misinterpretation.
Limitations and Misinterpretations of Statistics:
- Not Applicable to Qualitative Data: Statistics primarily deals with numerical data. It cannot directly study qualitative phenomena like honesty, beauty, or intelligence unless they are converted into a quantitative form.
- Does Not Study Individuals: Statistics is concerned with groups and aggregate trends, not individual cases. The average score of a group does not give precise information about any single individual.
- Correlation vs. Causation: A statistical correlation does not imply causation. For example, there might be a positive correlation between ice cream sales and crime rates, but this does not mean eating ice cream causes crime. A third factor (e.g., hot weather) may be influencing both.
- Potential for Misuse: Results can be manipulated by selectively choosing data or presenting it in a misleading way. For instance, truncating the Y-axis of a graph can make minor differences seem very large.
- Over-simplification: Reducing complex psychological phenomena to numbers can lead to a loss of richness and nuance.
Scales of Measurement: In psychology, four main scales are used to measure variables:
- Nominal Scale: This is the simplest scale. It uses labels to classify data into categories with no inherent order. Examples: Gender (1=Male, 2=Female), Marital Status (1=Married, 2=Unmarried, 3=Divorced). The numbers here are just labels and have no mathematical value.
- Ordinal Scale: This scale arranges data in an order or rank, but the difference between categories is not equal or known. Examples: Ranks in a competition (1st, 2nd, 3rd), or levels of satisfaction (1=Very Dissatisfied, 2=Dissatisfied, 3=Neutral, 4=Satisfied, 5=Very Satisfied). We know that rank 1 is better than rank 2, but we cannot say by how much.
- Interval Scale: This scale has order, and the interval between units is equal and measurable. However, it lacks a true zero point (absolute zero). Examples: Temperature in Celsius or Fahrenheit, or standardized IQ scores. The difference between 20°C and 30°C is the same as between 30°C and 40°C, but 0°C does not mean “no temperature”.
- Ratio Scale: This is the most sophisticated scale. It has order, equal intervals, and a true zero point, which indicates the complete absence of the variable. Examples: Age, height, weight, or reaction time. An age of 20 is twice the age of 10. A reaction time of zero means no reaction occurred. All mathematical operations are possible on this scale.
Q2. Describe the different categories of frequency distribution. Explain grouped and ungrouped frequency distribution with suitable examples. 4+6
Ans. Categories of Frequency Distribution: A frequency distribution is a table or graph that shows how often each value or set of values occurs in a dataset. The shape of the distribution provides important information about the nature of the data. The main categories are:
- Normal Distribution: Also known as the “bell curve,” in this symmetrical distribution, most scores are clustered around the center (mean), with frequencies decreasing as we move away from the mean. The mean, median, and mode are all at the same point. Many psychological traits, like IQ, are assumed to be normally distributed.
- Skewed Distribution: This is an asymmetrical distribution where the scores are more clustered at one end.
- Positively Skewed: The majority of scores are at the lower end, and the tail is longer on the right side. Example: Scores on a very difficult exam, where most students get low marks and only a few get high marks.
- Negatively Skewed: The majority of scores are at the higher end, and the tail is longer on the left side. Example: Scores on a very easy exam, where most students get high marks.
- Bimodal Distribution: This distribution has two peaks (modes), suggesting that there may be two distinct subgroups within the data. For example, the distribution of heights in a class might show separate peaks for males and females.
Grouped and Ungrouped Frequency Distribution: A frequency distribution can be presented in two main ways:
1. Ungrouped Frequency Distribution: In this type of distribution, each individual score in the dataset is listed, and the frequency of each score (how many times it appears) is shown. This is useful when the range of values in the dataset is small. Example: Suppose the scores (out of 10) for a quiz for 20 students are: 7, 8, 9, 7, 8, 6, 5, 8, 7, 9, 10, 8, 7, 6, 8, 8, 7, 9, 8, 7. The ungrouped frequency distribution table would look like this:
Score (x) | Frequency (f) 5 | 1 6 | 2 7 | 6 8 | 7 9 | 3 10 | 1
2. Grouped Frequency Distribution: When the range of the data is large, it is impractical to list every individual score. In this case, the data is organized into groups called class intervals, and the frequency of scores falling within each interval is recorded. Example: Suppose the scores on a statistics exam (out of 100) for 50 students. We can create class intervals of 10 points. The grouped frequency distribution table might look like this:
Class Interval | Frequency (f) 40-49 | 3 50-59 | 5 60-69 | 12 70-79 | 18 80-89 | 9 90-99 | 3
This summarizes the data in a more concise and manageable way, making it easier to see the overall pattern, although some individual score information is lost.
Q3. Compute mean, median and mode for the following data: 5+5
X Y 3 1 4 2 5 3 5 4 6 5 0 5 5 3 8 1 0 2 2 0
Ans. This question provides two data sets, X and Y. We will compute the three measures of central tendency—mean, median, and mode—for each data set.
Calculation for Data Set X: The values for X are: 3, 4, 5, 5, 6, 0, 5, 8, 0, 2 Number of observations (N) = 10
1. Mean: The mean is calculated by summing all values and dividing by the total number of values. Mean (μ) = ΣX / N ΣX = 3 + 4 + 5 + 5 + 6 + 0 + 5 + 8 + 0 + 2 = 38 Mean = 38 / 10 = 3.8
2. Median: The median is the middle value when the data is arranged in ascending order. Data in ascending order: 0, 0, 2, 3, 4, 5, 5, 5, 6, 8 Since N = 10 (an even number), the median is the average of the 5th and 6th values. 5th value = 4 6th value = 5 Median = (4 + 5) / 2 = 9 / 2 = 4.5
3. Mode: The mode is the value that appears most frequently in the data set. In the data set (0, 0, 2, 3, 4, 5, 5, 5, 6, 8), the value ‘5’ appears three times, which is more than any other value. Therefore, the Mode = 5
—
Calculation for Data Set Y: The values for Y are: 1, 2, 3, 4, 5, 5, 3, 1, 2, 0 Number of observations (N) = 10
1. Mean: Mean (μ) = ΣY / N ΣY = 1 + 2 + 3 + 4 + 5 + 5 + 3 + 1 + 2 + 0 = 26 Mean = 26 / 10 = 2.6
2. Median: Data in ascending order: 0, 1, 1, 2, 2, 3, 3, 4, 5, 5 Since N = 10 (an even number), the median is the average of the 5th and 6th values. 5th value = 2 6th value = 3 Median = (2 + 3) / 2 = 5 / 2 = 2.5
3. Mode: The mode is the value that appears most frequently. In this data set, the values 1, 2, 3, and 5 all appear twice. Since no single value appears more frequently than the others, and several values share the same highest frequency, this is a multimodal distribution. The Modes are 1, 2, 3, and 5 .
Q4. Compute Spearman’s rho for the following data: 10
Data A | Data B 2 | 1 3 | 2 1 | 3 4 | 5 7 | 8 6 | 9 0 | 6 9 | 7 1 | 0 5 | 4
Ans. Spearman’s rank-order correlation coefficient (rho or ρ) measures the strength and direction of the relationship between two variables measured on an ordinal scale. The steps to calculate it are as follows:
Step 1: Rank both sets of data We will rank each value in Data A (let’s call it X) and Data B (let’s call it Y) separately. The smallest value gets rank 1. If values are tied, we take the average of their ranks.
Ranking for Data A (Rx): Original Scores (A): 2, 3, 1, 4, 7, 6, 0, 9, 1, 5 Ascending Order: 0, 1, 1, 2, 3, 4, 5, 6, 7, 9 Ranks: 1, (2+3)/2=2.5, 2.5, 4, 5, 6, 7, 8, 9, 10
Ranking for Data B (Ry): Original Scores (B): 1, 2, 3, 5, 8, 9, 6, 7, 0, 4 Ascending Order: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 Ranks: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 (No ties)
Step 2: Calculate the difference between ranks (d) and their squares (d²) We will now create a table for each pair.
| Data A (X) | Data B (Y) | Rank A (Rx) | Rank B (Ry) | Difference (d = Rx – Ry) | d² |
|---|---|---|---|---|---|
| 2 | 1 | 4 | 2 | 2 | 4.00 |
| 3 | 2 | 5 | 3 | 2 | 4.00 |
| 1 | 3 | 2.5 | 4 | -1.5 | 2.25 |
| 4 | 5 | 6 | 6 | 0 | 0.00 |
| 7 | 8 | 9 | 9 | 0 | 0.00 |
| 6 | 9 | 8 | 10 | -2 | 4.00 |
| 0 | 6 | 1 | 7 | -6 | 36.00 |
| 9 | 7 | 10 | 8 | 2 | 4.00 |
| 1 | 0 | 2.5 | 1 | 1.5 | 2.25 |
| 5 | 4 | 7 | 5 | 2 | 4.00 |
Total (Σd²) |
60.50 |
||||
Step 3: Use the Spearman’s Rho (ρ) formula The formula is: ρ = 1 – [ (6 Σd²) / (N (N² – 1)) ] Here, N = 10 (number of pairs) and Σd² = 60.50
N (N² – 1) = 10 (10² – 1) = 10 (100 – 1) = 10 99 = 990
Now, substitute the values into the formula: ρ = 1 – [ (6 * 60.50) / 990 ] ρ = 1 – [ 363 / 990 ] ρ = 1 – 0.3667 ρ ≈ 0.633
Conclusion: The Spearman’s Rho (ρ) is approximately 0.633 . This indicates a moderate to strong positive correlation , meaning that as the values in Data A tend to increase, the values in Data B also tend to increase.
Q5. Explain the merits and limitations of standard deviation. Compute standard deviation for the following data: 5+5 5, 4, 6, 0, 9
Ans. The standard deviation (SD) is the most commonly used and reliable measure of variability. It indicates how much, on average, the values in a dataset deviate from their mean.
Merits of Standard Deviation:
- Based on All Values: Unlike the range or interquartile range, the calculation of the standard deviation uses every score in the data set, making it a comprehensive measure of variability.
- Stability: It is the most stable measure of variability. If multiple samples are drawn from the same population, their standard deviations will vary less than other measures.
- Basis for Further Statistical Analysis: It is a fundamental component of many advanced statistical techniques, such as t-tests, ANOVA, correlation, and regression analysis.
- Well-Defined Mathematical Properties: It has a precise mathematical formula, making it suitable for algebraic manipulation. When combined with the normal distribution, it helps in understanding the percentage of data that falls within a certain distance from the mean.
Limitations of Standard Deviation:
- Affected by Extreme Values: Because it is based on all values, it can be heavily influenced by extreme values or outliers, which can distort the measure of variability.
- Difficulty in Understanding: Compared to the range, the concept and calculation of the standard deviation can be more difficult for non-specialists to understand.
- Not Suitable for Open-Ended Distributions: If a frequency distribution has open-ended classes (e.g., “more than 80”), the standard deviation cannot be calculated because it is not possible to use all values.
Calculation of Standard Deviation: Given data: 5, 4, 6, 0, 9 Number of observations (N) = 5
Step 1: Calculate the Mean (M). Mean (M) = (5 + 4 + 6 + 0 + 9) / 5 Mean (M) = 24 / 5 = 4.8
Step 2: Calculate the deviation (X – M) and its square (X – M)² for each value.
| Score (X) | Mean (M) | Deviation (X – M) | Squared Deviation (X – M)² |
|---|---|---|---|
| 5 | 4.8 | 0.2 | 0.04 |
| 4 | 4.8 | -0.8 | 0.64 |
| 6 | 4.8 | 1.2 | 1.44 |
| 0 | 4.8 | -4.8 | 23.04 |
| 9 | 4.8 | 4.2 | 17.64 |
Sum of Squared Deviations (SS) |
42.80 |
||
Step 3: Calculate the Variance (s²). For a sample, Variance (s²) = SS / (N – 1) s² = 42.80 / (5 – 1) = 42.80 / 4 = 10.7
Step 4: Calculate the Standard Deviation (s). The standard deviation (s) is the square root of the variance. s = √10.7 ≈ 3.27
Therefore, the standard deviation for the given data is approximately 3.27 .
Q6. Write short notes on the following in about 50 words each: 6+4 (a) Assumptions underlying Pearson’s Product Moment Coefficient of Correlation and computation of ‘r’ (b) Functions of variability
Ans. (a) Assumptions underlying Pearson’s Product Moment Coefficient of Correlation and computation of ‘r’
Pearson’s ‘r’ measures the degree and direction of the linear relationship between two continuous variables. Its key assumptions are: linear relationship (the association is best described by a straight line), interval or ratio scale data, bivariate normality (both variables are normally distributed together), and homoscedasticity . Computation of ‘r’ can be done using raw scores, deviation scores, or z-scores, essentially dividing the covariance of the two variables by the product of their standard deviations.
(b) Functions of variability
Variability, or dispersion, serves several vital functions. It describes how spread out the scores are in a distribution. It helps in assessing the representativeness of a measure of central tendency (less variability means the mean is more representative). It is an indicator of the consistency of scores and allows for comparing the consistency of two or more groups. Finally, it is crucial for inferential statistics , as tests like t-tests and ANOVA consider within-group variability to evaluate differences between groups.
Q7. Describe the properties, uses and limitations of correlation. 10
Ans. Correlation is a statistical measure that expresses the extent and direction of the relationship between two or more variables. It has important properties, uses, and limitations.
Properties of Correlation:
- Range: The correlation coefficient, denoted by ‘r’, always lies between -1.00 and +1.00 .
- Direction: The sign of the coefficient indicates the direction of the relationship. A positive sign (+) indicates a positive relationship (as one variable increases, the other tends to increase). A negative sign (-) indicates a negative or inverse relationship (as one variable increases, the other tends to decrease).
- Magnitude: The numerical value of the coefficient (without the sign) indicates the strength of the relationship. A value close to 0 indicates a weak relationship, while a value close to 1 (or -1) indicates a strong relationship. A correlation of 0 indicates no linear relationship.
- Symmetry: The correlation between variable X and Y is the same as the correlation between Y and X (r_xy = r_yx).
Uses of Correlation:
- Describing Relationships: Its primary use is to describe the strength and direction of the relationship between two variables, such as between hours of study and exam scores.
- Prediction: If a strong correlation exists between two variables, the value of one variable can be used to predict the value of the other. This is the basis of regression analysis.
- Theory Testing: Researchers use correlation to test psychological theories. For example, testing a theory that there is a negative relationship between self-esteem and depression.
- Reliability and Validity: In psychometrics, correlation is used to establish the reliability (e.g., test-retest reliability) and validity (e.g., criterion validity) of tests and measures.
Limitations of Correlation:
- Lack of Causation: This is the most critical limitation. Correlation does not prove causation. If two variables are correlated, it could be that A causes B; B causes A; or a third, unknown variable C is causing both A and B.
- Linearity: Pearson correlation only measures linear (straight-line) relationships . It may fail to detect curvilinear relationships, where the correlation coefficient could be near zero even if a strong relationship exists.
- Restriction of Range: If the range of data on one or both variables is restricted, the correlation coefficient may be artificially lowered, underestimating the true strength of the relationship.
- Effect of Outliers: Extreme scores, or outliers, can have a very strong influence on the value and direction of the correlation coefficient.
Q8. Elucidate the concept of standard score (Z-score). Explain the properties and uses of standard score. 5+5
Ans. Concept of Standard Score (Z-score):
A standard score, commonly known as a Z-score , is a statistical measurement that describes a raw score’s relationship to the mean of its distribution in terms of standard deviations. It transforms a raw score onto a standardized scale, which allows for the comparison of scores from different distributions.
The formula for calculating a Z-score is: Z = (X – μ) / σ
Where:
- X = The individual raw score
- μ = The mean of the distribution
- σ = The standard deviation of the distribution
The sign of the Z-score (positive or negative) tells whether the raw score is above or below the mean. A positive Z-score indicates the score is above the mean, while a negative Z-score indicates it is below the mean. The magnitude of the Z-score tells how many standard deviations the score is away from the mean. For example, a Z = +1.5 means the score is 1.5 standard deviations above the mean.
Properties and Uses of Standard Score:
Properties:
- Mean is Zero: When any distribution of raw scores is converted to Z-scores, the mean of the new distribution of Z-scores will always be 0 .
- Standard Deviation is One: The standard deviation of a distribution of Z-scores is always 1 . This is a key outcome of standardization.
- Shape Remains Unchanged: Converting raw scores to Z-scores does not change the shape of the distribution. If the original distribution was positively skewed, the distribution of Z-scores will also be positively skewed.
- Direct Comparison: Z-scores are unit-free, which enables direct comparison of scores measured on different scales.
Uses:
- Comparing Scores from Different Distributions: The most common use of Z-scores is to compare scores from different tests or measures. For example, to compare a student’s score of 80 in Math (Mean=70, SD=5) with a score of 80 in History (Mean=75, SD=10), we can calculate their Z-scores.
- Identifying Outliers: Z-scores can be used to identify data points that are significantly different from the rest of the data. Typically, Z-scores beyond ±3.0 are considered outliers.
- Calculating Probabilities under the Normal Curve: For normally distributed data, Z-scores are used to determine the percentage of scores that fall above or below a particular score.
- Use in Statistical Formulas: Z-scores are a crucial component of many advanced statistical formulas, such as one version of the Pearson correlation coefficient.
Download IGNOU previous Year Question paper download PDFs for BPCC-104 to improve your preparation. These ignou solved question paper IGNOU Previous Year Question paper solved PDF in Hindi and English help you understand the exam pattern and score better.
Thanks!
Leave a Reply