अध्याय 3. आंकड़ों का संगठन
प्रश्नोत्तर
निम्नलिखित में से कौन-सा विकल्प सही है?
प्र.1. एक वर्ग
मध्यबिन्दु बराबर हैं :
(क) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के
औसत के।
(ख) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के गुणनफल के।
(ग) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के अनुपात के।
(घ) उपरोक्त में से कोई नहीं।
प्र.2. दो चरों के बारंबारता वितरण को इस नाम
से जानते हैं?
(क) एक विचर वितरण
(ख) द्विचर वितरण
(ग) बहुचर वितरण
(घ) उपरोक्त में से कोई नहीं
प्र.3. वर्गीकृत
आँकड़ों में सांख्यिकीय परिकलेन आधारित होता है।
(क) प्रेक्षणों के वास्तविक मानों पर
(ख) उच्च वर्ग सीमाओं पर
(ग) निम्न वर्ग सीमाओं पर
प्र.4. अपवर्जी
विधि के अंतर्गत :
(क) किसी वर्ग की उच्च वर्ग सीमा को वर्ग अंतराल में
समावेशित नहीं करते।
(ख) किसी वर्ग की उच्च वर्ग सीमा को वर्ग अंतराल में
समावेशित करते हैं।
(ग) किसी वर्ग की निम्न वर्ग सीमा को वर्ग
अंतराल में समावेशित नहीं करते।
(घ) किसी वर्ग की निम्न वर्ग सीमा को वर्ग अंतराल में
समावेशित करते हैं।
प्र.5. परास का अर्थ है:
(क) अधिकतम एवं न्यूनतम प्रेक्षणों के बीच
अंतर
(ख) न्यूनतम एवं अधिकतम प्रेक्षणों के बीच अंतर
(ग) अधिकतम एवं न्यूनतम प्रेक्षणों का औसत
(घ) अधिकतम एवं न्यूनतम प्रेक्षणों का अनुपात
प्र.6. वस्तुओं
को वर्गीकृत करने में क्या कोई लाभ हो सकता है? अपनी दैनिक जीवन से एक उदाहरण देकर
व्याख्या कीजिए।
उत्तर : हाँ वस्तुओं को वर्गीकृत करने का बहुत लाभ है
1. यह अपरिष्कृत आँकड़ों को सांख्यिकीय विश्लेषण के लिए एक
सही रूप में संक्षिप्त करता है।
2. यह जटिलताओं को दूर करता है तथा आँकड़ों की विशेषताओं को
उजागर करता है।
3. यह तुलना करने तथा निष्कर्ष निकालने में सहायता करता है।
उदाहरण के लिए यदि एक विश्वविद्यालय के विद्यार्थियों को उनके विषय तथा लिंग के
आधार पर वर्गीकृत किया जाए तो तुलना करना अति सरल होगा।
4. यह दिए गए आँकड़ों के तत्त्वों के अंतर संबंध के बारे
में जानकारी प्रदान करता है। उदाहरण के लिए साक्षरता तथा अपराध दरों के आँकड़ों से
हम यह सहसंबंध स्थापित कर सकते हैं कि क्या ये एक दूसरे से संबंधित हैं।
5. यह समान तत्वों को एक समान करके आँकड़ों को समरूप समूहों
में परिवर्तित करता है तथा उनमें समान व असमानताएँ ज्ञात करता है।
प्र.7. चर क्या
है? एक संतत तथा विविक्त चर के बीच भेद कीजिए।
उत्तर : किसी तथ्य की विशेषता या प्रक्रिया जिसे संख्याओं
के रूप में मापा जा सके तथा जो समय प्रति समय, व्यक्ति प्रति व्यक्ति तथा समये
प्रति समय परिवर्तनशील हो, उसे चर कहा जाता है। एक व्यक्ति की नाक चर नहीं हो सकती
क्योंकि यह परिवर्तनशील नहीं है। सभी की एक ही नाक है। कद और वजन चर है, क्योंकि
ये व्यक्ति प्रति व्यक्ति अलग-अलग होते हैं।
विविक्त तथा संतत चर
आधार |
संतत चर |
विविक्त चर |
अर्थ |
जो चर एक दी गई सीमा के भीतर कोई भी मूल्य ले सकता है वह
सतत चर कहलाता है। |
वह चर जो एकाएक या पूर्णांकों में बढ़ता है, विविक्त चर
कहलाता है। |
उदाहरण |
कद, आय, वजन, बचत |
एक परिवार में बच्चों की संख्या, सड़कों पर वाहनों की
संख्या, मशीनों की संख्या |
श्रृखला |
इसे सतत श्रृंखला द्वारा दर्शाया जाता है। |
इसे विविक्त श्रृंखला द्वारा दर्शाया जाता है। |
प्र.8. आँकड़ों
के वर्गीकरण में प्रयुक्त अपवर्जी तथा समावेशी विधियों की व्याख्या कीजिए।
उत्तर : आँकड़ों को संतत श्रृंखला में वर्गीकृत करने की दो विधियाँ
हैं:
☞ अपवर्जी श्रृंखला
☞ समावेशी श्रृंखला
अपवर्जी श्रृंखला- इस विधि में एक वर्ग की निचली सीमा अगले वर्ग की ऊपरी सीमा
होती है। इसमें ऊपरी सीमा वर्ग अन्तराल में शामिल नहीं होती। उदाहरण के लिए :
X |
F |
0-10 |
10 |
10-20 |
5 |
20-30 |
4 |
30-40 |
8 |
40-50 |
6 |
समावेशी श्रृंखला-
इस विधि में एक वर्ग की निचली सीमा अगले वर्ग की ऊपरी सीमा
नहीं होती। इसमें निम्न तथा उच्च दोनों सीमाएँ वर्ग अंतराल में शामिल होती हैं।
उदाहरण के लिए:
अंक (x) |
विद्यार्थियों की संख्या |
0-9 |
10 |
10-19 |
5 |
20-29 |
4 |
30-39 |
8 |
40-49 |
9 |
प्र.9. सारणी
3.2 के आँकड़ों का प्रयोग करें, जो 50 परिवारों के भोजन पर मासिक व्यय (रु. में)
को दिखलाती है, और
(क) भोजन पर मासिक परिवारिक व्यय का प्रसार ज्ञात कीजिए।
(ख) परास को वर्ग अंतराल की उचित संख्याओं में विभाजित करें
तथा व्यय का बारंबारता वितरण प्राप्त करें।
उन परिवारों की संख्या पता कीजिए जिनका भोजन पर मासिक व्यय
(क) 2000/- रु. से कम है।
(ख) 3000/- रु. में अधिक है।
(ग) 1500/-रु. और 2500 रु के बीच है।
उत्तर :
(क) प्रसाल = अधिकतम मान - न्यूनतम मान = 5090 - 1007 = 4082
(ख)
वर्ग अंतराल |
बारंबरता |
'से अधिक’ |
संचयी बारंबरता |
100-2000 |
33 |
50 |
|
2000-3000 |
11 |
17 |
(i) (ii) 33 |
3000-4000 |
3 |
6 |
(ii) 6 |
4000-5000 |
2 |
3 |
(iii) 19 |
5000-6000 |
1 |
1 |
|
प्र.10. एक
शहर में, यह जानने हेतु 45 परिवारों का सर्वेक्षण किया गया कि वे अपने घरों में कितनी
संख्या में सेल फोनों का इस्तेमाल करते हैं। नीचे दिए गए उनके उत्तरों के आधार पर एक
बारंबारता सारणी तैयार कीजिए।
1 3 2 2 2 2 1 2 1 2 2 3 3
3 3 3 3 2 3 2 2 6 1 6 2 1
5 1 5 3 2 4 2 7 4 2 4 3 4
2 0 3 1 4 3
उत्तर :
प्र.11. वर्गीकृत आँकड़ों में सूचना की क्षति
का क्या अर्थ है?
उत्तर : बारंबारता वितरण के रूप में आँकड़ों के वर्गीकरण में एक अंतर्निहित
दोष पाया जाता है। यह अपरिष्कृत आँकड़ों का सारांश प्रस्तुत कर उन्हें संक्षिप्त एवं
बोधगम्य तो बनाता है, परंतु इसमें वे विस्तृत विवरण नहीं प्रकट हो पाते जो अपरिष्कृत
आँकड़ों में पाए जाते हैं यद्यपि अपरिष्कृत आँकड़ों को वर्गीकृत करने में सूचना की
क्षति होती है, तथापि आँकड़ों को वर्गीकरण द्वारा संक्षिप्त करने पर पर्याप्त जानकारी
मिल जाती है। एक बार जब आँकड़ों को वर्गों में समाहित कर दिया जाता है तब व्यष्टि प्रेक्षणों
का आगे सांख्यिकीय परिकलनों में कोई महत्त्व नहीं होता। उदाहरण 4 में वर्ग 20-30 के
अंतर्गत 6 प्रक्षेण 25, 25, 20, 22, 25 एवं 28 है। इसलिए जब इन आँकड़ों को बारंबारता
वितरण में वर्ग 20-30 में समूहित कर दिया जाता है, तब यह बारंबारता वितरण उस वर्ग की
बारंबारता (जैसे 6) को दिखाता है, न कि उनके वास्तविक मानों को। इस वर्ग के सभी मानों
को उस वर्ग के वर्ग अंतराल के मध्य मान या वर्ग चिह्न के बराबर माना जाता है (अर्थात्
25) आगे की सांख्यिकीय परिकलनों के लिए वर्ग चिह्न के मान को आधार बनाया जाता है, न
कि उस वर्ग के प्रेक्षणों के मान को। यही बात सभी वर्गों के लिए सत्य है।
प्र.12. क्या आप
इस बात से सहमत हैं कि अपरिष्कृत आँकड़ों की अपेक्षा वर्गीकृत आँकड़े बेहतर होते
हैं?
उत्तर : हाँ, हम इस बात से सहमत हैं कि अपरिष्कृत आँकड़ों की
अपेक्षा वर्गीकृत आँकड़े बेहतर होते हैं। यह अपरिष्कृत आँकड़ों को सांख्यिकीय
विष्लेषण के लिए एक सही रूप में संक्षिप्त करता है। यह जटिलताओं को दूर करता है
तथा आँकड़ों की विशेषताओं को उजागर करता है। यह तुलना करने तथा निष्कर्ष निकालने
में सहायता करता है। यह दिए गए आँकड़ों के तत्वों के अंतरसंबंध के बारे में
जानकारी प्रदान करता है। यह समान तत्वों को एक समान करके आँकड़ों को समरूप समूहों
में परिवर्तित करता है तथा उनमें समान व अमानताएँ ज्ञात करता है।
प्र.13. एक-विचर एवं द्विचर बारंबारता वितरण
के बीच अंतर बताइए।
उत्तर : एक विचर बारंबारता वितरण एकल चर के बारंबारता वितरण को
एक-विचर वितरण कहा जाता है।
उदाहरणः
आय |
बारंबारता |
0-500 |
4 |
500-1000 |
6 |
1000-1500 |
8 |
1500-2000 |
2 |
द्विचर बारंबारता वितरण :- एक द्विचर बारंबारता वितरण, दो चरों का बारंबारता वितरण है।
उदाहरण
आय/व्यय |
0-200 |
200-400 |
400-800 |
800-1500 |
|
0-500 |
1 |
1111 |
1 |
11 |
8 |
500-1000 |
1 |
11 |
11 |
1 |
6 |
1000-1500 |
1 |
1 |
1 |
1 |
4 |
1500-2000 |
1 |
1 |
- |
- |
2 |
|
4 |
8 |
4 |
4 |
20 |
प्र.14. निम्नलिखित
आँकड़ों के आधार पर 7 का वर्ग अंतराल लेकर समावेशी विधि द्वारा एक बारंबारता वितरण
तैयार कीजिए।
28 17 15 22 29 21 23 27 18 12 7 2 9
4 1 8 3 10 5 20 16 12 8 4 33 27
21 15 3 36 27 18 9 2 4 6 32 31 29
18 14 13 15 11 9 7 1 5 37 32 28 26
24 20 19 25 19 20 6 9
उत्तर :
पाठ का परिचय
3.1.1 प्रस्तावना
इस
अध्याय में हम सीखेंगे कि, जो आंकड़े आपने संगृहित किए थे, उन्हें कैसे वर्गीकृत करते
हैं। अपरिष्कृत आंकड़ों को वर्गीकृत करने का उद्देश्य उन्हें व्यवस्थित करना है, ताकि
उन्हें आसानी से आगे के सांख्यिकी विश्लेषण के योग्य बनाया जा सके।
जैसा
कि हम एक कबाड़ी वाले को देखते हैं कि वह अपने कबाड़ में टूटे-फूटे घरेलू सामान, अखबार,
धातुओं इत्यादि को कैसे व्यवस्थित रूप में रखता है। इस प्रकार से वह अपने कबाड़ को
विभिन्न वर्गों अखबार, प्लास्टिक, काँच, धातु आदि में विभाजित कर उन्हें व्यवस्थित
करता है। जब एक बार उसका सारा कबाड़ व्यवस्थित एवं वर्गीकृत हो जाता है, तब खरीददार
की मांग पर उसे सामग्री विशेष को खोज कर देने में आसानी हो जाती है।
ठीक
उसी प्रकार से जब हम अपने विद्यालयों की पुस्तकों को एक विशेष क्रम में रखते हैं, तो
उन्हें विषयों के अनुसार हम वर्गीकृत कर सकते हैं। जहां प्रत्येक विषय एक समूह या वर्ग
बन जाता है।
यदि पदार्थों अथवा वस्तुओं का वर्गीकरण वह अमूल्य श्रम और
समय को बचाता है, इसे मनमाने तरीके से नहीं किया जाता है। इसलिए वर्गीकरण का तात्पर्य
एक वस्तुओं को समूह या वर्गों में किसी खास आधार पर वर्गीकृत या व्यवस्थित करने से
है।
3.1.2 अपरिष्कृत आंकड़े
कबाड़ीवाले के कबाड़ के भाँति, अवर्गीकृत आंकड़े अथवा और
अपरिष्कृत आंकड़े भी अत्यधिक अव्यवस्थित होते हैं। यह प्रायः अति विशाल होते हैं जिन्हें
संभालना कठिन होता है, इनसे सार्थक निष्कर्ष निकालना श्रमसाध्य कार्य हैं, क्योंकि
सांख्यिकीय विधियों का इन पर सरलता से प्रयोग नहीं किया जा सकता। इसलिए इस प्रकार के
आंकड़ों का उचित संगठन तथा प्रस्तुतीकरण आवश्यक होता है, ताकि व्यवस्थित रूप से सांख्यिकी
विश्लेषण किया जा सके। अतः आंकड़ों के संग्रह के पश्चात अगला चरण उन्हें संगठित कर
वर्ग के रूप में प्रस्तुत करना है।
मान लीजिए, की आप गणित में छात्रों की प्रगति जानना चाहते
हैं और आपने अपने स्कूल के 100 छात्रों के गणित के अंकों के आंकड़े एकत्रित कर लिए
हैं अगर आप इन्हें एक सारणी में प्रस्तुत करते हैं तो संभवत निम्न सारणी होगी।
सारणी 3.1
किसी परीक्षा में 100 छात्रों द्वारा गणित में प्राप्त अंक
47 |
45 |
10 |
60 |
51 |
56 |
66 |
100 |
49 |
40 |
60 |
59 |
56 |
55 |
62 |
48 |
59 |
55 |
51 |
41 |
42 |
69 |
64 |
66 |
50 |
59 |
57 |
65 |
62 |
50 |
64 |
30 |
37 |
75 |
17 |
56 |
20 |
14 |
55 |
90 |
62 |
51 |
55 |
14 |
25 |
34 |
90 |
49 |
56 |
54 |
70 |
47 |
49 |
82 |
40 |
82 |
60 |
85 |
65 |
66 |
49 |
44 |
64 |
69 |
70 |
48 |
12 |
28 |
55 |
65 |
49 |
40 |
25 |
41 |
71 |
80 |
0 |
56 |
14 |
22 |
66 |
53 |
46 |
70 |
43 |
61 |
59 |
12 |
30 |
35 |
45 |
44 |
57 |
76 |
82 |
39 |
32 |
14 |
90 |
25 |
या फिर हम अपने पड़ोस के 50 परिवारों से भोजन पर उनके मासिक
व्यय के आंकड़ों का संग्रह यह जानने के लिए करते हैं कि भोजन पर उनका औसत व्यय कितना
है। इस प्रकार इस मामले में संग्रहित आंकड़ों को जब हम सारणी से प्रस्तुत करते हैं
तो वह निम्न प्रकार की सारणी होगी।
सारणी 3.2
खाद्य पर 50 परिवारों के मासिक परिवारिक व्यय (रू. में)
1904 |
1559 |
3473 |
1735 |
2766 |
2041 |
1612 |
1753 |
1855 |
4439 |
5090 |
1085 |
1823 |
2345 |
1523 |
1214 |
1360 |
1110 |
2152 |
1183 |
1218 |
1315 |
1105 |
2628 |
2712 |
4248 |
1812 |
1264 |
1183 |
1171 |
1007 |
1180 |
1953 |
1137 |
2048 |
2025 |
1583 |
1324 |
2621 |
3676 |
1397 |
1832 |
1962 |
2177 |
2575 |
1293 |
1365 |
1146 |
3222 |
1396 |
इस प्रकार अवर्गीकृत विशाल आंकड़ों से कोई सूचना प्राप्त
करना एक बेहद थका देने वाला एवं उबाऊ काम है।
वर्गीकरण के द्वारा अपरिष्कृत आंकड़ों को संक्षिप्त एवं बोधगम्य
बनाया जाता है। जब एक प्रकार की विशेषताओं वाले तथ्यों को एक ही वर्ग में रखा जाता
है तो वे बिना किसी कठिनाई के ढूंढने, तुलना करने तथा निष्कर्ष निकालने योग्य हो जाते
हैं।
जनगणना के अपरिष्कृत आंकड़े बहुत विशाल एवं विखंडित होते
हैं। उनसे कोई भी अर्थपूर्ण निष्कर्ष निकालना असंभव कार्य लगता है। लेकिन जनगणना के
यही आंकड़े जब लिंग, शिक्षा, वैवाहिक स्थिति, पेशे आदि के अनुसार वर्गीकृत किया जाते
हैं तब भारत की जनगणना की प्रकृति एवं संरचना आसानी से समझ में आ जाती है।
3.1.3 आंकड़ों का वर्गीकरण
किसी वर्गीकरण के वर्ग या समूह कई तरीकों से बनाए जा सकते
हैं। आप अपनी पुस्तकों को विषयों-इतिहास, भूगोल, गणित, विज्ञान आदि में वर्गीकृत करने
के स्थान पर इन्हें वर्णमाला के क्रम में लेखकों के आधार पर वर्गीकृत कर सकते हैं।
ठीक उसी प्रकार और अपरिष्कृत आंकड़ों को भी विभिन्न तरीकों
से वर्गीकरण किया जा सकता है।
आंकड़ों का वर्गीकरण
☞ कालानुकमिक वर्गीकरण
: जिन आंकड़ों को समय के अनुसार समुहित
किया जा सकता है। उसे कालानुक्रमिक वर्गीकरण करते हैं। जैसे वर्ष, तिमाही, मासिक, सप्ताहिक
इत्यादि के रूप में आरोही या अवरोही क्रम में वर्गीकृत किया जा सकता है।
☞ स्थानिक वर्गीकरण
: जिन आंकड़ों का वर्गीकरण भौगोलिक
स्थितियों जैसे कि देश, राज्य, शहर, जिला, करवा इत्यादि के अनुसार किया जाता है उसे
स्थानिक वर्गीकरण कहा जाता है।
☞ गुणात्मक वर्गीकरण
: वैवाहिक स्थिति इत्यादि। इन्हें
मापा नहीं जा सकता इन गुणों को गुणात्मक विशेषता उप. स्थिति या अनुपस्थिति के आधार
पर वर्गीकृत कर सकते हैं। विशेषताओं पर आधारित आंकड़ों के ऐसी वर्गीकरण को गुणात्मक
वर्गीकरण कहा जाता है
☞ मात्रात्मक वर्गीकरण
: जब वर्गीकरण ऊंचा. ई, भार, आयु,
आय, छात्रों के अंक इत्यादि विशेषताओं जिनकी प्राप्ति मात्रात्मक है। इसके आधार पर
किया जाता है तो ऐसे आकड़ों के वर्गों को मात्रात्मक वर्गीकरण कहा जाता है
3.1.3a कालानुक्रमिक वर्गीकरण का उदाहरण-
भारत
की जनसंख्या (करोड़ में)
वर्ष |
जनसंख्याा (करोड़ में) |
1951 |
35.7 |
1961 |
43.8 |
1971 |
54.6 |
1981 |
68.4 |
1991 |
81.8 |
2001 |
102.7 |
2011 |
121.0 |
3.1.3b स्थानिक वर्गीकरण का उदाहरण
देश |
गेहूँ
की उपज (कि.ग्रा./एकड़) |
कनाडा |
3594 |
चीन |
5055 |
फ्रांस |
7254 |
जर्मनी |
7998 |
भारत |
3154 |
पाकिस्तान |
2787 |
3.1.3c गुणात्मक वर्गीकरण का उदाहरण
जनसख्या
A.
पुरुष
a.
विवाहित
b.
अविवाहित
B.
स्त्री
a.
विवाहित
b.
अविवाहित
3.1.3d मात्रात्मक वर्गीकरण का उदाहरण
100
छात्रों के गणित के प्राप्तांकों का बारंबरता वितरण
अंक |
बारबरता |
0-10 |
1 |
10-20 |
8 |
20-30 |
6 |
30-40 |
7 |
40-50 |
21 |
50-60 |
23 |
60-70 |
19 |
70-80 |
6 |
80-90 |
5 |
90-100 |
4 |
योग |
100 |
3.2.1 चरः संतत और विविक्त
चरों
में अंतर विशेष वर्गीकरण के आधार पर होता है इन्हें समानतः दो वर्गों में वर्गीकृत
किया जाता है:
1-
संतत
2-
विविक्त
संतत
चर कोई भी संख्यात्मक मान हो सकता है। यह पूर्णांक मान (1, 2, 3, 4 …………) भिन्नात्मक
मान (1/2, 2/3 3/4) तथा वे मान जो यथातथ्य भिन्न नहीं है √2 = 1.414, √3 = 1.732,
………. √7 = 2.645) हो सकते हैं। उदाहरण के लिए मान लीजिए कि एक छात्र का कद 90 से
150 सेंटीमीटर तक बड़ता है, तो उसके कद के मान उसके बीच आने वाले सभी मान हो सकते हैं।
यह मान पूर्णांक संख्या हो सकती है या भिन्नात्मक मान हो सकता है, संतत चर के अन्य
उदाहरण भार, समय तथा दूरी आदि हैं।
संतत
चर के विपरीत विविक्त चर केवल मान निश्चित हो सकते हैं। इसके मान केवल परिमित उछाल
से बदलते हैं। यह उछाल एक मान से दूसरे मान के बीच होते हैं, परंतु इसके बीच में कोई
मान नहीं आता है। उदाहरण के लिए, कोई चर जैसे, 'किसी कक्षा में छात्रों की संख्या,
भिन्न वर्गों के लिए उन मानों की कल्पना करता है, इसमें केवल पूर्ण संख्याएं हैं। यह
कोई भी भिनात्मक मान जैसे 0.5 नहीं हो सकता, क्योंकि 'एक छात्र का आ/π
निरर्थक है। इस प्रकार से इसमें 25 एवं 26 के बीच का मान 25.5 नहीं हो सकता है। इसकी
अपेक्षा इसका मान या तो 25 होगा या फिर 26 होगा।
लेकिन
ऐसा नहीं है कि विविक्त चर का मान भिन्न में नहीं हो सकता। मान लीजिए X एक चर है जिसमें
1/8, 1/16, 1/32 1/64 जैसे मान है तो क्या यह भी विविक्त चर है। हाँ क्योंकि यदि X
का मान भिन्नों में हो सकते हैं, तथापि ये दो सन्निकट भिन्नों के बीच नहीं हो सकते।
यह 1/8 से 1/16 में और फिर 1/16 से 1/32 में बदलता है। परंतु 1/8 से 1/16 के बीच या
1/16 से 1/32 के बीच मान नहीं ले सकता।
3.3.1 बारंबारता वितरण क्या है?
बारंबारता
वितरण और अपरिष्कृत आंकड़ों को एक मात्रात्मक चर में वर्गीकृत करने का एक सामान्य तरीका
है। यह दिखाता है कि किसी चर के भिन्न मान विभिन्न वर्गों में, अपने अनुरूप वर्गों
की बारंबारओं के साथ कैसे वितरित किए जाते हैं। इसका उदाहरण हमारे पास प्राप्त अंकों
के 10 वर्ग हैं। 0-10, 10-20, 90-100 | वर्ग- बारंबारता पद का अर्थ है कि एक विशेष
वर्ग में मानों की संख्या। उदाहरण के लिए वर्ग 30 40 में प्राप्तकों के 7 मान हैं।
ये 30, 37, 34, 30, 35, 39, 32 है इस प्रकार से वर्ग 30-40 की बारंबारता 7 हुई। बारंबारता
वितरण सारणी में प्रत्येक वर्ग, वर्ग सीमाओं द्वारा घिरा होता है। वर्ग में ये सीमाएं
दो छोरों पर होती हैं। इसमें न्यूनतम मान को निम्न वर्ग सीमा तथा उच्च तम्मान को उच्च
वर्ग सीमा कहते हैं। (उच्च वर्ग सीमा
में से निम्न वर्ग सीमा को घटाकर) वर्ग अन्तराल निकला जाता हैं।
वर्ग मध्य बिंदु अथवा वर्ग चिन्ह किसी वर्ग का मध्य मान है।
यह वर्ग की निम्न वर्ग सीमा तथा उच्च वर्ग सीमा के बीच होता है। इसे निम्न तरीके से
पता किया जाता है:
वर्ग मध्य बिंदु या वर्ग चिन्ह = (उच्च वर्ग सीमा + निम्न
वर्ग सीमा) / 2
वर्ग |
बारंबारता |
निम्नवर्ग सीमा |
उच्चवर्ग सीमा |
वर्ग चिन्ह |
0-10 |
1 |
0 |
10 |
5 |
10-20 |
8 |
10 |
20 |
15 |
20-30 |
6 |
20 |
30 |
25 |
30-40 |
7 |
30 |
40 |
35 |
40-50 |
21 |
40 |
50 |
45 |
50-60 |
23 |
50 |
60 |
55 |
60-70 |
19 |
60 |
70 |
65 |
70-80 |
6 |
70 |
80 |
75 |
80-90 |
5 |
80 |
90 |
85 |
90-100 |
4 |
90 |
100 |
95 |
3.3.2 बारंबारता वितरण कैसे तैयार करें ?
बारंबारता वितरण तैयार करते समय हमें निम्न पांच प्रश्नों
की व्याख्या पर ध्यान देने की आवश्यकता है:
i) पहला वर्ग अंतराल सामान आकार के हो या असमान अन्तराल के
?
ii) दूसरा हमें कितने वर्ग रखने चाहिए ?
iii) तीसरा प्रत्येक वर्ग का आकार क्या हो ?
iv) चौथा वर्ग सीमाओं का निर्धारण कैसे किया जाए ?
v) पांचवा प्रत्येक वर्ग के लिए बारंबारता कैसे प्राप्त की
जाए ?
3.3.2a वर्ग अंतराल सामान आकार के हो या असमान
अन्तराल के ?
दो परिस्थितियों में असमान आकार के वर्ग अंतरालों का प्रयोग
किया जाता है। पहले जब हमारे पास आय तथा ऐसे ही चोरों के आंकड़े हो, जहां पर परास काफी
अधिक होता है।
दूसरी यदि मानों की एक बहुत बड़ी संख्या परास के एक छोटे
से भाग में केंद्रित होती है, तो समान वर्ग अंतराल से कई मानों की सूचना प्राप्त नहीं
हो पाएगी।
अन्य सभी स्थितियों में आवृत्ति वितरण में समान आकार के वर्ग
अंतराल का प्रयोग होता है।
3.3.2b वर्गों की संख्या कितनी होनी चाहिए
?
वर्गों की संख्या सामान्यतः 6 तथा 15 के बीच होती है। यदि
हमारे वर्ग अंतराल सामान आकार के हो, तो वर्गों की संख्या, परास (चर के अधिकतम तथा
न्यूनतम मान के अंतर) को वर्ग अंतराल से भाग देने पर प्राप्त की जाती है
3.3.2c प्रत्येक प्रत्येक वर्ग का आकार क्या होना चाहिए।?
एक
बार वर्ग अंतराल को तय करने पर चर के दिए गए परास से हम वर्गों की संख्या निर्धारित
कर सकते हैं। ठीक इसी प्रकार से हम वर्ग अंतराल निर्धारित कर सकते हैं, जब एक बार हम
वर्गों की संख्या तय कर लेते हैं। इस तरह हम पाते हैं कि यह दोनों निर्णय एक दूसरे
से जुड़े हुए हैं। पहले का निर्णय लिए बिना हम दूसरे का निर्णय नहीं ले सकते।
3.3.2d हमें वर्ग सीमाएं कैसे निर्धारित करनी चाहिए ?
वर्ग
सीमाएँ निष्चित था स्पष्ट रूप से होनी चाहिए। सामान्यतः मुक्तोत्तर वर्ग, जैसे 70 तथा
अधिक' या '10 से कम वांछनीय नहीं होते। निम्न तथा उच्च वर्ग सीमाओं का निर्धारण किस
प्रकार से किया जाना चाहिए कि प्रत्येक वर्ग की आकृतियों की प्रवृत्ति वर्ग अंतराल
के मध्य में संकेंद्रण की हो। वर्ग अंतराल दो प्रकार का होता है -
1
- समावेशी वर्ग अंतराल
2
- अपवर्जी वर्ग अंतराल
3.3.2e समावेशी वर्ग अंतराल
इस
स्थिति में, वर्ग की निम्न तथा उच्च सीमाओं के मूल्य वाले मानों को उस वर्ग की आवृत्ति
में शामिल किया जाता है।
3.3.2f अपवर्जी वर्ग अन्तराल
इस
स्थिति में, वर्ग की निम्न तथा उच्च सीमाओं के मूल्य वाली मदों को उस वर्ग की आवृत्ति
में शामिल नहीं किया जाता।
सतत्
चरों की स्थिति में, अपवर्जी तथा समावेशी दोनों प्रकार के वर्ग अंतरालों का प्रयोग
किया जा सकता है। सतत चरों की स्थिति में, समावेशी वर्ग अंतरालों का प्रयोग बहुदा किया
जाता है।
उदाहरण
सतत्
चरों की स्थिति में, समावेशी वर्ग अंतराल
(यदि
विद्यार्थियों प्राप्तांक 0 से 100 के बीच हैं)।
0-10,
11-20, 21-30 --------- 91-100 |
अपवर्जी
वर्ग अंतराल
0-10,10-20,20-30
---------90-100 |
सतत्
चरों की स्थिति में,
मान
लें कि हमारे पास किसी चर के आँकड़े उपलब्ध हों, जैसे कद (से.मी.) या वजन (कि.ग्रा.)।
यह आँकड़ा सतत प्रकार का है। ऐसी स्थितियों में वर्ग अंतराल निम्नलिखित प्रकार से दर्शाया
जा सकता है-
30
कि.ग्रा. - 39.999... कि.ग्रा.
40
कि.ग्रा. - 49.999... कि.ग्रा.
50
कि.ग्रा. - 59.999... कि.ग्रा. आदि ।
इन
वर्ग अंतरालों को निम्नलिखित प्रकार से समझा जा सकता है-
30
कि.ग्रा. और अधिक तथा 40 कि.ग्रा. से कम
40
कि.ग्रा. और अधिक तथा 50 कि.ग्रा. से कम
50
कि.ग्रा. और अधिक तथा 60 कि.ग्रा. से कम आदि ।
सारणी 3.4
एक
कंपनी के 550 कर्मचारियों की आय का
बारंबरता
वितरण
आय
रू. में |
कर्मचारियों
की संख्या |
800-899 |
50 |
900-999 |
100 |
1000-1099 |
200 |
1100-1199 |
150 |
1200-12900 |
40 |
1300-1399 |
10 |
योग |
550 |
वर्ग अंतराल में समायोजन
सारणी
में समावेशी विधि के सूक्ष्म अध्ययन से पता चलता है कि यदि चर आय एक संतत चर हैं, तथापि
जब वर्गों को बनाया जाता है तो संततता नहीं रहती। हम एक वर्ग की उच्च सीमा तथा अगले
वर्ग की निम्न सीमा में अंतर या असंततता पाते हैं। उदाहरण के लिए, पहले वर्ग की उच्च
सीमा 899 और दूसरे वर्ग की निम्न सीमा 900 के बीच हम 1 (एक) का 'अंतर' पाते हैं। तब
हम आँकड़ों के वर्गीकरण में चर की संततता को कैसे सुनिश्चित करते हैं? इसे वर्ग अंतराल
के बीच समायोजन करके किया जाता है। समायोजन निम्नलिखित तरीके से किया गया है।
1.
द्वितीय वर्ग की निम्न सीमा और प्रथम वर्ग की उच्च सीमा के बीच अंतर पता करें। उदाहरण
के लिए, सारणी 3.4 में द्वितीय वर्ग की निम्न सीमा 900 और प्रथम वर्ग की उच्च सीमा
899 के बीच अंतर 1 है (अर्थात 900 - 899= 1) ।
2.
प्राप्त किए गए अंतर (1) को 2 से विभाजित करें (अर्थात 1/20.5) ।
3.
सभी वर्गों की निम्न सीमाओं से (2) में प्राप्त किए गए मान को घटाइए (निम्न वर्ग सीमा
-0.5) ।
4.
सभी वर्गों की उच्च सीमा में (2) में प्राप्त किए गए मान को जोड़िए (उच्च वर्ग सीमा,
0.5)।
समायोजन
के पश्चात जिससे बारंबारता वितरण में आँकड़ों की संततता की पुनः प्राप्ति होती है,
सारणी 3.4 संशोधित होकर सारणी 3.5 बन जाती है। वर्ग सीमाओं में समायोजन के पश्चात समानता
(1)
जो कि वर्ग चिन्ह का मान निर्धारित करती है, समायोजित वर्ग
चिन्ह = (समायोजित उच्च वर्ग सीमा -समायोजित निम्न वर्ग सीमा) / 2
सारणी 3.5
एक कंपनी के 550 कर्मचारियों की आय का
बारंबरता वितरण
आय (रू. में) |
कर्मचारियों की संख्या |
799.5-899.5 |
50 |
899.5-999.5 |
100 |
999.5-1099.5 |
200 |
1099.5-1199.5 |
150 |
1199.5-1299.5 |
40 |
1299.5-1399.5 |
10 |
योग |
550 |
3.4.1 हमें प्रत्येक वर्ग की बारंबारता कैसे
प्राप्त करनी चाहिए
सामान्य शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है
कि अपरिष्कृत आंकड़ों में कितनी बार वह शब्द प्रेक्षण प्रकट होता है।
मिलान चिन्ह अंकन द्वारा वर्ग बारंबारता को
ज्ञात करना
मिलान चिन्ह (/) किसी वर्ग के प्रत्येक छात्र के सामने
लगाया जाता है, जिसके प्राप्तांक उस वर्ग में शामिल है। उदाहरण के लिए, यदि किसी
छात्र का प्राप्तांक 57 है तो उस छात्र के लिए वर्ग 50- 60 में एक मिलान चिन्ह (/)
लगाया जाता है। यदि प्राप्तांक 71 है तो मिलान चिन्ह (/) को वर्ग 70- 80 में लगाया
जाता है। मिलान चिन्हों का परिकलन तब आसान हो जाता है जब चार चिन्ह खड़े (////)
लगाए जाते हैं और 5वाँ इन सब को काटता हुआ तिरछा लगाया जाता है जैसे मिलान चिन्हों
की गणना पांच के समूह में की जाती है इसलिए यदि किसी वर्ग में 16 मिलान चिन्ह है
तो उन्हें इस प्रकार //// से लिखते हैं ताकि परिकलन में सुविधा है इसलिए एक वर्ग
की बारंबारता उतनी होगी जितनी कि उस वर्ग में मिलान चिन्हों की संख्या।
3.5.1 सूचना की हानि
बारंबारता वितरण के रूप में आँकड़ों के वर्गीकरण में एक
अंतरनिहीत दोष पाया जाता है। यह अपरिष्कृत आंकड़ों का सारांश प्रस्तुत कर उन्हें
संक्षिप्त एवं बोधगम्य तो बनाता है, परंतु इसमें वे विस्तृत विवरण नहीं प्रकट हो
पाते जो और अपरिष्कृत आंकड़ों में पाए जाते हैं यद्दपि अपरिष्कृत आंकड़ों को
वर्गीकृत करने में सूचना की क्षति होती है, तथापि आंकड़ों का वर्गीकरण द्वारा
संक्षिप्त करने पर पर्याप्त जानकारी मिल जाती है। एक बार जब आंकड़ों को वर्गों में
सामूहिक कर दिया जाता है तब वह व्यष्टि प्रेक्षणों का आगे सांख्यिकीय परिकलन में
कोई महत्व नहीं होता।
सारणी 3.6
3.6.1 असमान वर्गों में बारंबारता वितरण
आप जानते हैं कि इन्हें अपरिष्कृत आंकड़ों से कैसे गठित
किया जाता है। लेकिन कुछ मामलों में असमान वर्ग अंतराल के साथ बारंबारता वितरण
अधिक उपयुक्त होता है। यदि सरणी 3.6, को देखें तो आप पाएंगे कि अधिकांश प्रेक्षण
वर्ग 40-50, 50-60, तथा 60-70 में संकेंद्रित हैं। उनकी बारंबारताएं क्रमश रू
21,23, एवं 19 है। इसका अर्थ है कि 100 छात्रों में से 63 (21 23,19) प्रेक्षण इन
वर्गों में संकेंद्रित हैं। इस प्रकार 63% आंकड़े 40-50 के बीच समाहित हैं और
आंकड़ों का शेष 37% 0-10, 10-20, 20-30, 30-40 तथा 70-80, 80-90 एवं 90- 100 वर्गों
में है। इन वर्गों में परीक्षण का विरल घनत्व है।
असमान वर्गों के रूप में सारणी 3.7 में सारणी 3.6 के उसी
बारम्बारता को दिखाया गया है। ध्यान दें कि इन वर्गों के प्रेक्षणों में नए वर्ग
चिन्ह मानों की अपेक्षा पुराने वर्ग चिन्ह मानों से विचलन अधिक है। इस प्रकार नए
वर्ग चिन्ह मान, वर्गों के आंकड़ों का पुराने मान की अपेक्षा बेहतर प्रतिनिधित्व
करते हैं।
सारणी 3.7
असमान वर्गों में बारंबरती वितरण
वर्ग |
प्रेक्षण |
बारंबारता |
वर्ग चिह्न |
0-10 |
0 |
1 |
5 |
10-20 |
10, 14, 17, 12, 14, 12, 14, 14 |
8 |
15 |
20-30 |
25, 25, 20, 22, 23, 28 |
6 |
25 |
30-40 |
30, 37, 34, 39, 32, 30, 35 |
7 |
35 |
40-50 |
42, 44, 40, 44, 41, 40, 43, 40, 41 |
9 |
42.5 |
45-50 |
47, 49, 49, 45, 45, 47, 49, 46, 48, 48, 49, 49 |
23 |
47.5 |
50-55 |
51,
53, 51, 50, 51, 50, 54 |
7 |
52.5 |
55-60 |
59,
56, 55, 57, 55, 56, 59, 56, 59, 57, 59, 55, 56, 55, 56, 55 |
16 |
57.5 |
60-65 |
60,
64, 62, 64, 64, 60, 62, 61, 60, 62 |
10 |
62.5 |
65-70 |
66,
69, 66, 69, 66, 65, 65, 66, 65 |
9 |
67.5 |
70-80 |
70,
75, 70, 76, 70, 71 |
6 |
75 |
80-90 |
82,
82, 82, 80, 85 |
5 |
85 |
90-100 |
90,
100, 90, 90 |
4 |
95 |
योग |
100 |
|
3.6.2 बारंबारता सारणी
अब तक हमने गणित में 100 छात्रों द्वारा प्राप्त किए गए
प्रतिषत अंकों के उदाहरण का प्रयोग करते हुए संतत चर के लिए आंकड़ों के वर्गीकरण
पर चर्चा की है। विविक्त चर के लिए, आंकड़ों का वर्गीकरण बारंबारता सारणी के नाम
से जाना जाता है। क्योंकि एक विविक्त चर मानों को धारण करता है न कि दो पूर्णांकों
के बीच माध्यमिक भिन्नीय मानों को, अतः हम ऐसी बारंबारता रखते हैं जो कि अपने
पूर्णांक मानों से संगत हो। सारणी 3.8 में चर 'परिवार का आकार' एक विविक्त चर है
जो सारणी में दिखाए गए पूर्णांकों को ही धारण करता है।
सारणी 3.8
परिवारों के आकार की बारंबरता सारणी
परिवार का आकार |
परिवारों की संख्या |
1 |
5 |
2 |
15 |
3 |
25 |
4 |
35 |
5 |
10 |
6 |
5 |
7 |
3 |
8 |
2 |
3.6.3 द्विचर बारंबारता वितरण
बहुत बार जब हम किसी जनसंख्या में से एक प्रतिदर्श लेते
हैं, तो हम प्रतिदर्श के हर अवयव से एक से अधिक प्रकार की सूचना संग्रह करते हैं।
इस स्थिति में, हमारे पास प्रतिदर्श के द्विचर आंकड़े हैं। इस तरह से द्विचर
आंकड़ों को द्विचर बारंबारता वितरण द्वारा संक्षिप्त रूप में दर्शाया जा सकता है।
एक द्विचर बारंबारता वितरण को दो चरों के बारंबारता वितरण
के रूप में परिभाषित किया जा सकता है।
सारणी (3.9) 20 कंपनियों के दो चर बिक्री एवं विज्ञापन ब्यय
(लाख रूपये में) के बारंबारता वितरण को प्रदर्शित कर रही है। यहां हम बिक्री मानों
को भिन्न स्तंभों में तथा विज्ञापन ब्यय के मानों को इन पंक्तियों में वर्णित किया
गया है। प्रत्येक प्रकोष्ठ संतत एवं स्तंभ के मान की बारंबारता दिखाता है। उदाहरण
के लिए, यहां पर 3 फर्म है जिनकी बिक्री 135 से लेकर 145 लाख के बीच है और उनका
विज्ञापन में 64000 से लेकर 66000 के बीच है।
सारणी 3.9
20 कंपनियों की बिक्री (लाख रू. में) एवं विज्ञापन व्यय
(हजार में) का द्विचर बरंबरती वितरण
|
115-125 |
125-135 |
135-145 |
145-455 |
155-165 |
165-175 |
योग |
62-64 |
2 |
1 |
|
|
|
|
3 |
64-66 |
1 |
|
3 |
|
|
|
4 |
66-68 |
1 |
1 |
2 |
1 |
|
|
5 |
68-70 |
|
2 |
|
2 |
|
|
4 |
70-72 |
|
1 |
1 |
|
1 |
1 |
4 |
योग |
4 |
5 |
6 |
3 |
1 |
1 |
20 |
3.7.1 सारांश
प्राथमिक या द्वितीयक स्रोतों से संग्रहित किए गए आंकड़े
अपरिष्कृत या अवर्गीकृत होते हैं। वर्गीकरण से आंकड़ों में क्रमबद्धता आ जाती है।
यह अध्याय आपको यह जानने के योग्य बनाता है कि आंकड़ों को बारंबारता वितरण के
माध्यम से बोधगम्य तरीके से किस प्रकार वर्गीकृत किया जाता है। एक बार जब आप
वर्गीकरण की तकनीकों को जान जाते हैं तो आपके लिए या आसान होगा कि आप संतत तथा
विविक्त दोनों चरों के लिए ही बारंबारता वितरण की रचना कर सकें
3.8.1 पुनरावर्तन
☞ वर्गीकरण अपरिष्कृत आंकड़ों को क्रमबद्धता प्रदान करता है।
☞ बारंबारता वितरण यह प्रदर्शित करता है कि किसी चर के
विभिन्न मान, संगत वर्ग- बारंबारताओं सहित, किस प्रकार विभिन्न वर्गों में वितरित
किए जाते हैं।
☞ अपवर्जी विधि के अंतर्गत उच्च वर्ग सीमा को छोड़ा तथा निम्न
वर्ग सीमा को शामिल किया जाता है ।
☞ समावेशी विधि में निम्न वर्ग सीमा तथा उच्च वर्ग सीमा दोनों
को ही शामिल किया जाता है।
☞ बारंबारता वितरण में आगे के सांख्यिकी परिकलन केवल वर्ग
चिन्ह मान पर आधारित होते हैं ना कि प्रेक्षणों के मान पर।