পরিসংখ্যানের প্রাথমিক বিষয়াবলী
তথ্য
বা উপাত্ত
তথ্য
বিশ্ব সম্পর্কে জানা ও তা হতে উপযুক্ত ফলাফলের ভিত্তিতে কার্যকরী সিদ্ধান্তে পৌছানোই
পরিসংখ্যানের একমাত্র উদ্দেশ্য। এ উদ্দেশ্য সাধনের জন্য তথ্য বিশ্বের প্রতিটি একক সম্পর্কে
সংখ্যাত্মক খবরাদি নেওয়া হয়। অতএব কোন নির্দিষ্ট বৈশিষ্ট্যের সংখ্যাবাচক পরিমাপকে
তথ্য বলে। এ ধরনের তথ্যকে আবার অশোধিত তথ্য (Raw data) বলে। তথ্যের প্রতিটি একককে তথ্যবিন্দু
বলে।
উদাহরণ:
ধরি কোন ক্লাসের ১০জন ছাত্রের বয়স যথাক্রমে ১৮, ২০, ২২, ২১, ১৮, ১৯, ২০, ২১, ১৭, ২২
বছর। বয়সের এই সেটকে অশোধিত তথ্য বলে । তথ্যের প্রতিটি একক যেমন: ২০ হচ্ছে তথ্য বিন্দু।
পূর্ব
নির্ধারিত কোন উদ্দেশ্য সাধনের নিমিত্তে অনুসন্ধান ক্ষেত্র হতে বিভিন্ন পরিসংখ্যানিক
পদ্ধতিতে তথ্য আহরণ করাকে তথ্য সংগ্রহ বলে।
তথ্যের প্রকারভেদ
তথ্য
সংগ্রহের উৎসের উপর ভিত্তি করে তথ্যকে দুই ভাগে ভাগ করা যায়। যথা:
- (ক) প্রাথমিক তথ্য (Primary Data) এবং
- (খ) মাধ্যমিক তথ্য (Secondary Data)।
ক)
প্রাথমিক তথ্য (Primary Data): যে তথ্য সরাসরি পর্যবেক্ষনের মাধ্যমে মূল উৎস তে সংগ্রহ
করা হয় উহাকে প্রাথমিক তথ্য বলে। এক্ষেত্রে সময়, অর্থ ও জনবল বেশী লাগে। উদাহরণ:
কোন শহরের বস্তিবাসীর আর্থ সামাজিক অবস্থার গবেষণার ক্ষেত্রে বস্তিবাসীদের নিকট থেকে
সরাসরি সংগৃহীত তথ্যই প্রাথমিক তথ্য ।
(খ)
মাধ্যমিক তথ্য (Secondary Data): যে তথ্য কোন গবেষক বা সংস্থা কর্তৃক পূর্বে সংগৃহীত
(প্রকাশিত বা অপ্রকাশিত) তথ্য হতে সংগ্রহ করা হয়, তাকে মাধ্যমিক তথ্য বলে। এক্ষেত্রে
সময়, অর্থ ও জনবল কম লাগে। উদাহরণ কোন গবেষক কৃষির তথ্য “বাংলাদেশ পরিসংখ্যান ব্যুরো” কর্তৃক প্রকাশিত “বাংলাদেশ কৃষি বর্ষগ্রন্থ"
হতে সংগ্রহ করে, তবে এই তথ্য মাধ্যমিক তথ্য।
তথ্য উপস্থাপন
প্রাথমিক ভাবে সংগৃহীত তথ্যমালাকে বিভিন্ন গুণ ও বৈশিষ্ট্য অনুসারে সহজবোধ্য ও নিয়মক্রম অনুসারে সংক্ষিপ্ত আকারে উপস্থাপনের উপায়কে তথ্য উপস্থাপন বলে। তথ্যকে দু'টি উপায়ে উপস্থাপন করা যায়।
যথা:
- (ক) পরিসংখ্যানিক সারনী (Statistical Tables) এবং
- (খ) পরিসংখ্যানিক লেখ (Statistical Charts)
ক. পরিসংখ্যানিক সারনী: পরিসংখ্যানিক উপাত্তকে শ্রেণীতে বা গোত্রে সাজিয়ে যে সারনী পাওয়া যায় তাকে পরিসংখ্যানিক সারনী বলে। ইহা তিন ধরনের যথা:
- (i) শ্রেণীবদ্ধকরণ
- (ii) তালিকাবদ্ধকরণ এবং
- (ii) গণসংখ্যা নিবেশন ।
খ. পরিসংখ্যানিক লেখ: পরিসংখ্যানিক উপাত্তকে স্থান, কাল, পরিমাণ ইত্যাদি বৈশিষ্ট্য অনুসারে বিভিন্ন ধরনের চিত্রের সাহায্যে উপস্থাপন করাকে পরিসংখ্যানিক লেখ বলে।
এক্ষেত্রে ব্যবহৃত লেখগুলো হচ্ছে:
- (i) আয়ত লেখ
- (ii) গণসংখ্যা বহুভূজ
- (iii) গণসংখ্যা রেখা
- (iv) অজিভ রেখা
- (v) কালীন রেখা
- (vi) দণ্ডচিত্র এবং
- (vii) বৃত্ত চিত্র ।
গণসংখ্যা বিন্যাস বা নিবেশন
কোন অনুসন্ধানে সংগৃহীত তথ্য সমূহকে বৈশিষ্ট্যগত সাদৃশ্য অনুসারে কতগুলো শ্রেণীতে বিভক্ত করে, শ্রেণীগুলোকে মানের ক্রমানুসারে নিজ নিজ গণসংখ্যা সহ পাশাপাশি সাজিয়ে সারণী আকারে উপস্থাপন করাকে গণসংখ্যা নিবেশন বা বিন্যাস বলে। ইহা দুই ধরনের।
যথা:
- ক. সরল গণসংখ্যা নিবেশন এবং
- খ. শ্রেণীকৃত গণসংখ্যা নিবেশন।
নিম্নে উদাহরণের সাহায্যে দেখানো হল:-
সরল গণসংখ্যা নিবেশন
৩টি
মুদ্রার ৪৫ বার নিক্ষেপের ক্ষেত্রে-
মাথার সংখ্যা | গণস্যংখা |
---|---|
0 | 7 |
1 | 23 |
2 | 10 |
3 | 5 |
শ্রেণীকৃত গণসংখ্যা নিবেশন
নম্বরের শ্রেণি | ছাত্র সংখ্যা |
---|---|
10-20 | 8 |
20-30 | 12 |
30-40 | 15 |
40-50 | 5 |
50-60 | 2 |
শ্রেণীকৃত গণসংখ্যা নিবেশনের প্রয়োজনীয় বিষয়াবলী-
ক. শ্রেণী ব্যবধান (Class Interval): গণসংখ্যা নিবেশন তৈরীর সময় তথ্য সমূহকে কতগুলো সম বা অসম শ্রেণীতে লিপিবদ্ধ করা হয়। প্রত্যেক শ্রেণীর একটি সর্বোচ্চ মান ও একটি সর্বনিম্ন মান থাকে। উহাদের শ্রেণী সীমা বলে। এক্ষেত্রে সর্বনিম্ন মানকে নিম্নসীমা ও সর্বোচ্চ মানকে উচ্চ সীমা বলে। এই সর্বোচ্চ ও সর্বনিম্ন মানের পার্থক্যকে শ্ৰেণী ব্যপ্তি বা শ্রেণী ব্যবধান বলে। একে সংক্ষেপে C বা i দ্বারা প্রকাশ করা হয়। যদি 10–18 একটি শ্রেণী হয় তাহলে শ্রেণী ব্যপ্তি, C = 18–10 = 8।
অশ্রেণীকৃত তথ্যের ক্ষেত্রে শ্রেণী ব্যবধান দু’ভাবে নির্ণয় করা যায়। যথা:
- i. পরিসরের ভিত্তিতে শ্রেণী সংখ্যা নির্ণয় করে: কোন তথ্য সারির সর্বোচ্চ মানকে L, সর্বনিম্ন মানকে S এবং শ্রেণী সংখ্যাকে K ধরা হলে শ্রেণী ব্যবধান হবে, `i=\frac{L-S}K`। এক্ষেত্রে K এর মান সাধারণত 5 হতে 25 এর মধ্যে থাকে । ধরি কোন তথ্য সারির সর্বোচ্চ মান 500, সর্বনিম্ন মান 400 এবং শ্রেণী সংখ্যা 10 হলে শ্রেণী ব্যবধান হবে, `i=\frac{500-400}{10}`
এখানে L = সর্বোচ্চ মান এবং S = সর্বনিম্ন মান
- ii. গণসংখ্যার ভিত্তিতে শ্রেণীসংখ্যা নির্ণয় করে: কোন তথ্য সারির মোট গণসংখ্যা N হলে পরিসংখ্যানবিদ H.G. Sturges এর মতে শ্রেণীসংখ্যা হবে, K = 1 + 3.322 logN
ফলে শ্রেণী ব্যবধান হবে, `i=\frac{L-S}{1+3.322\log N}`
খ)
সম ও অসম শ্রেণী (Equal and Unequal Classes): যে নিবেশনের প্রত্যেক শ্রেণীর ব্যবধান সমান তাকে সমশ্রেণী বলে। যেমন: 10 – 20, 20 – 30, 30-40 ইত্যাদি সমশ্রেণী । যে নিবেশনের প্রত্যেক শ্রেণীর ব্যবধান সমান নয় তাকে অসম শ্রেণী বলে । যেমন: 10 – 20, 20 – 25, 25–35 ইত্যাদি অসম শ্রেণী।
গ)
খোলা ও বদ্ধ শ্রেণী (Open and Close Classess): যদি কোন নিবেশনের সর্বনিম্ন সীমা বা সর্বোচ্চ সীমা উল্লেখ না থাকে অথবা উভয়ই উল্লেখ না থাকে, তাহলে (তথ্য সংগ্রহ ও তথ্য উপস্থাপন ঐ শ্ৰেণীকে খোলা শ্ৰেণী বলে। যেমন: 10 অপেক্ষা কম, 30 অপেক্ষা অধিক ইত্যাদি খোলা শ্রেণী।
কোন নিবেশনের সর্বনিম্ন সীমা ও সর্বোচ্চ সীমা উল্লেখ থাকলে উহাকে বদ্ধ শ্রেণী বলে। যেমন: 10 – 20, 20-30, 30-40 ইত্যাদি বদ্ধ শ্রেণী।
ঘ. শ্রেণী সীমা (Class Limit): কোন গণসংখ্যা নিবেশনের প্রত্যেক শ্রেণীকে একজোড়া সংখ্যা দ্বারা প্রকাশ করা হয়। উহাদেরকে শ্রেণী সীমা বলে। উক্ত সংখ্যা দু'টির মধ্যে ছোট মানটিকে নিম্ন শ্রেণীসীমা এবং বড় মানটিকে উচ্চ সীমা বলে। যেমন: 10-20 কোন নিবেশনের শ্রেণী হলে 10 কে ঐ শ্রেণীর নিম্নসীমা এবং 20 কে উচ্চ সীমা বলে ।
ঙ) অন্তর্ভূক্ত ও বহির্ভূত পদ্ধতি (Inclusive and Exclusive Method): গণসংখ্যা নিবেশনে শ্রেণীসীমা নির্ধারণে দুটি পদ্ধতি ব্যবহার করা হয়। যথা:
- (i) অন্তর্ভূক্ত পদ্ধতি এবং
- (ii) বহির্ভূক্ত পদ্ধতি।
(i) অন্তর্ভূক্ত
পদ্ধতি (Inclusive Method): কোন গণসংখ্যা নিবেশনের প্রত্যেক শ্রেণীর নিম্নসীমা ও উচ্চ সীমা যদি ঐ শ্রেণীতে অন্তর্ভূক্ত থাকে তবে ঐ শ্রেণীকে অন্তর্ভূক্ত পদ্ধতির শ্রেণী বলে। এক্ষেত্রে কোন শ্রেণীর উচ্চ সীমা পরবর্তী শ্রেণীর নিম্নসীমার সমান হয় না। যেমনঃ
ধরি কোন শ্রেণীর নিম্নসীমা ও পরবর্তী শ্রেণীর উচ্চ সীমার পার্থক্য d হলে নিম্নসীমানা হবে শ্রেণীর নিম্নসীমা হতে
`\frac d\2` বিয়োগ এবং উচ্চ সীমানা হবে শ্রেণীর উচ্চ সীমার
সাথে হতে `\frac d\2` যোগ।
যেমন- শ্ৰেণী 10–19, 20-29 হলে d=20-19=1।
অতএব 10-19 শ্রেণীর নিম্নসীমানা হবে `10-\frac1\2=9.5` এবং উচ্চ সীমানা হবে `10+\frac1\2=9.5`
জ. শ্রেণী সংখ্যা (Number of Classes): সাধারণভাবে শ্রেণী সংখ্যা 5টি হতে 25 টির মধ্যে হওয়া উচিত। শ্রেণী সংখ্যা নির্ণয়ের জন্য পরিসংখ্যানবিদ Sturges একটি সূত্র প্রদান করেন। যা হল: K= 1+3.322 log N
এখানে K= শ্রেণী সংখ্যা এবং N= মোট তথ্যের সংখ্যা। যেমন: মোট তথ্যের সংখ্যা 25 হলে শ্রেণীর সংখ্যা হবে, K = 1 + 3.322 log 25 = 5.64= 6 টি।
তবে
ছোট শ্রেণিগুলো যেমন প্রাইমারি ও হাই স্কুল গুলোতে যে পরিসংখ্যান আছে সেখানে অন্য একটি
পদ্ধতিতে শ্রেণি সংখ্যা নির্ণয় করা হয়।
যেমন:
পরিসর= (সর্বোচ্চ সংখ্যা – সর্বনিন্ম সংখ্যা)+১
ঝ. ক্রমযোজিত গণসংখ্যা (Cumulative Frequency): কোন নিবেশনের শ্রেণী সমূহের গণসংখ্যাকে ক্রমান্বয়ে যোগ করে যে সংখ্যাগুলো পাওয়া যায় উহাদেরকে ক্রম যোজিত গণসংখ্যা বলে। এক্ষেত্রে ১ম শ্রেণীর গণসংখ্যার সাথে ২য় শ্রেণীর গণসংখ্যা যোগ করলে ২য় শ্রেণীর যোজিত গণসংখ্যা পাওয়া যায়। আবার ২য় শ্রেণীর যোজিত গণসংখ্যার সাথে ৩য় শ্রেণীর গণসংখ্যা যোগ করলে ৩য় শ্রেণীর যোজিত গণসংখ্যা পাওয়া যায়। এভাবে প্রত্যেক শ্রেণীর যোজিত গণসংখ্যা নির্ণয় করা হয়। একে সংক্ষেপে C.f. দ্বারা লিখা হয়। ইহা দু'ধরনের যথা:-
- i. উর্ধ্বমুখী ক্রমযোজিত গণসংখ্যা,
- ii. নিম্নমুখী ক্রমযোজিত গণসংখ্যা।
বিচ্ছিন্ন গণসংখ্যা সারণী (Discrete Frequency Distribution): কোন বিচ্ছিন্ন চলকের মানগুলি মানের ক্রমানুসারে সাজিয়ে উহাদের গণসংখ্যাগুলি পাশাপাশি লিপিবদ্ধ করে যে সারণী পাওয়া যায় তাকে বিচ্ছিন্ন গণসংখ্যা সারণী বা বিন্যাস বলে। যেমন:-
অবিচ্ছিন্ন গণসংখ্যা সারণী (Continuous Frequency Distribution): কেন অবিচ্ছিন্ন চলকের মানগুলি মানের ক্রমানুসারে শ্রেণীকরণ করে প্রত্যেক শ্রেণীর অন্তর্ভূক্ত গণসংখ্যাগুলি পাশাপাশি লিপিবদ্ধ করে যে সারণী পাওয়া যায় তাকে অবিচ্ছিন্ন গণসংখ্যা সারণী বা নিবেশন বলে। যেমন:
গণসংখ্যা নিবেশনের প্রস্তুতপ্রণালী
কোন নির্দিষ্ট উদ্দেশ্যে সংগৃহীত অবিন্যস্ত তথ্যের ভিত্তিতে গণসংখ্যা নিবেশন তৈরি করার প্রয়োজনীয় ধাপগুলো নিম্নে বর্ণিত হল-
২. শ্রেণী সংখ্যা নির্ণয়: কোন নিবেশনে শ্রেণী সংখ্যা কতটি হবে তার কোন বাধা ধরা নিয়ম নেই। তবে পরিসংখ্যানবিদদের মতে তথ্যের সংখ্যা 1000 এর কম হলে শ্রেণী সংখ্যা 5 থেকে 10 টির মধ্যে এবং তথ্যের সংখ্যা 1000 এর বেশী হলে শ্রেণী সংখ্যা 10 থেকে 25টির মধ্যে থাকা বাঞ্ছনীয়। শ্রেণী সংখ্যা বিভিন্ন পদ্ধতিতে নির্ণয় করা যায়। তবে পরিসংখ্যানবিদ H.G, Sturges সূত্রানুসারে শ্রেণী সংখ্যা নির্ণয় করা উত্তম। সূত্রটি হল: শ্ৰেণীসংখ্যা K= 1+3.322 logN। এখানে N হচ্ছে তথ্যের মোট সংখ্যা।
৩. শ্রেণী ব্যবধান নির্ণয়: পরিসরকে শ্রেণী সংখ্যা দ্বারা ভাগ করলে শ্রেণী ব্যবধান পাওয়া যায়। প্রাপ্ত ভাগফল পূর্ণসংখ্যা না হলে নিকটতম পূর্ণসংখ্যাকে শ্রেণী ব্যবধান ধরা হয় ।
যেমন: তথ্যসারির পরিসর 85 এবং শ্রেণী সংখ্যা 9 হলে শ্রেণী ব্যবধান হবে 85+9 =
9.7 = 10। তবে তথ্যসমূহ অপূর্ণ মানের হলে শ্রেণী ব্যবধানও অপূর্ণ সংখ্যা হওয়া যুক্তিযুক্ত।
৪. শ্রেণী সীমা নির্ধারণ: তথ্যসারির সর্বনিম্ন মান বা তার নিকটতম সংখ্যামান হচ্ছে ১ম শ্রেণীর নিম্নসীমা। এই নিম্নসীমার সাথে শ্রেণী ব্যবধান যোগ করে ১ম শ্রেণীর উর্ধ্বসীমা নির্ণয় করা হয়। এভাবে প্রাপ্ত উর্ধ্বসীমাকে ২য় শ্রেণীর নিম্নসীমা ধরা হয়।
অতঃপর উল্লেখিত প্রক্রিয়া অনুসারে ২য় শ্রেণীর উর্ধ্বসীমা এবং পরবর্তী শ্রেণী সমূহের সীমা নির্ণয় করা হয়। এভাবে প্রাপ্ত শ্রেণী বিন্যাসকে অবিচ্ছিন্ন শ্রেণী বিন্যাস বলে।
10-20, 20-30, 30-40, 40-50,60-60 ইত্যাদি।
৫. তথ্য সমূহকে শ্রেণীভূক্তকরণ: তথ্যসারির প্রত্যেক তথ্যকে সঠিক শ্রেণী বরাবর মিল চিহ্ন (Tally Marks) দ্বারা উপস্থাপন করা হয়। এই টালি চিহ্নকে | দ্বারা লিখা এই প্রক্রিয়ায় প্রত্যেক শ্রেণীর ৫ম টালি চিহ্নকে পূর্ববর্তী ৪টি টালি চিহ্নের উপর আড়াআড়ি ভাবে স্থাপন করা হয়। যেমন: INJ
৬. গণসংখ্যা নির্ণয়ঃ উল্লেখিত প্রক্রিয়ায় প্রত্যেক শ্রেণী বরাবর প্রাপ্ত টালি চিহ্নসমূহ গণনা করে ঐ শ্রেণীর গণসংখ্যা নির্ণয় করা হয়।
৭. গণসংখ্যা নিবেশন নির্ণয়ঃ শ্রেণী, টালি চিহ্ন এবং গণসংখ্যা সমূহকে পর পর তিনটি কলামে লিখে যে সারনী পাওয়া যায় উহাই গণসংখ্যা নিবেশন।
Post a Comment
0 Comments