গড় বনাম মধ্যমা
এই তুলনাটি গড় এবং মধ্যমা নামক পরিসংখ্যানগত ধারণাগুলি ব্যাখ্যা করে, যেখানে প্রতিটি কেন্দ্রীয় প্রবণতার পরিমাপ কীভাবে গণনা করা হয়, বিভিন্ন ডেটাসেটের সাথে এগুলি কেমন আচরণ করে এবং ডেটার বণ্টন ও বহির্ভূত মানের উপস্থিতির ভিত্তিতে কোনটি অন্যটির চেয়ে বেশি তথ্যপূর্ণ হতে পারে তা বিস্তারিতভাবে আলোচনা করা হয়েছে।
হাইলাইটস
- গড় এবং মধ্যক হল কেন্দ্রীয় প্রবণতার পরিমাপ যা একটি ডেটাসেটের কেন্দ্রীয় বিন্দুকে সংক্ষেপে প্রকাশ করে।
- গড় প্রতিটি পৃথক মানের দ্বারা প্রভাবিত হয়, ফলে এটি চরম ডেটা পয়েন্টের প্রতি সংবেদনশীল।
- মিডিয়ান ডেটাসেটকে দুটি সমান ভাগে বিভক্ত করে, যা আউটলায়ারদের প্রতি প্রতিরোধী করে তোলে।
- গড় ভারসাম্যপূর্ণ ডেটাসেটের জন্য সবচেয়ে ভালো যেখানে মধ্যমা তির্যক বা অসম ডেটাসেটের ক্ষেত্রে পছন্দনীয়।
গড় কী?
মানগুলি যোগ করে এবং সংখ্যা দ্বারা ভাগ করে প্রাপ্ত গাণিতিক গড়।
- কেন্দ্রীয় প্রবণতার পরিমাপ
- গণনা: সকল মানের যোগফলকে মানের সংখ্যা দ্বারা ভাগ করা
- সংবেদনশীলতা: প্রতিটি ডেটা পয়েন্ট দ্বারা প্রভাবিত হয়
- সাধারণ ব্যবহার: প্রতিসম বিন্যাস
- আউটলায়ারের প্রভাব: চরম মানের প্রতি অত্যন্ত সংবেদনশীল
মিডিয়ান কী?
ক্রমবিন্যস্ত ডেটাসেটের নিম্ন ও উচ্চার্ধকে পৃথককারী কেন্দ্রীয় মান।
- কেন্দ্রীয় প্রবণতার পরিমাপ
- মান যখন সাজানো হয় তখন মধ্যম মান নির্ণয়
- সংবেদনশীলতা: শুধুমাত্র মানগুলির ক্রমের উপর নির্ভর করে
- সাধারণ ব্যবহার: পক্ষপাতদুষ্ট বা অসম ডেটাসেট
- আউটলায়ারের প্রভাব: চরম মানের বিরুদ্ধে দৃঢ় প্রতিরোধক্ষমতা
তুলনা সারণি
| বৈশিষ্ট্য | গড় | মিডিয়ান |
|---|---|---|
| সংজ্ঞা | সমস্ত মানের গাণিতিক গড় | অর্ডারকৃত তালিকার মধ্যম মান |
| গণনা পদ্ধতি | মানগুলির যোগফল ÷ গণনা | মানগুলি সাজান এবং মধ্যবিন্দু নির্বাচন করুন |
| আউটলায়ার সংবেদনশীলতা | অত্যন্ত সংবেদনশীল | আউটলায়ার প্রতিরোধী |
| সেরা প্রতিসাম্যের জন্য | হ্যাঁ | কম প্রাসঙ্গিক |
| বাঁকানো ডেটার জন্য সেরা | কম প্রতিনিধিত্বমূলক | আরও প্রতিনিধিত্বমূলক |
| অর্ডার প্রয়োজন | না | হ্যাঁ |
| সাধারণ উদাহরণ ব্যবহার | গড় পরীক্ষার স্কোর | মধ্যম পরিবারের আয় |
বিস্তারিত তুলনা
মৌলিক হিসাবনিকাশ
ডেটাসেটের সমস্ত সংখ্যা যোগ করে মোট সংখ্যার পরিমাণ দিয়ে ভাগ করলে গড় পাওয়া যায়, যা একটি কেন্দ্রীয় সংখ্যাগত গড় প্রদান করে। অন্যদিকে, মধ্যমা নির্ণয় করা হয় মানগুলোকে ছোট থেকে বড় ক্রমে সাজিয়ে মাঝের মানটি বেছে নিয়ে, অথবা মোট সংখ্যা জোড় হলে মাঝের দুটি মানের গড় নির্ণয় করে।
আউটলায়ারদের প্রভাব
গড় সকল মানকে সমানভাবে অন্তর্ভুক্ত করে বলে অত্যন্ত উচ্চ বা নিম্ন মান এর ফলাফলকে ব্যাপকভাবে প্রভাবিত করে, যা তির্যক ডেটায় সাধারণ মানকে ভুলভাবে উপস্থাপন করতে পারে। মধ্যমা মানগুলো কত বড় বা ছোট তা বিবেচনা না করে শুধু তাদের ক্রমের ওপর নির্ভর করে, তাই এটি চরম মান দ্বারা কম প্রভাবিত হয় এবং তির্যক বণ্টনে প্রায়শই বেশি তথ্যপূর্ণ হয়।
বিতরণ আকৃতির প্রভাব
সমমিতিক ডেটাসেটে যেখানে চরম মান নেই, সেখানে গড় এবং মধ্যক প্রায় কাছাকাছি থাকে এবং দুটিই ডেটাসেটের কেন্দ্রকে ভালোভাবে বর্ণনা করে। তবে, একদিকে লম্বা লেজযুক্ত বণ্টনে গড় লেজের দিকে সরে যায়, অন্যদিকে মধ্যক অর্ধেক ডেটা উপরে এবং নিচে থাকার অবস্থানে থাকে, যা একটি ভিন্ন দৃষ্টিভঙ্গি প্রদান করে।
কম্পিউটেশনাল প্রয়োজনীয়তা
গড় নির্ণয় করা সহজ এবং ক্রমানুসারে সাজানোর প্রয়োজন হয় না, যা সাধারণ তালিকা বা রিয়েল-টাইম হিসাবের জন্য দ্রুততর হতে পারে। মধ্যমা নির্ণয়ের জন্য প্রথমে মানগুলো সাজাতে হয়, যা খুব বড় তালিকার ক্ষেত্রে কম্পিউটেশনাল ওভারহেড যোগ করতে পারে কিন্তু আউটলায়ারের মানের প্রভাবমুক্ত একটি কেন্দ্রীয় মান দেয়।
সুবিধা এবং অসুবিধা
গড়
সুবিধাসমূহ
- +গণনা করা সহজ
- +সমস্ত ডেটা পয়েন্ট ব্যবহার করে
- +অনেক বিশ্লেষণের জন্য মানদণ্ড
- +গাণিতিকভাবে প্রচলিত
কনস
- −আউটলায়ার দ্বারা বিকৃত
- −অপ্রতিনিধিত্বমূলক পক্ষপাতযুক্ত ডেটার প্রতিফলন নয়
- −সংখ্যাগত তথ্য প্রয়োজন
- −চরম ক্ষেত্রে বিভ্রান্ত করতে পারে
মিডিয়ান
সুবিধাসমূহ
- +আউটলায়ার প্রতিরোধী
- +সাধারণ মান প্রতিফলিত করে
- +বাঁকানো ডেটার জন্য উপযোগী
- +অর্ডারকৃত ডেটাসেটের ক্ষেত্রে প্রযোজ্য
কনস
- −সর্টিং প্রয়োজন
- −মাত্রার চরম সীমা উপেক্ষা করে
- −প্রতিসম ডেটায় কম কার্যকর
- −কম্পিউটেশনাল ওভারহেড
সাধারণ ভুল ধারণা
গড় এবং মধ্যমা সবসময় একই ফলাফল দেয়।
গড় এবং মধ্যমা কেবল তখনই মিলে যায় যখন তথ্যগুলো মোটামুটি প্রতিসম হয় এবং চরম মান থাকে না; তির্যক বা অসম তথ্যের ক্ষেত্রে এদের মধ্যে উল্লেখযোগ্য পার্থক্য হতে পারে।
গড় সবসময়ই সেরা গড় পরিমাপ।
গড় হল প্রচলিত গড় কিন্তু তির্যক ডেটা বা আউটলায়ারের ক্ষেত্রে বিভ্রান্তিকর হতে পারে, যেখানে মধ্যমা প্রায়শই ডেটাসেটের সাধারণ মানকে ভালোভাবে প্রতিফলিত করে।
মিডিয়ান গুরুত্বপূর্ণ ডেটা উপেক্ষা করে।
মিডিয়ান ডেটাকে উপেক্ষা করে না; এটি কেন্দ্রীয় অবস্থানের উপর গুরুত্ব দেয় এবং ইচ্ছাকৃতভাবে বহির্ভূত প্রভাব কমিয়ে একটি দৃঢ় কেন্দ্রীয় মান প্রদান করে।
মিডিয়ান জোড় সংখ্যক ডেটাসেটের সাথে কাজ করে না।
জোড় সংখ্যক ডেটাসেটের ক্ষেত্রে মধ্যমা হিসাব করা হয় সাজানোর পর দুটি কেন্দ্রীয় মানের গড় হিসেবে, তাই এটি এখনও একটি কেন্দ্রবিন্দু নির্ধারণ করে।
সচরাচর জিজ্ঞাসিত প্রশ্নাবলী
পরিসংখ্যানে গড় বলতে ঠিক কী বোঝায়?
একটি ডেটাসেটের মধ্যক কীভাবে নির্ণয় করবেন?
গড়ের চেয়ে মধ্যমা কেন ভালো হতে পারে?
গড় এবং মধ্যমা কি সমান হতে পারে?
দৈনন্দিন ব্যবহারে কোনটি বেশি প্রচলিত?
মিডিয়ান কি ডেটা পয়েন্টগুলোকে উপেক্ষা করে?
বড় ডেটাসেটের জন্য কি মিন ভালো?
গড় এবং মধ্যক কি গণিতের ক্লাসের বাইরেও ব্যবহার করা হয়?
রায়
তথ্যগুলো মোটামুটি প্রতিসম হলে এবং আউটলায়ার খুব কম থাকলে গড় ব্যবহার করুন, কারণ এটি প্রচলিত গড়মান দেয়। ডেটাসেটটি তির্যক হলে বা চরম মান থাকলে মধ্যক নির্বাচন করুন, কারণ এটি একটি কেন্দ্রীয় মান দেয় যা সাধারণ এন্ট্রিকে ভালোভাবে প্রতিফলিত করে।
সম্পর্কিত তুলনা
এক-থেকে-এক বনাম অনটু ফাংশন
যদিও উভয় পদই দুটি সেটের মধ্যে উপাদানগুলিকে কীভাবে ম্যাপ করা হয় তা বর্ণনা করে, তারা সমীকরণের বিভিন্ন দিককে সম্বোধন করে। এক-থেকে-এক (ইনজেক্টিভ) ফাংশনগুলি ইনপুটগুলির স্বতন্ত্রতার উপর ফোকাস করে, নিশ্চিত করে যে কোনও দুটি পথ একই গন্তব্যে নিয়ে যায় না, অন্যদিকে (অনুমানিক) ফাংশনগুলি নিশ্চিত করে যে প্রতিটি সম্ভাব্য গন্তব্যে আসলে পৌঁছানো হয়েছে।
কনভারজেন্ট বনাম ডাইভারজেন্ট সিরিজ
অভিসারী এবং বিমুখ ধারার মধ্যে পার্থক্য নির্ধারণ করে যে অসীম সংখ্যার যোগফল একটি নির্দিষ্ট, সসীম মানে স্থির হয় নাকি অসীমের দিকে ঘুরে বেড়ায়। যদিও একটি অভিসারী ধারা ক্রমশ তার পদগুলিকে 'সঙ্কুচিত' করে যতক্ষণ না তাদের মোট সংখ্যা একটি স্থির সীমায় পৌঁছায়, একটি বিমুখ ধারা স্থিতিশীল হতে ব্যর্থ হয়, হয় আবদ্ধ না হয়ে বৃদ্ধি পায় অথবা চিরতরে দোদুল্যমান হয়।
কার্টেসিয়ান বনাম পোলার স্থানাঙ্ক
যদিও উভয় সিস্টেমই দ্বি-মাত্রিক সমতলে অবস্থান চিহ্নিত করার প্রাথমিক উদ্দেশ্য পূরণ করে, তারা বিভিন্ন জ্যামিতিক দর্শন থেকে কাজটি সম্পন্ন করে। কার্টেসিয়ান স্থানাঙ্কগুলি অনুভূমিক এবং উল্লম্ব দূরত্বের একটি কঠোর গ্রিডের উপর নির্ভর করে, যেখানে পোলার স্থানাঙ্কগুলি একটি কেন্দ্রীয় স্থির বিন্দু থেকে সরাসরি দূরত্ব এবং কোণের উপর ফোকাস করে।
কোণ বনাম ঢাল
কোণ এবং ঢাল উভয়ই একটি রেখার 'খাড়াতা' পরিমাপ করে, কিন্তু তারা ভিন্ন গাণিতিক ভাষা ব্যবহার করে। একটি কোণ দুটি ছেদকারী রেখার মধ্যে বৃত্তাকার ঘূর্ণনকে ডিগ্রি বা রেডিয়ানে পরিমাপ করে, অন্যদিকে ঢাল অনুভূমিক 'রান'-এর সাপেক্ষে উল্লম্ব 'উত্থান'কে সংখ্যাসূচক অনুপাত হিসাবে পরিমাপ করে।
গড় বনাম প্রচুরক
গড় এবং প্রচুরকের মধ্যে গাণিতিক পার্থক্য ব্যাখ্যা করা হয়েছে এই তুলনায়, যা ডেটা সেট বর্ণনা করার জন্য ব্যবহৃত কেন্দ্রীয় প্রবণতার দুটি মূল পরিমাপ। এটি কীভাবে এগুলো গণনা করা হয়, বিভিন্ন ধরনের ডেটার প্রতি এগুলোর প্রতিক্রিয়া কেমন, এবং বিশ্লেষণে কোনটি সবচেয়ে কার্যকর তা নিয়ে আলোচনা করে।