গড় এবং মধ্যমা সবসময় একই ফলাফল দেয়।
গড় এবং মধ্যমা কেবল তখনই মিলে যায় যখন তথ্যগুলো মোটামুটি প্রতিসম হয় এবং চরম মান থাকে না; তির্যক বা অসম তথ্যের ক্ষেত্রে এদের মধ্যে উল্লেখযোগ্য পার্থক্য হতে পারে।
এই তুলনাটি গড় এবং মধ্যমা নামক পরিসংখ্যানগত ধারণাগুলি ব্যাখ্যা করে, যেখানে প্রতিটি কেন্দ্রীয় প্রবণতার পরিমাপ কীভাবে গণনা করা হয়, বিভিন্ন ডেটাসেটের সাথে এগুলি কেমন আচরণ করে এবং ডেটার বণ্টন ও বহির্ভূত মানের উপস্থিতির ভিত্তিতে কোনটি অন্যটির চেয়ে বেশি তথ্যপূর্ণ হতে পারে তা বিস্তারিতভাবে আলোচনা করা হয়েছে।
মানগুলি যোগ করে এবং সংখ্যা দ্বারা ভাগ করে প্রাপ্ত গাণিতিক গড়।
ক্রমবিন্যস্ত ডেটাসেটের নিম্ন ও উচ্চার্ধকে পৃথককারী কেন্দ্রীয় মান।
| বৈশিষ্ট্য | গড় | মিডিয়ান |
|---|---|---|
| সংজ্ঞা | সমস্ত মানের গাণিতিক গড় | অর্ডারকৃত তালিকার মধ্যম মান |
| গণনা পদ্ধতি | মানগুলির যোগফল ÷ গণনা | মানগুলি সাজান এবং মধ্যবিন্দু নির্বাচন করুন |
| আউটলায়ার সংবেদনশীলতা | অত্যন্ত সংবেদনশীল | আউটলায়ার প্রতিরোধী |
| সেরা প্রতিসাম্যের জন্য | হ্যাঁ | কম প্রাসঙ্গিক |
| বাঁকানো ডেটার জন্য সেরা | কম প্রতিনিধিত্বমূলক | আরও প্রতিনিধিত্বমূলক |
| অর্ডার প্রয়োজন | না | হ্যাঁ |
| সাধারণ উদাহরণ ব্যবহার | গড় পরীক্ষার স্কোর | মধ্যম পরিবারের আয় |
ডেটাসেটের সমস্ত সংখ্যা যোগ করে মোট সংখ্যার পরিমাণ দিয়ে ভাগ করলে গড় পাওয়া যায়, যা একটি কেন্দ্রীয় সংখ্যাগত গড় প্রদান করে। অন্যদিকে, মধ্যমা নির্ণয় করা হয় মানগুলোকে ছোট থেকে বড় ক্রমে সাজিয়ে মাঝের মানটি বেছে নিয়ে, অথবা মোট সংখ্যা জোড় হলে মাঝের দুটি মানের গড় নির্ণয় করে।
গড় সকল মানকে সমানভাবে অন্তর্ভুক্ত করে বলে অত্যন্ত উচ্চ বা নিম্ন মান এর ফলাফলকে ব্যাপকভাবে প্রভাবিত করে, যা তির্যক ডেটায় সাধারণ মানকে ভুলভাবে উপস্থাপন করতে পারে। মধ্যমা মানগুলো কত বড় বা ছোট তা বিবেচনা না করে শুধু তাদের ক্রমের ওপর নির্ভর করে, তাই এটি চরম মান দ্বারা কম প্রভাবিত হয় এবং তির্যক বণ্টনে প্রায়শই বেশি তথ্যপূর্ণ হয়।
সমমিতিক ডেটাসেটে যেখানে চরম মান নেই, সেখানে গড় এবং মধ্যক প্রায় কাছাকাছি থাকে এবং দুটিই ডেটাসেটের কেন্দ্রকে ভালোভাবে বর্ণনা করে। তবে, একদিকে লম্বা লেজযুক্ত বণ্টনে গড় লেজের দিকে সরে যায়, অন্যদিকে মধ্যক অর্ধেক ডেটা উপরে এবং নিচে থাকার অবস্থানে থাকে, যা একটি ভিন্ন দৃষ্টিভঙ্গি প্রদান করে।
গড় নির্ণয় করা সহজ এবং ক্রমানুসারে সাজানোর প্রয়োজন হয় না, যা সাধারণ তালিকা বা রিয়েল-টাইম হিসাবের জন্য দ্রুততর হতে পারে। মধ্যমা নির্ণয়ের জন্য প্রথমে মানগুলো সাজাতে হয়, যা খুব বড় তালিকার ক্ষেত্রে কম্পিউটেশনাল ওভারহেড যোগ করতে পারে কিন্তু আউটলায়ারের মানের প্রভাবমুক্ত একটি কেন্দ্রীয় মান দেয়।
গড় এবং মধ্যমা সবসময় একই ফলাফল দেয়।
গড় এবং মধ্যমা কেবল তখনই মিলে যায় যখন তথ্যগুলো মোটামুটি প্রতিসম হয় এবং চরম মান থাকে না; তির্যক বা অসম তথ্যের ক্ষেত্রে এদের মধ্যে উল্লেখযোগ্য পার্থক্য হতে পারে।
গড় সবসময়ই সেরা গড় পরিমাপ।
গড় হল প্রচলিত গড় কিন্তু তির্যক ডেটা বা আউটলায়ারের ক্ষেত্রে বিভ্রান্তিকর হতে পারে, যেখানে মধ্যমা প্রায়শই ডেটাসেটের সাধারণ মানকে ভালোভাবে প্রতিফলিত করে।
মিডিয়ান গুরুত্বপূর্ণ ডেটা উপেক্ষা করে।
মিডিয়ান ডেটাকে উপেক্ষা করে না; এটি কেন্দ্রীয় অবস্থানের উপর গুরুত্ব দেয় এবং ইচ্ছাকৃতভাবে বহির্ভূত প্রভাব কমিয়ে একটি দৃঢ় কেন্দ্রীয় মান প্রদান করে।
মিডিয়ান জোড় সংখ্যক ডেটাসেটের সাথে কাজ করে না।
জোড় সংখ্যক ডেটাসেটের ক্ষেত্রে মধ্যমা হিসাব করা হয় সাজানোর পর দুটি কেন্দ্রীয় মানের গড় হিসেবে, তাই এটি এখনও একটি কেন্দ্রবিন্দু নির্ধারণ করে।
তথ্যগুলো মোটামুটি প্রতিসম হলে এবং আউটলায়ার খুব কম থাকলে গড় ব্যবহার করুন, কারণ এটি প্রচলিত গড়মান দেয়। ডেটাসেটটি তির্যক হলে বা চরম মান থাকলে মধ্যক নির্বাচন করুন, কারণ এটি একটি কেন্দ্রীয় মান দেয় যা সাধারণ এন্ট্রিকে ভালোভাবে প্রতিফলিত করে।
যদিও উভয় পদই দুটি সেটের মধ্যে উপাদানগুলিকে কীভাবে ম্যাপ করা হয় তা বর্ণনা করে, তারা সমীকরণের বিভিন্ন দিককে সম্বোধন করে। এক-থেকে-এক (ইনজেক্টিভ) ফাংশনগুলি ইনপুটগুলির স্বতন্ত্রতার উপর ফোকাস করে, নিশ্চিত করে যে কোনও দুটি পথ একই গন্তব্যে নিয়ে যায় না, অন্যদিকে (অনুমানিক) ফাংশনগুলি নিশ্চিত করে যে প্রতিটি সম্ভাব্য গন্তব্যে আসলে পৌঁছানো হয়েছে।
অভিসারী এবং বিমুখ ধারার মধ্যে পার্থক্য নির্ধারণ করে যে অসীম সংখ্যার যোগফল একটি নির্দিষ্ট, সসীম মানে স্থির হয় নাকি অসীমের দিকে ঘুরে বেড়ায়। যদিও একটি অভিসারী ধারা ক্রমশ তার পদগুলিকে 'সঙ্কুচিত' করে যতক্ষণ না তাদের মোট সংখ্যা একটি স্থির সীমায় পৌঁছায়, একটি বিমুখ ধারা স্থিতিশীল হতে ব্যর্থ হয়, হয় আবদ্ধ না হয়ে বৃদ্ধি পায় অথবা চিরতরে দোদুল্যমান হয়।
যদিও উভয় সিস্টেমই দ্বি-মাত্রিক সমতলে অবস্থান চিহ্নিত করার প্রাথমিক উদ্দেশ্য পূরণ করে, তারা বিভিন্ন জ্যামিতিক দর্শন থেকে কাজটি সম্পন্ন করে। কার্টেসিয়ান স্থানাঙ্কগুলি অনুভূমিক এবং উল্লম্ব দূরত্বের একটি কঠোর গ্রিডের উপর নির্ভর করে, যেখানে পোলার স্থানাঙ্কগুলি একটি কেন্দ্রীয় স্থির বিন্দু থেকে সরাসরি দূরত্ব এবং কোণের উপর ফোকাস করে।
কোণ এবং ঢাল উভয়ই একটি রেখার 'খাড়াতা' পরিমাপ করে, কিন্তু তারা ভিন্ন গাণিতিক ভাষা ব্যবহার করে। একটি কোণ দুটি ছেদকারী রেখার মধ্যে বৃত্তাকার ঘূর্ণনকে ডিগ্রি বা রেডিয়ানে পরিমাপ করে, অন্যদিকে ঢাল অনুভূমিক 'রান'-এর সাপেক্ষে উল্লম্ব 'উত্থান'কে সংখ্যাসূচক অনুপাত হিসাবে পরিমাপ করে।
গড় এবং প্রচুরকের মধ্যে গাণিতিক পার্থক্য ব্যাখ্যা করা হয়েছে এই তুলনায়, যা ডেটা সেট বর্ণনা করার জন্য ব্যবহৃত কেন্দ্রীয় প্রবণতার দুটি মূল পরিমাপ। এটি কীভাবে এগুলো গণনা করা হয়, বিভিন্ন ধরনের ডেটার প্রতি এগুলোর প্রতিক্রিয়া কেমন, এবং বিশ্লেষণে কোনটি সবচেয়ে কার্যকর তা নিয়ে আলোচনা করে।