গড় এবং প্রচুরক সবসময় একই কেন্দ্রীয় মান দেয়।
গড় এবং প্রচুরক শুধুমাত্র খুব প্রতিসম বা সমরূপ ডেটাসেটে মিলে যায়; অনেক বাস্তব ডেটাসেটে সবচেয়ে ঘন ঘন মান সংখ্যাগত গড় থেকে আলাদা হয়।
গড় এবং প্রচুরকের মধ্যে গাণিতিক পার্থক্য ব্যাখ্যা করা হয়েছে এই তুলনায়, যা ডেটা সেট বর্ণনা করার জন্য ব্যবহৃত কেন্দ্রীয় প্রবণতার দুটি মূল পরিমাপ। এটি কীভাবে এগুলো গণনা করা হয়, বিভিন্ন ধরনের ডেটার প্রতি এগুলোর প্রতিক্রিয়া কেমন, এবং বিশ্লেষণে কোনটি সবচেয়ে কার্যকর তা নিয়ে আলোচনা করে।
সমস্ত সংখ্যা যোগ করে এবং তাদের সংখ্যা দিয়ে ভাগ করে গাণিতিক গড় নির্ণয় করা হয়।
ডেটাসেটে সবচেয়ে বেশি বার উপস্থিত মান, যদি থাকে।
| বৈশিষ্ট্য | গড় | মোড |
|---|---|---|
| সংজ্ঞা | গাণিতিক গড় | সবচেয়ে ঘন ঘন মান |
| গণনা পদ্ধতি | যোগ করুন তারপর সংখ্যা দিয়ে ভাগ করুন | মানগুলির গণনা করুন |
| ডেটা মানের উপর নির্ভরশীলতা | সমস্ত মান ব্যবহার করে | শুধুমাত্র কম্পাঙ্ক গণনা ব্যবহার করে |
| আউটলায়ারের প্রভাব | অত্যন্ত সংবেদনশীল | আউটলায়ার দ্বারা প্রভাবিত হয় না |
| ক্যাটেগরিক্যাল ডেটার ক্ষেত্রে প্রযোজ্য | না | হ্যাঁ |
| স্বতন্ত্রতা | সর্বদা একটি মানে | একাধিক মোড থাকতে পারে বা কোনোটি নাও থাকতে পারে |
| সাধারণ উদাহরণ ব্যবহার | গড় পরীক্ষার স্কোর | সবচেয়ে সাধারণ বিভাগ |
একটি ডেটাসেটের সমস্ত মানের যোগফল করে এবং যতগুলো মান আছে তা দিয়ে ভাগ করে গড় নির্ণয় করা হয়, যা একটি সংখ্যাগত গড় প্রদান করে। অন্যদিকে, প্রচুরক হল সেই একক মান যা সবচেয়ে বেশি বার ঘটে, যা মানের পরিবর্তে ঘটনার হারকে তুলে ধরে।
ডেটাসেটের প্রতিটি মানের প্রতিফলন ঘটায় গড়, তাই অস্বাভাবিকভাবে বেশি বা কম সংখ্যা একে উল্লেখযোগ্যভাবে সরিয়ে দিতে পারে। প্রচুরক শুধুমাত্র নির্ভর করে কোন মান কতবার আসে তার ওপর, যা চরম বা বিরল মানের প্রভাব থেকে প্রতিরোধী করে তোলে।
গড় সাধারণত পরিমাণগত তথ্যের ক্ষেত্রে প্রয়োগ করা হয় যেখানে প্রকৃত সংখ্যাগত গড় অর্থবহ হয়, যেমন উচ্চতা বা পরীক্ষার ফলাফল। মোড সংখ্যাগত এবং শ্রেণিবদ্ধ উভয় ধরনের তথ্যের জন্য ব্যবহার করা যেতে পারে, যেমন জরিপের প্রতিক্রিয়া বা সবচেয়ে সাধারণ ফলাফল।
প্রতিটি ডেটাসেটের ঠিক একটি গড় থাকে, এমনকি সেই মানটি ডেটাসেটের অংশ না হলেও। মোড বিভিন্ন রূপে আসতে পারে: কোনো মান পুনরাবৃত্তি না হলে ডেটাসেটের কোনো মোড নেই, একটি মোড থাকতে পারে, অথবা একাধিক মোড থাকতে পারে যদি একাধিক মান সর্বোচ্চ পুনরাবৃত্তি ভাগ করে।
গড় এবং প্রচুরক সবসময় একই কেন্দ্রীয় মান দেয়।
গড় এবং প্রচুরক শুধুমাত্র খুব প্রতিসম বা সমরূপ ডেটাসেটে মিলে যায়; অনেক বাস্তব ডেটাসেটে সবচেয়ে ঘন ঘন মান সংখ্যাগত গড় থেকে আলাদা হয়।
মোড গুরুত্বপূর্ণ ডেটা উপেক্ষা করে কারণ এটি শুধুমাত্র কম্পাঙ্ক গণনা করে।
মোড সবচেয়ে সাধারণ ফলাফলকে তুলে ধরে এবং এটি গড় মানের প্রতিনিধিত্ব করার জন্য নয়; এটি সংখ্যাগত গড়ের পরিবর্তে কম্পাঙ্ক বিশ্লেষণের জন্য মূল্যবান।
প্রতিটি ডেটাসেটের একটি মোড থাকতে হবে।
কিছু ডেটাসেটের কোনো মোড থাকে না যদি কোনো মান অন্যদের চেয়ে বেশি বার পুনরাবৃত্তি না হয়, অর্থাৎ সেক্ষেত্রে কেন্দ্রীয় প্রবণতা তুলে ধরার জন্য কম্পাঙ্ক কার্যকর নয়।
গড় সবসময় সাধারণ মানের সেরা পরিমাপ।
গড় বিভ্রান্তিকর হতে পারে তির্যক ডেটার ক্ষেত্রে যেখানে চরম মান থাকে, সেক্ষেত্রে প্রচুরক বা মধ্যমা সাধারণ মানের একটি ভালো ধারণা দিতে পারে।
সংখ্যাগত তথ্যে সকল মানের প্রতিফলন ঘটাতে একটি একক গড় প্রয়োজন হলে এবং বহির্ভূত মান সমস্যা না হলে গড় নির্বাচন করুন। ডেটাসেটে সবচেয়ে সাধারণ মান শনাক্ত করতে চাইলে, বিশেষ করে শ্রেণিবদ্ধ বা কম্পাঙ্ক-ভিত্তিক তথ্যের ক্ষেত্রে প্রচুরক ব্যবহার করুন।
যদিও উভয় পদই দুটি সেটের মধ্যে উপাদানগুলিকে কীভাবে ম্যাপ করা হয় তা বর্ণনা করে, তারা সমীকরণের বিভিন্ন দিককে সম্বোধন করে। এক-থেকে-এক (ইনজেক্টিভ) ফাংশনগুলি ইনপুটগুলির স্বতন্ত্রতার উপর ফোকাস করে, নিশ্চিত করে যে কোনও দুটি পথ একই গন্তব্যে নিয়ে যায় না, অন্যদিকে (অনুমানিক) ফাংশনগুলি নিশ্চিত করে যে প্রতিটি সম্ভাব্য গন্তব্যে আসলে পৌঁছানো হয়েছে।
অভিসারী এবং বিমুখ ধারার মধ্যে পার্থক্য নির্ধারণ করে যে অসীম সংখ্যার যোগফল একটি নির্দিষ্ট, সসীম মানে স্থির হয় নাকি অসীমের দিকে ঘুরে বেড়ায়। যদিও একটি অভিসারী ধারা ক্রমশ তার পদগুলিকে 'সঙ্কুচিত' করে যতক্ষণ না তাদের মোট সংখ্যা একটি স্থির সীমায় পৌঁছায়, একটি বিমুখ ধারা স্থিতিশীল হতে ব্যর্থ হয়, হয় আবদ্ধ না হয়ে বৃদ্ধি পায় অথবা চিরতরে দোদুল্যমান হয়।
যদিও উভয় সিস্টেমই দ্বি-মাত্রিক সমতলে অবস্থান চিহ্নিত করার প্রাথমিক উদ্দেশ্য পূরণ করে, তারা বিভিন্ন জ্যামিতিক দর্শন থেকে কাজটি সম্পন্ন করে। কার্টেসিয়ান স্থানাঙ্কগুলি অনুভূমিক এবং উল্লম্ব দূরত্বের একটি কঠোর গ্রিডের উপর নির্ভর করে, যেখানে পোলার স্থানাঙ্কগুলি একটি কেন্দ্রীয় স্থির বিন্দু থেকে সরাসরি দূরত্ব এবং কোণের উপর ফোকাস করে।
কোণ এবং ঢাল উভয়ই একটি রেখার 'খাড়াতা' পরিমাপ করে, কিন্তু তারা ভিন্ন গাণিতিক ভাষা ব্যবহার করে। একটি কোণ দুটি ছেদকারী রেখার মধ্যে বৃত্তাকার ঘূর্ণনকে ডিগ্রি বা রেডিয়ানে পরিমাপ করে, অন্যদিকে ঢাল অনুভূমিক 'রান'-এর সাপেক্ষে উল্লম্ব 'উত্থান'কে সংখ্যাসূচক অনুপাত হিসাবে পরিমাপ করে।
এই তুলনাটি গড় এবং মধ্যমা নামক পরিসংখ্যানগত ধারণাগুলি ব্যাখ্যা করে, যেখানে প্রতিটি কেন্দ্রীয় প্রবণতার পরিমাপ কীভাবে গণনা করা হয়, বিভিন্ন ডেটাসেটের সাথে এগুলি কেমন আচরণ করে এবং ডেটার বণ্টন ও বহির্ভূত মানের উপস্থিতির ভিত্তিতে কোনটি অন্যটির চেয়ে বেশি তথ্যপূর্ণ হতে পারে তা বিস্তারিতভাবে আলোচনা করা হয়েছে।