Comparthing Logo
পরিসংখ্যানতথ্য-বিশ্লেষণগণিতশিক্ষা

গড় বনাম স্ট্যান্ডার্ড বিচ্যুতি

যদিও উভয়ই পরিসংখ্যানের মৌলিক স্তম্ভ হিসেবে কাজ করে, তারা একটি ডেটাসেটের সম্পূর্ণ ভিন্ন বৈশিষ্ট্য বর্ণনা করে। গড়টি কেন্দ্রীয় ভারসাম্য বিন্দু বা গড় মান চিহ্নিত করে, যেখানে স্ট্যান্ডার্ড ডেভিয়েশন পরিমাপ করে যে পৃথক ডেটা পয়েন্টগুলি সেই কেন্দ্র থেকে কতটা দূরে সরে গেছে, তথ্যের ধারাবাহিকতা বা অস্থিরতা সম্পর্কিত গুরুত্বপূর্ণ প্রেক্ষাপট প্রদান করে।

হাইলাইটস

  • গড় 'কি' প্রদান করে, যখন আদর্শ বিচ্যুতি প্রকরণের ক্ষেত্রে 'কত' প্রদান করে।
  • একটি গড় দুটি দলের জন্য অভিন্ন হতে পারে যারা দৃশ্যত সম্পূর্ণ ভিন্ন দেখায়।
  • স্ট্যান্ডার্ড ডেভিয়েশন হলো মূলত গড় থেকে প্রতিটি বিন্দুর গড় দূরত্ব।
  • উভয় সংখ্যা ছাড়া, একটি পরিসংখ্যানগত সারাংশ প্রায়শই অসম্পূর্ণ বা এমনকি প্রতারণামূলক হয়।

গড় কী?

একটি ডেটাসেটের গাণিতিক গড়, যা সমস্ত মান যোগ করে এবং মোট গণনা দিয়ে ভাগ করে গণনা করা হয়।

  • এটি একটি সংখ্যাসূচক বন্টনের জ্যামিতিক কেন্দ্র বা 'ভারসাম্য বিন্দু' হিসেবে কাজ করে।
  • গণনাটি নির্দিষ্ট ডেটাসেটের মধ্যে প্রতিটি একক মানকে অন্তর্ভুক্ত করে।
  • আউটলায়ার বা চরম মানগুলি বেশিরভাগ ডেটা থেকে ফলাফলকে উল্লেখযোগ্যভাবে দূরে সরিয়ে দিতে পারে।
  • একটি নিখুঁতভাবে প্রতিসম বেল কার্ভে, এটি মধ্যমা এবং মোডের সাথে ঠিক সারিবদ্ধ হয়।
  • পরিসংখ্যানবিদরা গ্রীক অক্ষর mu (μ) দিয়ে জনসংখ্যার সংস্করণটি উপস্থাপন করেন।

স্ট্যান্ডার্ড বিচ্যুতি কী?

একটি মেট্রিক যা ডেটা মানের একটি সেটের মধ্যে পরিবর্তন বা বিচ্ছুরণের পরিমাণ পরিমাপ করে।

  • কম মান নির্দেশ করে যে ডেটা পয়েন্টগুলি গণনা করা গড়ের খুব কাছাকাছি অবস্থিত।
  • এটি মূল পরিমাপ করা তথ্যের মতো একই ভৌত এককগুলিতে প্রকাশ করা হয়।
  • ভ্যারিয়েন্সের বর্গমূল নিয়ে মান বের করা হয়।
  • উচ্চ মানগুলি বিস্তৃত বিস্তারের ইঙ্গিত দেয়, যা ডেটাতে কম পূর্বাভাসযোগ্যতা নির্দেশ করে।
  • গ্রীক অক্ষর সিগমা (σ) হল জনসংখ্যা বিচ্যুতির জন্য ব্যবহৃত আদর্শ প্রতীক।

তুলনা সারণি

বৈশিষ্ট্য গড় স্ট্যান্ডার্ড বিচ্যুতি
প্রাথমিক উদ্দেশ্য কেন্দ্রটি সনাক্ত করুন বিস্তার পরিমাপ করুন
বহিরাগতদের প্রতি সংবেদনশীলতা উঁচু (সহজেই বাঁকা হতে পারে) উচ্চ (চরম মান বৃদ্ধি করে)
গাণিতিক প্রতীক μ (Mu) অথবা x̄ (x-বার) σ (সিগমা) অথবা s
পরিমাপের একক তথ্যের মতোই তথ্যের মতোই
শূন্যের ফলাফল গড় শূন্য। সমস্ত ডেটা পয়েন্ট অভিন্ন
কী অ্যাপ্লিকেশন সাধারণ কর্মক্ষমতা নির্ধারণ ঝুঁকি এবং ধারাবাহিকতা মূল্যায়ন

বিস্তারিত তুলনা

কেন্দ্রিকতা বনাম বিচ্ছুরণ

গড় আপনাকে বলে যে আপনার ডেটার 'মাঝামাঝি' কোথায় থাকে, যা সাধারণ স্তরের একটি দ্রুত স্ন্যাপশট প্রদান করে। বিপরীতে, মানক বিচ্যুতি কেন্দ্রের অবস্থান উপেক্ষা করে সংখ্যার মধ্যে ব্যবধানের উপর সম্পূর্ণ মনোযোগ দেয়। আপনার দুটি গ্রুপ থাকতে পারে যার গড় ৫০ সমান, কিন্তু যদি একটি গ্রুপ ৪৯ থেকে ৫১ এবং অন্যটি ০ থেকে ১০০ এর মধ্যে হয়, তাহলে মানক বিচ্যুতিই একমাত্র হাতিয়ার যা নির্ভরযোগ্যতার এই বিশাল পার্থক্য প্রকাশ করে।

চরম মূল্যবোধের প্রতি সংবেদনশীলতা

উভয় মেট্রিকই বহির্মুখী সূচকের গুরুত্ব অনুভব করে, কিন্তু তারা স্বতন্ত্রভাবে প্রতিক্রিয়া দেখায়। একটি ব্যতিক্রমী উচ্চ সংখ্যা গড়কে উপরের দিকে টেনে আনবে, যা সম্ভবত 'সাধারণ' অভিজ্ঞতার একটি বিভ্রান্তিকর চিত্র তুলে ধরবে। একই বহির্মুখী সূচকটি মান বিচ্যুতিকে স্পাইক করতে বাধ্য করে, গবেষককে ইঙ্গিত দেয় যে ডেটাটি গোলমালপূর্ণ এবং গড়টি পুরো গোষ্ঠীর নির্ভরযোগ্য প্রতিনিধি নাও হতে পারে।

স্বাভাবিক বন্টনে ভূমিকা

একটি বেল কার্ভ দেখার সময়, এই দুটি একসাথে কাজ করে আকৃতি নির্ধারণ করে। গড় নির্ধারণ করে যে বক্ররেখার শীর্ষটি অনুভূমিক অক্ষের কোথায় অবস্থিত। আদর্শ বিচ্যুতি প্রস্থ নিয়ন্ত্রণ করে; একটি ছোট বিচ্যুতি একটি লম্বা, সরু স্পাইক তৈরি করে, যখন একটি বড় বিচ্যুতি বক্ররেখাটিকে একটি ছোট, মোটা ঢিবিতে প্রসারিত করে। একসাথে, তারা আমাদের ভবিষ্যদ্বাণী করতে দেয় যে প্রায় 68% ডেটা কেন্দ্রের একটি 'ধাপের' মধ্যে পড়ে।

ব্যবহারিক সিদ্ধান্ত গ্রহণ

বাস্তব জগতে, গড় প্রায়শই লক্ষ্যের জন্য ব্যবহৃত হয়, যেমন একটি লক্ষ্য বিক্রয় গড়ের জন্য। তবে, পেশাদাররা ঝুঁকি পরিচালনা করার জন্য স্ট্যান্ডার্ড ডেভিয়েশন ব্যবহার করেন। উদাহরণস্বরূপ, একজন যাত্রী যদি খুব কম স্ট্যান্ডার্ড ডেভিয়েশনের বাস রুট বেছে নিতে পারেন তবে গড় ভ্রমণের সময় কিছুটা বেশি হবে, কারণ এটি নিশ্চিত করে যে তারা অপ্রত্যাশিত পরিবর্তনের মুখোমুখি হওয়ার পরিবর্তে প্রতিদিন সময়মতো পৌঁছাবে।

সুবিধা এবং অসুবিধা

গড়

সুবিধাসমূহ

  • + গণনা করা সহজ
  • + খুবই স্বজ্ঞাত
  • + সমস্ত ডেটা ব্যবহার করে
  • + তুলনা করার জন্য ভালো

কনস

  • বহিরাগতদের জন্য ঝুঁকিপূর্ণ
  • বিকৃত তথ্যে বিভ্রান্তিকর
  • একটি অস্তিত্বহীন মান হতে পারে
  • অভ্যন্তরীণ বৈচিত্র্য লুকিয়ে রাখে

স্ট্যান্ডার্ড বিচ্যুতি

সুবিধাসমূহ

  • + ডেটা নির্ভরযোগ্যতা দেখায়
  • + মূল ইউনিটগুলি বজায় রাখে
  • + সম্ভাব্যতার জন্য গুরুত্বপূর্ণ
  • + অস্থিরতা চিহ্নিত করে

কনস

  • ম্যানুয়ালি গণনা করা আরও কঠিন
  • অর্থ ছাড়া অর্থহীন
  • চরমপন্থা দ্বারা প্রভাবিত
  • বড় নমুনা প্রয়োজন

সাধারণ ভুল ধারণা

পুরাণ

৮০ এর গড় মানে বেশিরভাগ মানুষ ৮০ স্কোর করেছে।

বাস্তবতা

গড়টি কেবল একটি ভারসাম্য বিন্দু; যদি ডেটা খুব উচ্চ এবং খুব নিম্ন মানের মধ্যে বিভক্ত করা হয় তবে কারও পক্ষে আসলে 80 স্কোর করা সম্ভব নয়।

পুরাণ

আদর্শ বিচ্যুতি একটি ঋণাত্মক সংখ্যা হতে পারে।

বাস্তবতা

যেহেতু সূত্রটিতে গড় থেকে পার্থক্যগুলিকে বর্গ করা জড়িত, ফলাফল সর্বদা শূন্য বা ধনাত্মক হয়। একটি ঋণাত্মক মান গাণিতিকভাবে অসম্ভব।

পুরাণ

একটি উচ্চ মান বিচ্যুতি সর্বদা একটি 'খারাপ' জিনিস।

বাস্তবতা

এটি কেবল বৈচিত্র্যের ইঙ্গিত দেয়। একটি শ্রেণীকক্ষে, আগ্রহের ক্ষেত্রে উচ্চ মানের বিচ্যুতি দুর্দান্ত, এমনকি যদি এটি একই রকম বোল্ট তৈরির চেষ্টা করা কোনও প্রস্তুতকারকের জন্য চাপের কারণ হতে পারে।

পুরাণ

আপনি গড় না জেনেও আদর্শ বিচ্যুতি গণনা করতে পারেন।

বাস্তবতা

সূত্রের একটি প্রয়োজনীয় উপাদান হলো গড়। সবকিছু কত দূরে তা পরিমাপ করার আগে আপনাকে প্রথমে কেন্দ্রটি কোথায় তা জানতে হবে।

সচরাচর জিজ্ঞাসিত প্রশ্নাবলী

কেন আমরা কেবল পরিসরের পরিবর্তে আদর্শ বিচ্যুতি ব্যবহার করি?
এই পরিসরটি কেবলমাত্র দুটি চরম মান দেখে, যা কেবল এলোমেলো পরিবর্তন হলে প্রতারণামূলক হতে পারে। স্ট্যান্ডার্ড ডেভিয়েশন অনেক বেশি শক্তিশালী কারণ এটি প্রতিটি ডেটা পয়েন্ট কোথায় অবস্থিত তা দেখে। এটি আপনাকে কেবল বাইরের সীমানা নয়, ডেটার 'ঘনত্ব' সম্পর্কে ধারণা দেয়।
দুটি ভিন্ন ডেটাসেটের কি একই গড় এবং ভিন্ন মান বিচ্যুতি থাকতে পারে?
অবশ্যই, এবং বাস্তব জগতে এটি সর্বদা ঘটে। কল্পনা করুন দুটি শহর যেখানে গড় তাপমাত্রা ৭০ ডিগ্রি। একটি সারা বছর ৬৮ থেকে ৭২ ডিগ্রির মধ্যে থাকতে পারে (কম বিচ্যুতি), অন্যটি ২০ থেকে ১২০ ডিগ্রির মধ্যে (উচ্চ বিচ্যুতি)। গড় একই, কিন্তু জীবনযাত্রার অভিজ্ঞতা সম্পূর্ণ ভিন্ন।
নিম্ন মান বিচ্যুতির অর্থ কি তথ্য 'সঠিক'?
অগত্যা নয়। এর অর্থ হল তথ্য 'সুনির্দিষ্ট' বা সামঞ্জস্যপূর্ণ। আপনার এমন একটি স্কেল থাকতে পারে যা ভাঙা এবং সর্বদা 5 পাউন্ড ওজনের জিনিসগুলিকে খুব বেশি ভারী করে। ফলাফলগুলি সামঞ্জস্যপূর্ণ হওয়ায় আদর্শ বিচ্যুতি কম হবে, তবে প্রকৃত ওজনের তুলনায় গড়টি ভুল হবে।
বিনিয়োগের জন্য কোনটি বেশি গুরুত্বপূর্ণ?
বিনিয়োগকারীরা উভয়ই ব্যবহার করেন, কিন্তু তারা প্রায়শই স্ট্যান্ডার্ড ডেভিয়েশনকে আরও ঘনিষ্ঠভাবে পর্যবেক্ষণ করেন কারণ এটি 'ঝুঁকি' প্রতিনিধিত্ব করে। গড় আপনাকে প্রত্যাশিত রিটার্ন বলে, কিন্তু স্ট্যান্ডার্ড ডেভিয়েশন আপনাকে বলে যে সেই রিটার্ন কতটা ওঠানামা করতে পারে। উচ্চ ডেভিয়েশন মানে একটি কঠিন যাত্রা এবং অস্থায়ী ক্ষতির সম্ভাবনা বেশি।
আউটলায়াররা এই দুটি মেট্রিককে কীভাবে প্রভাবিত করে?
আউটলায়ার হলো গড়ের জন্য চুম্বকের মতো, যা একে তাদের দিকে টেনে আনে। স্ট্যান্ডার্ড ডেভিয়েশনের জন্য, একটি আউটলায়ার একটি পরিবর্ধকের মতো কাজ করে। যেহেতু গণনায় গড় থেকে দূরত্ব বর্গ করা হয়, তাই একটি একক দূরবর্তী বিন্দু স্ট্যান্ডার্ড ডেভিয়েশনকে অসামঞ্জস্যপূর্ণভাবে স্ফীত করতে পারে, যা ইঙ্গিত দেয় যে ডেটা সেটটি অত্যন্ত বিস্তৃত।
গড়ের পরিবর্তে কখন আমার মধ্যমা ব্যবহার করা উচিত?
যখন আপনার তথ্য 'বাঁকা' থাকে অথবা বাড়ির দাম বা বেতনের মতো বিশাল বহির্মুখী থাকে, তখন আপনার মধ্যমা ব্যবহার করা উচিত। এই ক্ষেত্রে, কয়েকজন বিলিয়নেয়ার গড় আয়কে একজন সাধারণ ব্যক্তির প্রকৃত আয়ের চেয়ে অনেক বেশি দেখাতে পারেন। মধ্যমা এই চরমপন্থাগুলির প্রতি 'প্রতিরোধী'।
৬৮-৯৫-৯৯.৭ নিয়মটি কী?
এটি স্বাভাবিক বিতরণের জন্য একটি সহজ নিয়ম। এটি বলে যে আপনার ডেটার ৬৮% গড়ের একটি আদর্শ বিচ্যুতির মধ্যে পড়বে, ৯৫% দুটির মধ্যে থাকবে এবং ৯৯.৭% তিনটির মধ্যে থাকবে। এটি একটি নির্দিষ্ট ডেটা পয়েন্ট আসলে কতটা 'স্বাভাবিক' বা 'অদ্ভুত' তা দেখার একটি শক্তিশালী উপায়।
আদর্শ বিচ্যুতি কি প্রকরণের মতো?
এগুলো ঘনিষ্ঠভাবে সম্পর্কিত, কিন্তু একই নয়। ভ্যারিয়েন্স হলো গড়ের সাথে বর্গীয় পার্থক্যের গড়, যার ফলে 'বর্গীয় একক' (বর্গ ডলারের মতো) তৈরি হয়, যা কল্পনা করা কঠিন। আমরা ভ্যারিয়েন্সের বর্গমূল নিই যাতে স্ট্যান্ডার্ড ডেভিয়েশন পাওয়া যায় যাতে ইউনিটগুলি আবার আমাদের মূল ডেটার সাথে মেলে।

রায়

যখন কোনও দলের সামগ্রিক স্তরের সারসংক্ষেপের জন্য আপনার একটি একক প্রতিনিধি সংখ্যার প্রয়োজন হয় তখন গড়টি চয়ন করুন। যখন আপনার সেই গড়ের নির্ভরযোগ্যতা বা আপনার নমুনার মধ্যে বৈচিত্র্য বোঝার প্রয়োজন হয় তখন আদর্শ বিচ্যুতির উপর নির্ভর করুন।

সম্পর্কিত তুলনা

এক-থেকে-এক বনাম অনটু ফাংশন

যদিও উভয় পদই দুটি সেটের মধ্যে উপাদানগুলিকে কীভাবে ম্যাপ করা হয় তা বর্ণনা করে, তারা সমীকরণের বিভিন্ন দিককে সম্বোধন করে। এক-থেকে-এক (ইনজেক্টিভ) ফাংশনগুলি ইনপুটগুলির স্বতন্ত্রতার উপর ফোকাস করে, নিশ্চিত করে যে কোনও দুটি পথ একই গন্তব্যে নিয়ে যায় না, অন্যদিকে (অনুমানিক) ফাংশনগুলি নিশ্চিত করে যে প্রতিটি সম্ভাব্য গন্তব্যে আসলে পৌঁছানো হয়েছে।

কনভারজেন্ট বনাম ডাইভারজেন্ট সিরিজ

অভিসারী এবং বিমুখ ধারার মধ্যে পার্থক্য নির্ধারণ করে যে অসীম সংখ্যার যোগফল একটি নির্দিষ্ট, সসীম মানে স্থির হয় নাকি অসীমের দিকে ঘুরে বেড়ায়। যদিও একটি অভিসারী ধারা ক্রমশ তার পদগুলিকে 'সঙ্কুচিত' করে যতক্ষণ না তাদের মোট সংখ্যা একটি স্থির সীমায় পৌঁছায়, একটি বিমুখ ধারা স্থিতিশীল হতে ব্যর্থ হয়, হয় আবদ্ধ না হয়ে বৃদ্ধি পায় অথবা চিরতরে দোদুল্যমান হয়।

কার্টেসিয়ান বনাম পোলার স্থানাঙ্ক

যদিও উভয় সিস্টেমই দ্বি-মাত্রিক সমতলে অবস্থান চিহ্নিত করার প্রাথমিক উদ্দেশ্য পূরণ করে, তারা বিভিন্ন জ্যামিতিক দর্শন থেকে কাজটি সম্পন্ন করে। কার্টেসিয়ান স্থানাঙ্কগুলি অনুভূমিক এবং উল্লম্ব দূরত্বের একটি কঠোর গ্রিডের উপর নির্ভর করে, যেখানে পোলার স্থানাঙ্কগুলি একটি কেন্দ্রীয় স্থির বিন্দু থেকে সরাসরি দূরত্ব এবং কোণের উপর ফোকাস করে।

কোণ বনাম ঢাল

কোণ এবং ঢাল উভয়ই একটি রেখার 'খাড়াতা' পরিমাপ করে, কিন্তু তারা ভিন্ন গাণিতিক ভাষা ব্যবহার করে। একটি কোণ দুটি ছেদকারী রেখার মধ্যে বৃত্তাকার ঘূর্ণনকে ডিগ্রি বা রেডিয়ানে পরিমাপ করে, অন্যদিকে ঢাল অনুভূমিক 'রান'-এর সাপেক্ষে উল্লম্ব 'উত্থান'কে সংখ্যাসূচক অনুপাত হিসাবে পরিমাপ করে।

গড় বনাম প্রচুরক

গড় এবং প্রচুরকের মধ্যে গাণিতিক পার্থক্য ব্যাখ্যা করা হয়েছে এই তুলনায়, যা ডেটা সেট বর্ণনা করার জন্য ব্যবহৃত কেন্দ্রীয় প্রবণতার দুটি মূল পরিমাপ। এটি কীভাবে এগুলো গণনা করা হয়, বিভিন্ন ধরনের ডেটার প্রতি এগুলোর প্রতিক্রিয়া কেমন, এবং বিশ্লেষণে কোনটি সবচেয়ে কার্যকর তা নিয়ে আলোচনা করে।