میانگین و مد همیشه مقدار مرکزی یکسانی را ارائه میدهند.
میانگین و مد فقط در مجموعه دادههای بسیار متقارن یا یکنواخت همخوانی دارند؛ در بسیاری از مجموعه دادههای واقعی، متداولترین مقدار با میانگین عددی متفاوت است.
این مقایسه تفاوت ریاضی میان میانگین و مد را توضیح میدهد، دو معیار اصلی گرایش به مرکز که برای توصیف مجموعه دادهها استفاده میشوند، با تمرکز بر نحوه محاسبه آنها، واکنش آنها به انواع مختلف دادهها و زمان مفید بودن هر یک در تحلیل.
میانگین حسابی که با جمع کردن تمام اعداد و تقسیم آن بر تعدادشان به دست میآید.
بیشترین مقدار تکرارشونده در یک مجموعه داده، در صورت وجود.
| ویژگی | به معنای | حالت |
|---|---|---|
| تعریف | میانگین حسابی | بیشترین مقدار تکراری |
| روش محاسبه | سپس جمع کنید و بر تعداد تقسیم کنید | تعداد تکرار مقادیر |
| وابستگی به مقادیر دادهها | از تمام مقادیر استفاده میکند | تنها از شمارش فرکانس استفاده میکند |
| تأثیر نقاط پرت | بسیار حساس | تحت تأثیر نقاط پرت قرار نمیگیرد |
| برای دادههای طبقهبندیشده کاربرد دارد | خیر | بله |
| منحصربهفردی | همیشه یک میانگین | میتواند چند حالت یا هیچکدام داشته باشد |
| مثال معمول استفاده | میانگین نمره آزمون | متداولترین دستهبندی |
میانگین با جمع کردن تمام مقادیر در یک مجموعه داده و تقسیم آن بر تعداد مقادیر به دست میآید که میانگین عددی را ارائه میدهد. مد، از سوی دیگر، مقداری است که بیشترین تکرار را دارد و بر فراوانی تأکید میکند تا بزرگی.
میانگین تمام مقادیر موجود در مجموعه داده را منعکس میکند، بنابراین اعداد غیرمعمول بالا یا پایین میتوانند آن را بهطور قابل توجهی جابهجا کنند. مد تنها به تعداد تکرار یک مقدار بستگی دارد و در برابر تأثیر مقادیر افراطی یا نادر مقاوم است.
میانگین معمولاً برای دادههای کمی به کار میرود که میانگینهای عددی واقعی در آنها معنا دارد، مانند قد یا نمرات آزمون. مد میتواند هم برای دادههای عددی و هم برای دادههای طبقهای استفاده شود، مانند پاسخهای نظرسنجی یا رایجترین نتایج.
هر مجموعه داده دقیقاً یک میانگین دارد، حتی اگر آن مقدار بخشی از مجموعه داده نباشد. مدها میتوانند به چند شکل ظاهر شوند: یک مجموعه داده میتواند بدون مد باشد اگر هیچ مقداری تکرار نشود، یک مد واحد داشته باشد، یا چندین مد داشته باشد اگر چند مقدار بیشترین فراوانی را به اشتراک بگذارند.
میانگین و مد همیشه مقدار مرکزی یکسانی را ارائه میدهند.
میانگین و مد فقط در مجموعه دادههای بسیار متقارن یا یکنواخت همخوانی دارند؛ در بسیاری از مجموعه دادههای واقعی، متداولترین مقدار با میانگین عددی متفاوت است.
حالت فقط به تکرار توجه میکند و دادههای مهم را نادیده میگیرد.
حالت بیشترین نتیجه رایج را برجسته میکند و به معنای نشان دادن میانگین مقدار نیست؛ این برای تحلیل فراوانی ارزشمند است تا میانگینگیری عددی.
هر مجموعه داده باید یک مد داشته باشد.
برخی از مجموعهدادهها حالتی ندارند اگر هیچ مقداری بیشتر از مقادیر دیگر تکرار نشود، به این معنی که فراوانی در این حالت برای برجسته کردن تمایل مرکزی مفید نیست.
میانگین همیشه بهترین معیار برای مقدار معمولی است.
میانگین ممکن است برای دادههای کج با مقادیر افراطی گمراهکننده باشد، جایی که مد یا میانه میتواند درک بهتری از مقدار معمولی ارائه دهد.
میانگین را انتخاب کنید زمانی که به یک میانگین واحد نیاز دارید که تمام مقادیر دادههای عددی را منعکس کند و نقاط پرت مشکلی ایجاد نکنند. از مد استفاده کنید زمانی که میخواهید متداولترین مقدار را در یک مجموعه داده شناسایی کنید، بهویژه در دادههای دستهای یا دادههای متمرکز بر فراوانی.
در حالی که دانشمندان داده اغلب با هر دو اصطلاح در کاهش ابعاد مواجه میشوند، مؤلفههای اصلی جهت حداکثر واریانس در یک مجموعه داده را توصیف میکنند، در حالی که مقادیر منفرد، بزرگی مقیاسبندی را در امتداد آن محورهای هندسی در طول تجزیه ماتریس اندازهگیری میکنند. درک پل ریاضی آنها برای تسلط بر الگوریتمهایی مانند PCA و SVD ضروری است.
احتمال و آمار دو روی یک سکه ریاضی هستند که با عدم قطعیت از دو جهت مخالف برخورد میکنند. در حالی که احتمال، احتمال نتایج آینده را بر اساس مدلهای شناخته شده پیشبینی میکند، آمار دادههای گذشته را برای ساخت یا تأیید آن مدلها تجزیه و تحلیل میکند و به طور مؤثر از مشاهدات به عقب کار میکند تا حقیقت اساسی را پیدا کند.
اگرچه اغلب در مکالمات روزمره به جای یکدیگر استفاده میشوند، احتمال و شانس دو روش مختلف برای بیان احتمال یک رویداد هستند. احتمال تعداد نتایج مطلوب را با تعداد کل احتمالات مقایسه میکند، در حالی که شانس تعداد نتایج مطلوب را مستقیماً با تعداد نتایج نامطلوب مقایسه میکند.
در حالی که اعداد انتزاعی، کمیتها را به عنوان منطق نمادین محضِ تحتِ کنترلِ قوانینِ صوری و معادلاتِ جبری در نظر میگیرند، تفاسیرِ هندسی، همان مقادیر را به شکلها، خطوط و ابعادِ فضاییِ ملموس نگاشت میکنند. این دو دیدگاه، در کنار هم، زبانی دوگانه در ریاضیات تشکیل میدهند که کاراییِ نمادینِ بیحاصل را با درکِ بصریِ شهودی متعادل میکند.
در سطح بنیادی حساب، اعداد صحیح بزرگتر از یک به دو قلمرو مجزا تقسیم میشوند: اعداد اول، که به عنوان بلوکهای سازندهی تقسیمناپذیر ریاضیات عمل میکنند، و ساختارهای مرکب، که با ضرب آن اعداد اول در یکدیگر تشکیل میشوند. این تمایز همه چیز را از کاهش کسرهای ساده گرفته تا پروتکلهای رمزنگاری مدرن شکل میدهد.