اگر از یک مجموعه داده عظیم استفاده کنم، سوگیری خودش را خنثی میکند.
در واقع، مجموعه دادههای بزرگتر اغلب حاوی سوگیریهای سیستمی و ظریفتری هستند که مدلها در بزرگنمایی آنها حتی بهتر عمل میکنند. حجم دادهها جایگزین تنوع یا انصاف نیست.
در دنیای یادگیری ماشین، مجموعه دادهها به ندرت خنثی هستند. کاهش سوگیری شامل مهندسی پیشگیرانه برای شناسایی و خنثی کردن انحرافات ناعادلانه است، در حالی که تقویت سوگیری پدیدهای خطرناک است که در آن مدلها در واقع نابرابریهای موجود را اغراق میکنند و اغلب پیشبینیهایی ارائه میدهند که به طور قابل توجهی تبعیضآمیزتر از دادههای ناقصی هستند که بر اساس آنها آموزش دیدهاند.
مداخلات فنی استراتژیک که برای شناسایی، کاهش و متعادلسازی بیعدالتی سیستماتیک در دادههای آموزشی و خروجیهای مدل طراحی شدهاند.
فرآیندی ناخواسته که در آن الگوریتمهای یادگیری ماشین، الگوهای کلیشهای موجود در دادهها را تقویت و بیش از حد شاخصگذاری میکنند.
| ویژگی | کاهش سوگیری مجموعه دادهها | تقویت بایاس مجموعه دادهها |
|---|---|---|
| هدف اصلی | دستیابی به نتایج عادلانه و منصفانه | به حداکثر رساندن اطمینان پیشبینی (غیرعمدی) |
| تأثیر بر روند دادهها | همبستگیهای ناعادلانه را به طور فعال مسطح میکند | انحرافات موجود را اغراقآمیز و به صورت کد ثابت بیان میکند |
| روششناسی | افزایش دادهها، وزندهی مجدد و ممیزیها | میانبرهای الگوریتمی و بایاس القایی |
| شدت منابع | بالا؛ نیازمند نظارت و گزینش متخصص است | کم؛ اگر کنترل نشود، به طور خودکار اتفاق میافتد |
| تأثیر نظارتی | به رعایت قانون هوش مصنوعی اتحادیه اروپا و GDPR کمک میکند | خطر مجازاتهای قانونی و اخلاقی را افزایش میدهد |
| نتیجه بلندمدت | هوش مصنوعی قوی، قابل تعمیم و قابل اعتماد | مدلهای کج، تبعیضآمیز و شکننده |
کاهش سوگیری یک نبرد دشوار است زیرا اغلب نیاز به فدا کردن مقدار کمی از دقت خام دارد تا اطمینان حاصل شود که یک مدل با همه گروهها منصفانه رفتار میکند. از طرف دیگر، تقویت به طور طبیعی اتفاق میافتد زیرا الگوریتمها برای یافتن کارآمدترین مسیر برای رسیدن به پاسخ صحیح طراحی شدهاند و متأسفانه، کلیشهها اغلب مسیری از نظر آماری «آسان» را ارائه میدهند که مدل بیش از حد آن را اتخاذ میکند.
کاهش تلاش میکند تا با تنظیم دستی وزن دادهها، اشتباهات تاریخی - مانند مدلهای امتیازدهی اعتباری که محلههای خاصی را جریمه میکنند - را اصلاح کند. تقویت همان اشتباهات تاریخی را میگیرد و آنها را به قوانین دیجیتال تبدیل میکند؛ اگر یک مدل ببیند که وامهای یک گروه خاص در طول تاریخ رد شده است، ممکن است تصمیم بگیرد که *همیشه* باید به آن گروه داده نشود، و آینده را حتی محدودتر از گذشته کند.
مهندسان در سه مرحله با کاهش سوگیری مقابله میکنند: پیشپردازش (پاکسازی دادهها)، حین پردازش (تغییر محاسبات در طول آموزش) و پسپردازش (تنظیم نتایج نهایی). تقویت معمولاً در مرحله «در حین پردازش» رخ میدهد، جایی که تمایل مدل برای به حداقل رساندن خطا منجر به نادیده گرفتن «نویز» نمونههای اقلیت به نفع «سیگنال» اکثریت میشود.
ترسناکترین بخش تقویت سوگیری، توانایی آن در رشد در طول زمان است. اگر یک ابزار استخدام سوگیرانه، کاندیداهای متنوع را فیلتر کند، دادههای مربوط به کارمندان «موفق» حتی کمتر متنوع میشود، که در نتیجه به نسخه بعدی ابزار میآموزد که حتی محدودتر باشد. استراتژیهای مناسب برای کاهش سوگیری، با معرفی نمونههای «خلاف واقع» که فرضیات مدل را به چالش میکشند، این چرخه را میشکنند.
اگر از یک مجموعه داده عظیم استفاده کنم، سوگیری خودش را خنثی میکند.
در واقع، مجموعه دادههای بزرگتر اغلب حاوی سوگیریهای سیستمی و ظریفتری هستند که مدلها در بزرگنمایی آنها حتی بهتر عمل میکنند. حجم دادهها جایگزین تنوع یا انصاف نیست.
الگوریتمها خنثی هستند زیرا فقط ریاضی هستند.
ریاضی خنثی است، اما اهدافی که ما به الگوریتمها میدهیم - مانند «حداکثر کردن دقت» - با دادههای مغرضانه تعامل دارند تا نتایج مغرضانه تولید کنند. مسیر «خنثی» اغلب تبعیضآمیزترین مسیر است.
کاهش تعصب برای هوش مصنوعی صرفاً «درستی سیاسی» است.
در واقع این یک ضرورت فنی است؛ مدلهایی که سوگیری را کاهش نمیدهند، اغلب در دنیای واقعی شکست میخورند زیرا نمیتوانند ورودیهای متنوع را مدیریت کنند و منجر به شکستهای بزرگ و از دست دادن درآمد میشوند.
حذف ستونهای «حساس» مانند نژاد یا جنسیت، تعصب را متوقف میکند.
این «انصاف از طریق نابینایی» است و به ندرت جواب میدهد. مدلها میتوانند به راحتی این ویژگیها را از طریق دادههای جایگزین مانند کد پستی، عادات خرید یا حتی ساختار جمله استنباط کنند.
کاهش سوگیری یک الزام اخلاقی و فنی ضروری برای هر مدلی است که با افراد تعامل دارد یا تصمیماتی میگیرد که زندگی را تغییر میدهد. در حالی که تقویت، رفتار پیشفرض اکثر الگوریتمهای بهینهسازی نشده است، کاهش فعال تنها راه برای ساخت هوش مصنوعی است که در چشمانداز مدرن هم قانونی و هم قابل اعتماد باشد.
این مقایسه فنی، بدهبستانهای عملیاتی بین دادههای آزادی حرکت - که رفتارهای سیال و مهارنشده انسانی، دارایی یا مکانی را ثبت میکند - و محدودیتهای مجموعه دادههای ساختاریافته، طرحهای اعتبارسنجی سفت و سختی که برای اعمال ثبات پایگاه داده استفاده میشوند، را ارزیابی میکند. تصمیمگیری بین آنها مستلزم ایجاد تعادل بین پیشبینیپذیری ساختاری در برابر بینشهای غنی از فعالیت طبیعی و چندبعدی است.
انتخاب بین آزمایش آنلاین در مقیاس بزرگ و آزمایش مدل در مقیاس کوچک به معنای ایجاد تعادل بین اعتبارسنجی علّی خام در دنیای واقعی با تأیید الگوریتمی سریع و مقرون به صرفه است. در حالی که اجرای آزمایشهای زنده در میان پایگاههای کاربری عظیم، تأثیر واقعی کسب و کار و واقعیتهای رفتاری را آشکار میکند، آزمایش آفلاین در مقیاس کوچک، محیط کنترلشده و تکرارپذیر لازم برای تکرار سریع کد و دروازههای استقرار ایمن را فراهم میکند.
این مقایسه فنی، تفاوتهای عملیاتی بین آمارههای کافی و نمایش دادههای خام را تجزیه و تحلیل میکند. در حالی که دادههای خام هر نکته ظریف مشاهده شده را حفظ میکنند، آمارههای کافی آن مجموعه دادهها را به شکلی فشرده و بدون از دست دادن حتی یک ذره از اطلاعات مورد نیاز برای تخمین پارامترهای مدل شما، فشرده میکنند.
در دنیای تحلیلهای پرمخاطره، توانایی تشخیص الگوهای معنادار از نوسانات تصادفی، موفقیت را تعریف میکند. در حالی که استخراج سیگنال بر جداسازی بینشهای عملی با استفاده از فیلترهای ریاضی دقیق تمرکز دارد، تقویت نویز زمانی رخ میدهد که تحلیلگران واریانس تصادفی را با روندهای قابل توجه اشتباه میگیرند و اغلب منجر به خطاهای استراتژیک پرهزینه و مدلهای پیشبینی ناقص میشوند.
در حالی که فیلتر نویز، نوسانات تصادفی سطح پایین را حذف میکند تا روند اصلی مجموعه دادهها را روشن کند، استخراج سیگنال از دادههای پرت به طور فعال به دنبال نقاط دادهای شدید و ایزوله میگردد که ناهنجاریهای پنهان، خطاهای بحرانی سیستم یا پیشرفتهای ارزشمند را آشکار میکنند. دانستن زمان اعمال هر تکنیک، مانع از آن میشود که به طور تصادفی ارزشمندترین بینشهای دادهای خود را از دست بدهید.