هوش مصنوعییادگیری ماشینینظریه انتخاب اجتماعیمدلسازی پیشبینیکنندههوش جمعیسیستمهای توصیهگر
تجمیع ترجیحات در مقابل مدلسازی پیشبینی فردی
تجمیع ترجیحات، ترجیحات فردی متعدد را در قالب تصمیمات جمعی ترکیب میکند، در حالی که مدلسازی پیشبینی فردی، رفتار شخصی را با استفاده از یادگیری ماشینی روی دادههای تککاربره پیشبینی میکند. هر دو، اهداف متمایزی را در سیستمهای هوش مصنوعی، از موتورهای توصیه گرفته تا پلتفرمهای رأیگیری دموکراتیک، دنبال میکنند.
برجستهها
تجمیع ترجیحات با قضایای اساسی عدم امکان دست و پنجه نرم میکند که پیشبینی فردی کاملاً از آنها اجتناب میکند.
مدلهای پیشبینی انفرادی با مشکلات شروع سرد منحصر به فردی مواجه هستند که روشهای جمعی از طریق دادههای مشترک از آنها اجتناب میکنند.
نگرانیهای مربوط به انصاف به شدت متفاوت است: انصاف گروهی رویهای در مقابل برابری رفتار فردی
روشهای گروهی مدرن به طرز جالبی هر دو الگو را با تجمیع بسیاری از پیشبینیهای منفرد ادغام میکنند.
تجمیع ترجیحات چیست؟
ترجیحات فردی چندگانه را برای تولید یک تصمیم یا رتبهبندی جمعی ترکیب میکند.
پارادوکس کندورسه نشان میدهد که ترجیحات اکثریت میتوانند به صورت ناگذرا چرخهای باشند، و تجمیع را از نظر تئوری چالشبرانگیز میکنند.
قضیه عدم امکان ارو ثابت میکند که هیچ روش تجمیع کاملی وجود ندارد که تمام معیارهای انصاف را به طور همزمان برآورده کند.
شمارش بوردا، رأیگیری چندجانبه و مقایسه زوجی، فلسفههای تجمیع اساساً متفاوتی را نشان میدهند.
برنامههای مدرن هوش مصنوعی شامل فیلترینگ مشارکتی و روشهای گروهی هستند که پیشبینیها را در مدلها تجمیع میکنند.
طراحی سازوکار در اقتصاد از تجمیع ترجیحات برای ایجاد سیستمهای سازگار با انگیزه برای آشکارسازی صادقانه استفاده میکند.
مدلسازی پیشبینی فردی چیست؟
از یادگیری ماشینی برای پیشبینی رفتار آینده یک فرد از دادههای تاریخی او استفاده میکند.
رگرسیون لجستیک و تقویت گرادیان همچنان به طور گسترده برای پیشبینیهای سطح فردی در صنعت به کار گرفته میشوند.
مهندسی ویژگی اغلب الگوهای زمانی، سیگنالهای جمعیتی و جاسازیهای زمینهای را در بر میگیرد.
نگرانیهای مربوط به انصاف زمانی مطرح میشود که مدلها بر اساس ویژگیهای محافظتشدهای مانند نژاد یا جنسیت تبعیض قائل میشوند.
کالیبراسیون و تمایز، ویژگیهای پیشبینیکنندهی متمایزی هستند؛ یک مدل میتواند به خوبی کالیبره شده باشد، اما غیرمنصفانه باشد.
استدلال خلاف واقع به ارزیابی آنچه اتفاق میافتد اگر مداخلات متغیرهای خاص را برای آن فرد تغییر دهند، کمک میکند.
تجمیع ترجیحات اساساً میپرسد که یک گروه چه میخواهد و ترجیحات فردی را به عنوان ورودیهایی برای یک تابع تصمیمگیری جمعی در نظر میگیرد. ریشههای فلسفی آن به اراده عمومی روسو و حساب فایدهگرایی بنتام برمیگردد. در مقابل، مدلسازی پیشبینی فردی، فرد را به عنوان واحد تحلیل در نظر میگیرد - این فرد خاص در مرحله بعد چه خواهد کرد؟ اولی بر مشروعیت دموکراتیک و رفاه اجتماعی تأکید دارد؛ دومی برای دقت پیشبینی و مداخله عملی بهینه میشود.
مبانی نظری
نظریه انتخاب اجتماعی، ستون فقرات ریاضی تجمیع ترجیحات را فراهم میکند و نتایج اولیه کندورسه، بوردا، ارو و سن، آنچه را که ما معتقدیم قابل دستیابی است، شکل میدهد. مدلسازی پیشبینی فردی از نظریه یادگیری آماری، که در آن بُعد واپنیک-چرووننکی و خطای تعمیم مرز پیچیدگی رادماکر، مشتق میشود. جالب توجه است که روشهای گروهی مانند دستهبندی و تقویت، پلی ایجاد میکنند: آنها پیشبینیهای بسیاری از یادگیرندگان ضعیف را جمعآوری میکنند و هر دو الگو را با هم ترکیب میکنند.
انصاف و اخلاق
انصاف تجمیعی به این موضوع میپردازد که آیا این فرآیند به شرکتکنندگان به طور مساوی احترام میگذارد - آیا قانون رأیگیری به کسی نفوذ نامتناسب میدهد؟ انصاف پیشبینی فردی میپرسد که آیا افراد مشابه پیشبینیهای مشابهی دریافت میکنند یا خیر، که اغلب از طریق برابری جمعیتی یا شانس برابر رسمی میشود. این مفاهیم انصاف میتوانند در تضاد باشند؛ یک روش تجمیعی که کاملاً ترجیحات اکثریت را منعکس میکند، ممکن است به طور سیستماتیک به ضرر گروههای اقلیت باشد.
پیادهسازی عملی
استقرار تجمیع ترجیحات در مقیاس بزرگ نیازمند مدیریت سختی محاسباتی است: تجمیع بهینه Kemeny یک مسئله NP-hard است و حتی راهحلهای تقریبی نیز به الگوریتمهای پیچیدهای نیاز دارند. مدلهای پیشبینی منفرد با موانع مختلفی روبرو هستند - مهندسی ویژگی برای دادههای رفتاری پراکنده، مدیریت رانش مفهوم با تکامل ترجیحات کاربر و حفظ تازگی مدل بدون هزینههای آموزش مجدد بیش از حد. هر دو نیازمند توجه دقیق به زیرساخت دادهها هستند، اما محدودیتهای مهندسی به طور قابل توجهی متفاوت هستند.
معیارهای ارزیابی و موفقیت
ارزیابی کیفیت تجمیع شامل تحلیل اصل موضوعه است - آیا یک روش، استقلال از گزینههای نامربوط، کارایی پارتو یا عدم دیکتاتوری را برآورده میکند؟ از نظر تجربی، توابع رفاه اجتماعی میزان مطلوبیت حاصل از جمع را اندازهگیری میکنند. مدلهای پیشبینی فردی از معیارهای عملکرد پیشبینی استفاده میکنند، با این حال این معیارها میتوانند گمراهکننده باشند: یک مدل کاملاً کالیبره شده اگر بدون در نظر گرفتن پیامدهای خلاف واقع عمل بر اساس پیشبینیها به کار گرفته شود، ممکن است همچنان تصمیمات مضری تولید کند.
مزایا و معایب
تجمیع ترجیحات
مزایا
+مشروعیت دموکراتیک در تصمیمات
+مقاوم در برابر شکستهای تک نقطهای
+دیدگاههای متنوع را در بر میگیرد
+ویژگیهای انصاف مبتنی بر نظریه
مصرف شده
−محدودیتهای عدم امکان ارو
−از نظر محاسباتی در مقیاس بزرگ گران است
−مستعد دستکاری استراتژیک
−ممکن است ترجیحات اقلیت را سرکوب کند
مدلسازی پیشبینی فردی
مزایا
+خروجیهای بسیار شخصیسازیشده
+هدفگیری مداخلهی عملی
+مقیاسپذیری سریع با محاسبات ابری
+بهبود مستمر از حلقههای بازخورد
مصرف شده
−نگرانیهای مربوط به حریم خصوصی و نظارت
−تقویت تعصبات تاریخی
−دادههای پراکنده برای کاربران جدید
−ابهام در تصمیمات مدل پیچیده
تصورات نادرست رایج
افسانه
تجمیع ترجیحات همیشه گزینهای را تولید میکند که اکثر مردم ترجیح میدهند.
واقعیت
پارادوکس کندورسه و قضیه ارو نشان میدهند که ترجیحات اکثریت میتوانند به صورت ناگذرا چرخهای باشند و هیچ روشی تمام معیارهای شهودی انصاف را برآورده نمیکند. نامزدی که در تطابقهای دو به دو از همه پیشی بگیرد، ممکن است وجود نداشته باشد و مجبور به ایجاد بدهبستان بین ویژگیهای مطلوب شود.
افسانه
مدلهای پیشبینی فردی، آنچه را که افراد واقعاً انجام خواهند داد، پیشبینی میکنند.
واقعیت
این مدلها رفتار را مشروط به الگوهای تاریخی پیشبینی میکنند، نه انتخابهای واقعی آینده. افراد تغییر میکنند، زمینهها تغییر میکنند و پیشبینیها وقتی به صورت مداخلهای استفاده شوند، خود-ویرانگر میشوند - پیشبینی اینکه کسی از کار کنارهگیری خواهد کرد و سپس ارائه مشوقهای حفظ، همان نتیجه پیشبینیشده را تغییر میدهد.
افسانه
روشهای تجمیع، خنثی و عاری از سوگیری هستند.
واقعیت
هر قاعده تجمیع، ارزشهایی را در مورد اینکه چه کسی ترجیحاتش مهم است و چگونه اختلافات حل میشود، رمزگذاری میکند. رأیگیری جمعی به نفع اقلیتهای متمرکز است؛ شمارش بوردا به نفع مقبولیت گسترده است. انتخاب روش ذاتاً سیاسی است، نه صرفاً فنی.
افسانه
دادههای بیشتر همیشه پیشبینیهای فردی را بهبود میبخشند.
واقعیت
فراتر از یک نقطه، ویژگیهای اضافی باعث ایجاد نویز، هزینه محاسباتی و خطر حریم خصوصی میشوند. متغیرهای نامربوط باعث بیشبرازش میشوند و دادههای تاریخی از شرایط تغییر یافته، ارتباط مدل را کاهش میدهند. انتخاب مواردی که باید حذف شوند اغلب به اندازه مواردی که باید گنجانده شوند، اهمیت دارد.
افسانه
این دو رویکرد در عمل هرگز با هم همپوشانی ندارند.
واقعیت
فیلترینگ مشارکتی در سیستمهای توصیهگر، آنها را به طور صریح ترکیب میکند - ترجیحات کاربران مشابه را برای پیشبینی انتخابهای فردی جمعآوری میکند. روشهای گروهی، مدلهای فردی زیادی را جمعآوری میکنند. مرزها در معماریهای پیشرفته هوش مصنوعی محو میشوند.
افسانه
عدالت در تجمیع به این معنی است که هر کس به خواسته خود برسد.
واقعیت
اتفاق آرا به طرز فزایندهای نادر است، و کارایی پارتو تنها تضمین میکند که هیچکس نمیتواند بدون آسیب رساندن به دیگری بهبود یابد. تجمیع واقعی شامل بازندگان و بدهبستانها میشود؛ انصاف به فرآیند و تناسب مربوط میشود، نه رضایت همگانی.
سوالات متداول
تجمیع ترجیحات به زبان ساده چیست؟
گروهی از دوستان را تصور کنید که سعی دارند یک رستوران انتخاب کنند. هر کس انتخابهای خود را رتبهبندی میکند و شما به نحوی باید این رتبهبندیها را در یک تصمیم ترکیب کنید. تجمیع ترجیحات، مطالعه رسمی چگونگی انجام این کار به صورت منصفانه و مداوم است. این شامل سیستمهای رأیگیری، موتورهای پیشنهاد و هر موقعیتی میشود که در آن انتخاب جمعی اهمیت دارد.
مدلسازی پیشبینی فردی واقعاً چگونه کار میکند؟
این مدلها از دادههای تاریخی در مورد کارهایی که یک شخص انجام داده است - خریدهایی که انجام داده، لینکهایی که کلیک کرده، پرداختهایی که از دست داده است - الگوهایی را یاد میگیرند و به جلو تعمیم میدهند. تکنیکهای رایج شامل رگرسیون لجستیک، جنگلهای تصادفی و شبکههای عصبی است. این مدل مشخص میکند که کدام ویژگیها نتیجه مورد نظر را پیشبینی میکنند، سپس آن روابط آموخته شده را در موقعیتهای جدید اعمال میکند.
چرا قضیه عدم امکان ارو برای هوش مصنوعی مهم است؟
ارو ثابت کرد که هیچ سیستم تجمیع ترجیحات نمیتواند مجموعه کوچکی از شرایط انصاف به ظاهر معقول را به طور همزمان برآورده کند. برای سیستمهای هوش مصنوعی که ترجیحات کاربر را ترکیب میکنند - مانند رتبهبندی نتایج جستجو یا توصیه محتوا - این بدان معناست که بدهبستانهای اساسی اجتنابناپذیر هستند. طراحان باید صریحاً انتخاب کنند که کدام ویژگیهای انصاف را در اولویت قرار دهند.
انصاف تعاریف ریاضی متعددی دارد که اغلب با یکدیگر در تضاد هستند. یک مدل میتواند برابری جمعیتی را برآورده کند، اما ضرایب برابر را نقض کند، یا برعکس. علاوه بر این، انصاف در پیشبینی، انصاف در نتایج را هنگامی که پیشبینیها منجر به تصمیمگیری میشوند، تضمین نمیکند. این چالش هم فنی و هم عمیقاً زمینهای است.
چه چیزی تجمیع ترجیحات را از نظر محاسباتی دشوار میکند؟
برخی از قوانین تجمیع بهینه، مانند یافتن رتبهبندی اجماع کمنی، مستلزم بررسی نمایی بسیاری از ترتیبهای ممکن با افزایش تعداد گزینهها هستند. حتی با الگوریتمهای تقریبی، مقیاسبندی به میلیونها آیتم یا رأیدهنده چالشهای واقعی را ایجاد میکند که روشهای اکتشافی و تصادفی را ترغیب میکند.
سیستمهای توصیهگر چگونه از هر دو رویکرد با هم استفاده میکنند؟
فیلترینگ مشارکتی، ترجیحات کاربران مشابه را جمعآوری میکند تا پیشبینی کند شما چه چیزی را ممکن است دوست داشته باشید. فیلترینگ مبتنی بر محتوا از پیشبینی فردی بر اساس تاریخچه خودتان استفاده میکند. سیستمهای ترکیبی هر دو را با هم ترکیب میکنند و وقتی دادههای شخصی شما پراکنده است، از خرد جمعی و وقتی تاریخچه تعاملات غنی دارید، از الگوهای فردی بهره میبرند.
مشکل شروع سرد در پیشبینی فردی چیست؟
وقتی یک کاربر جدید به یک پلتفرم میپیوندد یا یک محصول جدید عرضه میشود، دادههای تاریخی کافی برای ایجاد پیشبینیهای دقیق وجود ندارد. این پاشنه آشیل پیشبینیهای فردی است. روشهای تجمیع تا حدی این مشکل را با قرض گرفتن اطلاعات از کاربران یا موارد مشابه حل میکنند، به همین دلیل است که رویکردهای ترکیبی در عمل غالب هستند.
آیا تجمیع ترجیحات میتواند افرادی را که ترجیحات را به طور استراتژیک اشتباه گزارش میدهند، مدیریت کند؟
این سوال اصلی طراحی مکانیسم است. برخی سیستمها، مانند حراجهای قیمت دوم، افشای صادقانه را با انگیزه سازگار میکنند. اما بسیاری از سیستمهای رأیگیری قابل دستکاری هستند - رأیدهندگان گاهی اوقات میتوانند با ارائه نادرست ترجیحات به نتایج بهتری دست یابند. طراحی تجمیع مقاوم در برابر استراتژی همچنان یک مرز تحقیقاتی فعال است.
نگرانیهای مربوط به حریم خصوصی چه تفاوتی بین این دو رویکرد دارد؟
مدلهای پیشبینی فردی اغلب به دادههای شخصی جزئی نیاز دارند که نگرانیهایی را در مورد نظارت و رضایت ایجاد میکند. تجمیع ترجیحات گاهی اوقات میتواند با رتبهبندیهای ناشناس کار کند، اگرچه تکنیکهای حریم خصوصی تفاضلی برای هر دو به طور فزایندهای ضروری هستند. جزئیات افشای دادهها به طور قابل توجهی متفاوت است.
قابلیت توضیح چه نقشی در هر رویکرد ایفا میکند؟
روشهای تجمیع با چالشهایی در مورد توضیحپذیری پیرامون چرایی ظهور انتخاب جمعی - اینکه چه کسی بر چه چیزی و چگونه تأثیر گذاشته است - مواجه هستند. پیشبینیهای فردی باید توضیح دهند که چرا یک شخص خاص، بهویژه در حوزههای پرریسک مانند وامدهی و عدالت کیفری، پیشبینی خاصی را دریافت کرده است. هر دو به طور فزایندهای به شفافیت نیاز دارند، اما موضوعات توضیح متفاوت هستند.
آیا در دنیای واقعی، این روشها با شکست مواجه شدهاند که باید از آنها مطلع باشم؟
انتخابات ریاست جمهوری ایالات متحده در سالهای ۲۰۰۰ و ۲۰۱۶ نشان داد که چگونه تجمیع کثرت میتواند برندگانی را به وجود آورد که اکثریت با آنها مخالف هستند. مدلهای پیشبینی فردی در عدالت کیفری، سوگیری نژادی را در پیشبینی تکرار جرم نشان دادهاند. هر دو مورد نشان میدهند که پیچیدگی فنی نمیتواند جایگزین انتخابهای دقیق طراحی مبتنی بر ارزش شود.
چگونه ممکن است این رویکردها با پیشرفت در هوش مصنوعی مولد تکامل یابند؟
مدلهای زبانی بزرگ اکنون میتوانند ترجیحات فردی را برای آزمایشهای تجمیع شبیهسازی کنند و به طور بالقوه طراحی مکانیسم را بهبود بخشند. آنها همچنین پیشبینی فردی پیچیدهتری را از طریق نمایش غنیتر ویژگیها امکانپذیر میکنند. با این حال، خطرات دادههای مصنوعی و قابلیتهای نوظهور که تضمینهای نظری سنتی را مخدوش میکنند، چالشهای جدیدی را برای هر دو الگو ایجاد میکنند.
حکم
وقتی تصمیمات بر گروهها تأثیر میگذارند و مشروعیت مستلزم گنجاندن دیدگاههای متنوع به صورت دموکراتیک است، تجمیع ترجیحات را انتخاب کنید. وقتی مداخلات، محصولات یا خدمات را برای افراد خاص تنظیم میکنید و وقتی پیشبینی رفتاری جزئی، ارزش ایجاد میکند، مدلسازی پیشبینی فردی را انتخاب کنید. بسیاری از سیستمهای دنیای واقعی، از موتورهای توصیه شخصیسازیشده گرفته تا پلتفرمهای بودجهبندی مشارکتی، هر دو رویکرد را به طور متفکرانه ترکیب میکنند.