בינה מלאכותיתלמידת מכונהתיאוריית הבחירה החברתיתמודל חיזויאינטליגנציה קולקטיביתמערכות המלצה
צבירת העדפות לעומת מידול חיזוי אינדיבידואלי
צבירת העדפות משלבת העדפות אינדיבידואליות מרובות להחלטות קולקטיביות, בעוד שמודלים של חיזוי אישי חוזה התנהגות אישית באמצעות למידת מכונה על נתוני משתמש יחיד. שניהם משרתים מטרות שונות במערכות בינה מלאכותית, החל ממנועי המלצה ועד פלטפורמות הצבעה דמוקרטיות.
הדגשים
צבירת העדפות מתמודדת עם משפטי אי-אפשרות בסיסיים שחיזוי אינדיבידואלי נמנע מהם לחלוטין
מודלים של חיזוי אינדיבידואלי מתמודדים עם בעיות ייחודיות של התחלה קרה, ששיטות קולקטיביות עוקפות נתונים משותפים.
חששות ההגינות שונים זה מזה באופן חד: הוגנות קבוצתית פרוצדורלית לעומת שוויון ביחס אישי
שיטות אנסמבל מודרניות מאחדות באופן מעניין את שתי הפרדיגמות על ידי צבירת תחזיות אינדיבידואליות רבות.
מה זה צבירת העדפות?
משלב מספר העדפות אישיות כדי לייצר החלטה או דירוג קולקטיביים.
פרדוקס קונדורסה מדגים כי העדפות הרוב יכולות להסתובב באופן אינטרנזיטיבי, מה שהופך את הצבירה למאתגרת תיאורטית.
משפט חוסר האפשרות של ארו מוכיח שאף שיטת צבירה מושלמת אינה עומדת בכל קריטריוני ההגינות בו זמנית.
ספירת בורדה, הצבעת ריבוי והשוואה זוגית מייצגות פילוסופיות צבירה שונות באופן מהותי.
יישומי בינה מלאכותית מודרניים כוללים סינון שיתופי ושיטות אנסמבל אשר צוברים תחזיות בין מודלים שונים
תכנון מנגנונים בכלכלה משתמש בצבירת העדפות כדי ליצור מערכות תואמות תמריצים לגילוי אמיתי
מה זה מידול חיזוי אינדיבידואלי?
משתמש בלמידת מכונה כדי לחזות את התנהגותו העתידית של אדם יחיד על סמך הנתונים ההיסטוריים שלו.
רגרסיה לוגיסטית והגברת גרדיאנט נותרו בשימוש נרחב לחיזוי ברמת הפרט בתעשייה.
הנדסת תכונות משלבת לעתים קרובות דפוסים זמניים, אותות דמוגרפיים והטמעות הקשריות.
חששות לגבי הוגנות מתעוררים כאשר מודלים מפלים על בסיס תכונות מוגנות כמו גזע או מין
כיול ואבחנה הן תכונות ניבוי נפרדות; מודל יכול להיות מכויל היטב אך לא הוגן.
הנמקה נגדית עוזרת להעריך מה יקרה אם התערבויות ישנו משתנים ספציפיים עבור אותו אדם.
טבלת השוואה
תכונה
צבירת העדפות
מידול חיזוי אינדיבידואלי
מטרה עיקרית
סינתזה של בחירה קולקטיבית מתוך מגוון רחב של קלטים
תחזית פעולותיו העתידיות של אדם אחד
מבנה נתונים
פרופילי העדפה או דירוגים מרובים
עקבות התנהגותיות אורכיות של משתמש יחיד
יסודות תיאורטיים מרכזיים
תיאוריית הבחירה החברתית וכלכלת הרווחה
תורת הלמידה הסטטיסטית והסקה סיבתית
דאגה להגינות
הוגנות הליכית בקרב מצביעים או משתתפים
יחס שוויוני ברמת הפרט ואי-אפליה
פורמט פלט
דירוג קולקטיבי, התפלגות מנצחת או התפלגות הסתברות
אומדן נקודתי, הסתברות או המלצת החלטה
אתגר המדרגיות
סיבוכיות חישובית של צבירה אקספוננציאלית של העדפות רבות
נתונים דלילים והפעלה קרה עבור משתמשים חדשים
יישום אופייני
מערכות המלצה, פלטפורמות הצבעה, בינה מלאכותית אנסמבל
ניקוד אשראי, חיזוי נטישה, רפואה מותאמת אישית
מדד הערכה
יעילות קונדורסה, ציוני בורדה, תפקודי רווחה חברתית
AUC-ROC, שחזור דיוק, שגיאת כיול, ציון ברייר
השוואה מפורטת
מטרה מרכזית ופילוסופיה
צבירת העדפות שואלת באופן בסיסי מה קבוצה רוצה, ומתייחסת להעדפות אינדיבידואליות כקלטים לפונקציית החלטה קולקטיבית. השורשים הפילוסופיים נעוצים ברצון הכללי של רוסו ובחשבון התועלתני של בנת'ם. מודל חיזוי אינדיבידואלי, לעומת זאת, מתייחס לאדם כיחידת ניתוח - מה יעשה הפרט הספציפי הזה הלאה? הראשון מדגיש לגיטימציה דמוקרטית ורווחה חברתית; השני מייעל את הדיוק החיזוי והתערבות מעשית.
יסודות תיאורטיים
תיאוריית הבחירה החברתית מספקת את עמוד השדרה המתמטי לאיסוף העדפות, כאשר תוצאות מכוננות של קונדורסה, בורדה, ארו וסן מעצבות את מה שאנו מאמינים שניתן להשיג. מודלים של ניבוי אינדיבידואלי נשאבים מתורת הלמידה הסטטיסטית, שבה שגיאת ההכללה קשורה לממד ואפניק-צ'רבוננקיס ולסיבוכיות רדמכר. מעניין לציין, ששיטות אנסמבל כמו באגינג ובוסטינג יוצרות גשר: הן צוברות ניבויים מלומדים חלשים רבים, ומשלבות את שתי הפרדיגמות.
הוגנות ואתיקה
הוגנות צבירה עוסקת בשאלה האם התהליך מכבד את המשתתפים באופן שווה - האם כלל ההצבעה מעניק למישהו השפעה לא פרופורציונלית? הוגנות ניבוי אינדיבידואלית שואלת האם אנשים דומים מקבלים תחזיות דומות, שלעתים קרובות מנוסחות באמצעות שוויון דמוגרפי או סיכויים שווים. מושגי הוגנות אלה עלולים להתנגש; שיטת צבירה המשקפת בצורה מושלמת את העדפות הרוב עלולה להוות נחיתות שיטתית של קבוצות מיעוט.
יישום מעשי
פריסת צבירת העדפות בקנה מידה גדול דורשת טיפול בקשיות חישובית: צבירת קמני אופטימלית היא קשה מבחינת NP, ואפילו פתרונות מקורבים דורשים אלגוריתמים מתוחכמים. מודלים של חיזוי בודדים מתמודדים עם מכשולים שונים - הנדסת תכונות עבור נתונים התנהגותיים דלילים, טיפול בסחף מושגים ככל שהעדפות המשתמש מתפתחות, ושמירה על רעננות המודל ללא עלויות אימון מחדש מוגזמות. שניהם דורשים תשומת לב מדוקדקת לתשתית הנתונים, אך אילוצי ההנדסה שונים באופן משמעותי.
מדדי הערכה והצלחה
הערכת איכות הצבירה כרוכה בניתוח אקסיומטי - האם שיטה מספקת עצמאות של חלופות לא רלוונטיות, יעילות פארטו או אי-דיקטטורה? מבחינה אמפירית, פונקציות רווחה חברתית מודדות את מידת התועלת שהקולקטיב משיג. מודלים של חיזוי אינדיבידואליים משתמשים במדדי ביצועים ניבוייים, אך אלה עלולים להטעות: מודל מכויל בצורה מושלמת עדיין עלול להניב החלטות מזיקות אם ייושם מבלי להתחשב בהשלכות הנגדיות של פעולה על סמך תחזיות.
יתרונות וחסרונות
צבירת העדפות
יתרונות
+לגיטימציה דמוקרטית בהחלטות
+עמיד בפני כשלים בנקודה בודדת
+משלב נקודות מבט מגוונות
+מאפייני הוגנות מבוססים תיאורטית
המשך
−אילוצי חוסר האפשרות של ארו
−יקר מבחינה חישובית בקנה מידה גדול
−רגיש למניפולציה אסטרטגית
−עלול לדכא את העדפות המיעוט
מידול חיזוי אינדיבידואלי
יתרונות
+פלטים מותאמים אישית ביותר
+מיקוד התערבות מעשית
+מדרגיות מהירה עם מחשוב ענן
+שיפור מתמיד מלולאות משוב
המשך
−חששות בנוגע לפרטיות ומעקב
−מחזק הטיות היסטוריות
−נתונים דלילים עבור משתמשים חדשים
−אטימות בהחלטות מודל מורכבות
תפיסות מוטעות נפוצות
מיתוס
צבירת העדפות תמיד מייצרת את האפשרות שרוב האנשים מעדיפים.
מציאות
פרדוקס קונדורסה ומשפט ארו מגלים כי העדפות הרוב יכולות להשתנות באופן אינטרנזיטיבי, ואף שיטה לא עומדת בכל קריטריוני ההגינות האינטואיטיביים. מועמד שמנצח את כל האחרים בהתאמות זוגיות עשוי לא להתקיים, מה שכופה פשרות בין תכונות רצויות.
מיתוס
מודלים של חיזוי אינדיבידואליים חוזים מה אנשים יעשו בפועל.
מציאות
מודלים אלה חוזים התנהגות המותנית בדפוסים היסטוריים, ולא בבחירות עתידיות אמיתיות. אנשים משתנים, הקשרים משתנים ותחזיות הופכות למכשולות כאשר הן משמשות באופן התערבותי - ניבוי נטישת עובד ולאחר מכן הצעת תמריצי שימור משנה את התוצאה הצפויה.
מיתוס
שיטות צבירה הן ניטרליות וחופשיות מהטיה.
מציאות
כל כלל צבירה מקודד ערכים לגבי העדפות של מי חשובות וכיצד סכסוכים נפתרים. הצבעה בריבוי יתרונות למיעוטים מרוכזים; ספירת בורדה מתגמלת קבלה רחבה. בחירת השיטה היא מטבעה פוליטית, לא רק טכנית.
מיתוס
יותר נתונים תמיד משפרים תחזיות אישיות.
מציאות
מעבר לנקודה מסוימת, תכונות נוספות מוסיפות רעש, עלות חישובית וסיכון פרטיות. משתנים לא רלוונטיים גורמים להתאמת יתר, ונתונים היסטוריים מנסיבות שהשתנו פוגעים ברלוונטיות המודל. בחירת מה שלא לכלול חשובה לעתים קרובות לא פחות ממה לכלול.
מיתוס
שתי הגישות הללו לעולם לא חופפות בפועל.
מציאות
סינון שיתופי במערכות המלצות משלב אותן במפורש - צובר העדפות של משתמשים דומים כדי לחזות בחירות אינדיבידואליות. שיטות אנסמבל צוברות מודלים אינדיבידואליים רבים. הגבולות מיטשטשים בארכיטקטורות בינה מלאכותית מתוחכמות.
מיתוס
הוגנות מצטברת פירושה שכל אחד מקבל את מה שהוא רוצה.
מציאות
תמימות דעים היא נדירה להחריד, ויעילות פארטו רק מבטיחה שאף אחד לא יוכל להשתפר מבלי לפגוע באחר. צבירה אמיתית כרוכה במפסידים ובפשרות; הוגנות נוגעת לתהליך ולפרופורציה, לא לסיפוק אוניברסלי.
שאלות נפוצות
מהי צבירת העדפות במילים פשוטות?
דמיינו קבוצת חברים שמנסים לבחור מסעדה. כולם מדרגים את הבחירות שלהם, ואיכשהו צריך לשלב את הדירוגים האלה להחלטה אחת. צבירת העדפות היא המחקר הפורמלי של איך לעשות זאת בצורה הוגנת ועקבית. זה משתרע על פני מערכות הצבעה, מנועי המלצה וכל מצב שבו בחירה קולקטיבית חשובה.
כיצד פועלת בפועל מודל חיזוי אינדיבידואלי?
מודלים אלה לומדים דפוסים מנתונים היסטוריים על מה שאדם עשה - רכישות שביצע, קישורים שלחץ עליהם, תשלומים שהחמיץ - ומסיקים אקסטרפולציה קדימה. טכניקות נפוצות כוללות רגרסיה לוגיסטית, יערות אקראיים ורשתות עצביות. המודל מזהה אילו מאפיינים מנבאים את תוצאת העניין, ולאחר מכן מיישם את הקשרים הנלמדים הללו על מצבים חדשים.
מדוע משפט אי-האפשרות של ארו חשוב לבינה מלאכותית?
Arrow הוכיח שאף מערכת צבירת העדפות אינה יכולה לעמוד בו זמנית בקבוצה קטנה של תנאי הוגנות סבירים לכאורה. עבור מערכות בינה מלאכותית המשלבות העדפות משתמש - כמו דירוג תוצאות חיפוש או המלצה על תוכן - פירוש הדבר שפשרות בסיסיות הן בלתי נמנעות. מעצבים חייבים לבחור במפורש אילו מאפייני הוגנות לתעדף.
האם מודלים של חיזוי אינדיבידואלי יכולים אי פעם להיות הוגנים באמת?
להוגנות יש הגדרות מתמטיות מרובות שלעתים קרובות מתנגשות זו עם זו. מודל יכול לעמוד בשוויון דמוגרפי אך להפר את הסיכויים השוויוניים, או להיפך. יתר על כן, הוגנות בניבוי אינה מבטיחה הוגנות בתוצאות כאשר ניבויים מניעים החלטות. האתגר הוא גם טכני וגם קשור להקשר עמוק.
מה מקשה על צבירת העדפות מבחינה חישובית?
חלק מכללי הצבירה האופטימליים, כמו מציאת דירוג הקונצנזוס של קמני, דורשים בחינה אקספוננציאלית של סדרים אפשריים רבים ככל שמספר החלופות גדל. אפילו עם אלגוריתמי קירוב, קנה מידה למיליוני פריטים או מצביעים מציב אתגרים אמיתיים המניעים שיטות היוריסטיות ואקראיות.
כיצד מערכות המלצה משתמשות בשתי הגישות יחד?
סינון שיתופי אוסף העדפות של משתמשים דומים כדי לחזות מה אתם עשויים לאהוב. סינון מבוסס תוכן משתמש בחיזוי אישי על ההיסטוריה שלכם. מערכות היברידיות משלבות את שניהם, וממנפות חוכמה קולקטיבית כאשר הנתונים האישיים שלכם דלילים ודפוסים אישיים כאשר יש לכם היסטוריית אינטראקציה עשירה.
מהי בעיית ההתחלה הקרה בחיזוי אינדיבידואלי?
כאשר משתמש חדש מצטרף לפלטפורמה או מוצר חדש מושק, אין מספיק נתונים היסטוריים כדי לבנות תחזיות מדויקות. זהו עקב אכילס של תחזיות אינדיבידואליות. שיטות צבירה פותרות חלקית זאת על ידי שאילת מידע ממשתמשים או פריטים דומים, ולכן גישות היברידיות שולטות בפועל.
האם צבירת העדפות יכולה להתמודד עם אנשים שמדווחים באופן שגוי על העדפות באופן אסטרטגי?
זוהי השאלה המרכזית של תכנון מנגנון. מערכות מסוימות, כמו מכירות פומביות של מחיר שני, הופכות גילוי אמיתי לתואם תמריצים. אך מערכות הצבעה רבות ניתנות למניפולציה - מצביעים יכולים לפעמים להשיג תוצאות טובות יותר על ידי הצגת העדפות בצורה שגויה. תכנון צבירה חסינת אסטרטגיה נותר חזית מחקר פעילה.
כיצד שונות דאגות הפרטיות בין שתי הגישות הללו?
מודלים של חיזוי אינדיבידואלי דורשים לעתים קרובות נתונים אישיים מפורטים, מה שמעלה חששות בנוגע למעקב והסכמה. צבירת העדפות יכולה לפעמים לעבוד עם דירוגים אנונימיים, אם כי טכניקות פרטיות שונות נחוצות יותר ויותר עבור שניהם. רמת הפירוט של חשיפת הנתונים משתנה באופן משמעותי.
איזה תפקיד ממלאת ההסבר בכל גישה?
שיטות צבירה מתמודדות עם אתגרי הסבר בנוגע לסיבה להתפתחות הבחירה הקולקטיבית - מי השפיע על מה וכיצד. תחזיות אינדיבידואליות חייבות להסביר מדוע אדם מסוים קיבל תחזית מסוימת, במיוחד בתחומים בעלי סיכון גבוה כמו הלוואות ומשפט פלילי. שניהם דורשים יותר ויותר שקיפות, אך מושאי ההסבר שונים.
האם יש כשלים אמיתיים של שיטות אלו שעליי לדעת עליהם?
בחירות הנשיאות בארה"ב בשנים 2000 ו-2016 המחישו כיצד צבירת ריבוי יכולות להניב מנצחים המתנגדים לרוב. מודלים אינדיבידואליים של חיזוי במשפט פלילי הציגו הטיה גזעית בחיזוי החזרה לפשע. שני המקרים מדגישים שתחכום טכני אינו יכול להחליף בחירות עיצוב ערכיות זהירות.
כיצד גישות אלו עשויות להתפתח עם ההתקדמות בבינה מלאכותית גנרטיבית?
מודלים של שפה גדולה יכולים כעת לדמות העדפות אינדיבידואליות עבור ניסויי צבירה, ובכך לשפר באופן פוטנציאלי את תכנון המנגנונים. הם גם מאפשרים חיזוי אינדיבידואלי מתוחכם יותר באמצעות ייצוגים עשירים יותר של תכונות. עם זאת, סיכוני נתונים סינתטיים ויכולות מתפתחות אשר מבלבלות ערבויות תיאורטיות מסורתיות מציבים אתגרים חדשים לשתי הפרדיגמות.
פסק הדין
בחרו בצבירת העדפות כאשר החלטות משפיעות על קבוצות ולגיטימציה דורשת שילוב נקודות מבט מגוונות באופן דמוקרטי. בחרו במודל חיזוי אישי בעת התאמת התערבויות, מוצרים או שירותים לאנשים ספציפיים וכאשר חיזוי התנהגותי מפורט מניב ערך. מערכות רבות בעולם האמיתי, החל ממנועי המלצה מותאמים אישית ועד פלטפורמות תקצוב משתף, משלבות בצורה מושכלת את שתי הגישות.