เมื่อผู้ด้อยกว่าเอาชนะแชมป์ ระบบการให้คะแนนทักษะจะถือว่าผลลัพธ์นั้นเป็นเรื่องน่าประหลาดใจทางสถิติ โดยปรับคะแนนทั้งสองเพื่อสะท้อนความเป็นจริงของการแข่งขัน ระบบการเรียนรู้ความชอบต้องเผชิญกับภูมิทัศน์ทางจิตวิทยาที่ซับซ้อนกว่า ซึ่งการเลือกของมนุษย์มักขัดแย้งกับตรรกะทางคณิตศาสตร์อย่างเคร่งครัดเนื่องจากบริบทหรือกรอบความคิด ระบบเหล่านี้ใช้แบบจำลองความน่าจะเป็นเพื่ออธิบายข้อเท็จจริงที่ว่าบุคคลอาจชอบตัวเลือก A มากกว่า B และ B มากกว่า C แต่กลับเลือก C เมื่อเปรียบเทียบกับ A โดยตรง
การขยายขนาดโครงสร้างพื้นฐานและภาระการคำนวณ
การอัปเดตเมทริกซ์ทักษะใช้ทรัพยากรการคำนวณน้อย โดยต้องการการอัปเดตทางคณิตศาสตร์เพียงเล็กน้อยกับค่าตัวเลขเพียงค่าเดียวทันทีหลังจากจบการแข่งขันหรือช่วงเวลาทัวร์นาเมนต์ การเรียนรู้ความชอบนั้นมีความซับซ้อนมากกว่ามาก มักต้องใช้ขั้นตอนการฝึกเครือข่ายประสาทเทียมอย่างหนักเพื่ออัปเดตพื้นผิวรางวัลในพารามิเตอร์หลายพันล้านตัว ทำให้การติดตามทักษะเหมาะสำหรับการจับคู่แบบเรียลไทม์ในส่วนแบ็กเอนด์ ในขณะที่การประมวลผลความชอบทำหน้าที่เป็นกลไกหลังการฝึกอบรมที่แข็งแกร่งสำหรับการจัดเรียง AI ที่สร้างขึ้น