ปัญญาประดิษฐ์สามารถพัฒนาอคติเชิงอัลกอริทึมได้หรือไม่ หากมนุษย์ไม่ได้ตั้งโปรแกรมมันอย่างชัดเจน?
ใช่แล้ว เหตุการณ์นี้เกิดขึ้นบ่อยครั้งในระหว่างกระบวนการปรับปรุงประสิทธิภาพด้วยตนเองของเครือข่ายประสาทเทียมที่ซับซ้อน ระบบถูกตั้งโปรแกรมให้ค้นหาเส้นทางทางคณิตศาสตร์ที่มีประสิทธิภาพที่สุดเพื่อเพิ่มความแม่นยำสูงสุด ในการทำเช่นนั้น ระบบอาจค้นพบและใช้ประโยชน์จากทางลัดหรือความสัมพันธ์ที่ไม่ตั้งใจในคุณลักษณะต่างๆ ซึ่งเป็นการสร้างเส้นทางการตัดสินใจที่ไม่เป็นธรรมด้วยตนเองโดยปราศจากคำสั่งจากมนุษย์อย่างชัดเจน
ความไม่เท่าเทียมกันทางประวัติศาสตร์ส่งผลให้เกิดอคติทางข้อมูลสำหรับอัลกอริทึมสมัยใหม่ได้อย่างไร?
เมื่อแบบจำลองการเรียนรู้ของเครื่องได้รับการฝึกฝนด้วยข้อมูลในอดีต พวกมันจะซึมซับความไม่เท่าเทียมกันเชิงระบบของยุคสมัยที่ข้อมูลนั้นถูกบันทึกไว้ ตัวอย่างเช่น หากบริษัทแห่งหนึ่งเคยกีดกันผู้หญิงจากตำแหน่งผู้บริหารในอดีต เครื่องมือการสรรหาบุคลากรที่ได้รับการฝึกฝนด้วยประวัติการทำงานในอดีตเหล่านั้นจะเรียนรู้ว่าผู้สมัครชายมีโอกาสได้รับการคัดเลือกมากกว่าในทางสถิติ ระบบจะถือว่าการเลือกปฏิบัติในอดีตเป็นแม่แบบที่เป็นกลางสำหรับความสำเร็จในอนาคต
เหตุใดนักพัฒนาจึงจงใจใส่ค่าความคลาดเคลื่อนพื้นฐานเข้าไปในแบบจำลอง?
วิศวกรจะใช้รูปแบบการควบคุมทางคณิตศาสตร์ ซึ่งมักเรียกว่า การปรับค่า (regularisation) เพื่อป้องกันไม่ให้ระบบปรับตัวเข้ากับข้อมูลการฝึกฝนมากเกินไป หากไม่มีข้อจำกัดนี้ โมเดลอาจจดจำตัวอย่างการฝึกฝนได้อย่างสมบูรณ์แบบ แต่จะล้มเหลวโดยสิ้นเชิงเมื่อเผชิญกับสถานการณ์ใหม่ๆ ในโลกแห่งความเป็นจริง นี่คือการแลกเปลี่ยนที่คำนวณมาอย่างดีเพื่อเพิ่มความยืดหยุ่นโดยรวมของระบบ
ความแตกต่างระหว่างอคติจากการสุ่มตัวอย่างและอคติจากการวัดคืออะไร?
ปัญหาการสุ่มตัวอย่างเกิดขึ้นเมื่อกลุ่มบางกลุ่มถูกละเลยไปโดยสิ้นเชิงหรือมีจำนวนมากเกินไปในขั้นตอนการเก็บรวบรวมข้อมูลเบื้องต้น ซึ่งหมายความว่าชุดข้อมูลไม่สะท้อนประชากรที่แท้จริง ปัญหาการวัดเกิดขึ้นเมื่อเครื่องมือหรือวิธีการเก็บรวบรวมข้อมูลเองมีข้อบกพร่องหรือไม่สอดคล้องกัน ตัวอย่างเช่น การใช้กล้องดิจิทัลคุณภาพสูงในพื้นที่ร่ำรวยและกล้องความละเอียดต่ำในย่านที่ยากจนกว่าจะทำให้เกิดความคลาดเคลื่อนในการวัด
การสร้างข้อมูลสังเคราะห์สามารถแก้ไขชุดข้อมูลฝึกฝนที่มีความไม่สมดุลอย่างมากได้หรือไม่?
การสร้างข้อมูลสังเคราะห์สามารถช่วยสร้างความสมดุลให้กับกลุ่มที่ถูกมองข้ามได้ โดยการสร้างตัวอย่างเทียมที่เลียนแบบลักษณะของกลุ่มชนกลุ่มน้อย อย่างไรก็ตาม นักพัฒนาต้องใช้ความระมัดระวัง เนื่องจากเทคนิคนี้มีความเสี่ยง หากข้อมูลเริ่มต้นมีอคติแฝงอยู่ กระบวนการสร้างข้อมูลอัตโนมัติอาจขยายข้อบกพร่องเหล่านั้นโดยไม่ตั้งใจ ส่งผลให้ได้ฐานข้อมูลการฝึกอบรมที่ใหญ่ขึ้นแต่ก็มีข้อบกพร่องเช่นกัน
ทีมพัฒนาสามารถใช้เครื่องมือใดบ้างในการทดสอบหาความผิดปกติเชิงระบบเหล่านี้?
วิศวกรใช้ชุดเครื่องมือโอเพนซอร์สที่มีชื่อเสียงหลายชุดในการตรวจสอบระบบของตน เช่น เครื่องมือ What-If Tool ของ Google, AI Fairness 360 ของ IBM และ Fairlearn ของ Microsoft เฟรมเวิร์กเหล่านี้มีตัวชี้วัดเฉพาะเพื่อประเมินความยุติธรรมในกลุ่มต่างๆ ช่วยให้ทีมระบุได้ว่าความไม่เท่าเทียมกันนั้นเกิดจากความไม่สมดุลของชุดข้อมูลพื้นฐานหรือกลไกอัลกอริทึมภายใน
ตัวแปรแทนช่วยให้ระบบหลีกเลี่ยงข้อจำกัดด้านประชากรศาสตร์ได้อย่างไร?
แม้ว่าคุณลักษณะที่ละเอียดอ่อน เช่น เชื้อชาติหรือเพศ จะถูกลบออกจากชุดข้อมูลไปโดยสิ้นเชิงแล้ว แต่ข้อมูลอื่นๆ ที่ดูเหมือนไม่มีอันตรายใดๆ ก็ยังคงเชื่อมโยงกับคุณลักษณะเหล่านั้นอยู่ ปัจจัยต่างๆ เช่น ที่ตั้งทางภูมิศาสตร์ พฤติกรรมการซื้อของ หรือความชอบทางวัฒนธรรม มักถูกใช้เป็นตัวแทน เครือข่ายประสาทเทียมที่ซับซ้อนสามารถเชื่อมโยงจุดเหล่านี้ได้อย่างง่ายดาย ทำให้สามารถทำนายลักษณะทางประชากรที่ซ่อนอยู่และรักษาผลลัพธ์ที่บิดเบือนเอาไว้ได้
ความคลาดเคลื่อนประเภทใดที่ทีมวิศวกรรมแก้ไขได้ยากกว่ากัน?
โดยทั่วไปแล้ว ความผิดพลาดเชิงอัลกอริทึมนั้นแก้ไขได้ยากกว่า เนื่องจากฝังลึกอยู่ในสมการทางคณิตศาสตร์ที่ซับซ้อนของซอฟต์แวร์ ในขณะที่ปัญหาเกี่ยวกับชุดข้อมูลมักจะแก้ไขได้ด้วยการรวบรวมข้อมูลที่ดีขึ้น การแก้ไขปัญหาเชิงโครงสร้างนั้นต้องอาศัยการแทรกแซงทางเทคนิคอย่างลึกซึ้ง วิศวกรต้องเขียนฟังก์ชันการเพิ่มประสิทธิภาพหลักใหม่ หรือออกแบบสถาปัตยกรรมเครือข่ายประสาทเทียมทั้งหมดใหม่ เพื่อเปลี่ยนแปลงวิธีการประมวลผลข้อมูลอย่างพื้นฐาน