การย้อนกลับการแพร่กระจาย (Backpropagation) คืออะไร และทำไมสมองของมนุษย์จึงไม่ใช้กระบวนการนี้?
การย้อนกลับการแพร่กระจาย (Backpropagation) เป็นเทคนิคทางคณิตศาสตร์ที่ AI ใช้ในการคำนวณค่าความผิดพลาดที่แน่นอนของแต่ละการเชื่อมต่อทั่วทั้งเครือข่าย และทำการอัปเดตในลำดับย้อนกลับ สมองของมนุษย์อาจไม่ได้ใช้เทคนิคนี้ เนื่องจากเส้นทางชีวภาพมีทิศทางเดียว หมายความว่าสัญญาณไม่สามารถเดินทางย้อนกลับผ่านเซลล์ประสาทในลักษณะที่เป็นระบบเพื่อกระจายการแก้ไขทางคณิตศาสตร์ที่แม่นยำได้
การนอนหลับช่วยส่งเสริมการเรียนรู้ของมนุษย์ได้แตกต่างจากการปรับปรุงประสิทธิภาพของเครื่องจักรอย่างไร?
ในระหว่างการนอนหลับ สมองของมนุษย์จะทบทวนประสบการณ์ในแต่ละวัน โดยถ่ายโอนความทรงจำระยะสั้นที่ไม่มั่นคงจากฮิปโปแคมปัสไปยังนีโอคอร์เทกซ์ซึ่งเป็นส่วนรับรู้ความทรงจำระยะยาว พร้อมทั้งตัดการเชื่อมต่อที่อ่อนแอออกไป แต่โครงข่ายประสาทเทียมไม่มีวงจรการนอนหลับ แต่จะป้องกันการเสื่อมสภาพของข้อมูลโดยการสลับชุดข้อมูลฝึกฝน หรือใช้สมการปรับค่าเพื่อทำให้พารามิเตอร์ทางคณิตศาสตร์มีเสถียรภาพ
เหตุใดโครงข่ายประสาทเทียมจึงต้องการข้อมูลมากกว่ามนุษย์มากนัก?
มนุษย์มีโครงสร้างพื้นฐานทางวิวัฒนาการ ระบบประสาทสัมผัส และความเข้าใจโดยพื้นฐานเกี่ยวกับฟิสิกส์ อวกาศ และเวลา ก่อนที่จะเริ่มเรียนรู้ภารกิจเฉพาะใดๆ ในขณะที่โครงข่ายประสาทเทียมโดยทั่วไปเริ่มต้นการฝึกฝนจากกระดานเปล่าที่ประกอบด้วยตัวเลขสุ่ม ซึ่งหมายความว่ามันต้องเรียนรู้กฎพื้นฐานของโครงสร้างทุกอย่างตั้งแต่เริ่มต้น
เครื่องจักรสามารถสัมผัสประสบการณ์ที่คล้ายคลึงกับสัญชาตญาณของมนุษย์ในระหว่างการฝึกฝนได้หรือไม่?
สิ่งที่ดูเหมือนสัญชาตญาณในเครื่องจักรนั้น แท้จริงแล้วคือการจับคู่รูปแบบที่มีมิติสูง เมื่อโมเดลอย่าง AlphaGo ทำการเคลื่อนไหวที่ยอดเยี่ยมและไม่คาดคิด มันไม่ได้ทำตามความรู้สึก แต่เป็นการคำนวณที่กำหนดว่าเส้นทางเฉพาะนั้นมีโอกาสประสบความสำเร็จสูงสุดทางสถิติ โดยอิงจากประวัติการฝึกฝนจำนวนมหาศาลของมัน
การลืมแบบร้ายแรงคืออะไร และนักพัฒนาพยายามแก้ไขปัญหานี้อย่างไร?
การลืมอย่างหายนะเกิดขึ้นเมื่อโครงข่ายประสาทเทียมได้รับการฝึกฝนด้วยงานใหม่และเขียนทับค่าน้ำหนักเชิงตัวเลขที่ใช้สำหรับงานก่อนหน้าอย่างสมบูรณ์ เพื่อแก้ไขปัญหานี้ นักพัฒนาใช้เทคนิคต่างๆ เช่น การเล่นซ้ำประสบการณ์ (experience replay) ซึ่งผสมข้อมูลเก่ากลับเข้าไปในรอบการฝึกฝนใหม่ หรือสถาปัตยกรรมแบบมีตัวควบคุม (regularized architectures) ที่ล็อกพารามิเตอร์ที่สำคัญไว้
การเรียนรู้โดยใช้รางวัลในมนุษย์แตกต่างจากการเรียนรู้แบบเสริมแรงในปัญญาประดิษฐ์อย่างไร?
กระบวนการทั้งสองมีรากฐานทางแนวคิดร่วมกัน สมองของมนุษย์ใช้การหลั่งสารโดปามีนเพื่อให้รางวัลแก่พฤติกรรมที่นำไปสู่ความปลอดภัย อาหาร หรือความสำเร็จทางสังคม การเรียนรู้แบบเสริมแรงใน AI เลียนแบบสิ่งนี้โดยการกำหนดคะแนนตัวเลขให้กับตัวแทนเมื่อบรรลุเป้าหมายที่กำหนดไว้ บังคับให้อัลกอริทึมเพิ่มคะแนนนั้นให้สูงสุดเมื่อเวลาผ่านไปผ่านการลองผิดลองถูก
เหตุใดจึงเป็นเรื่องยากสำหรับแบบจำลองที่ได้รับการฝึกฝนมาแล้วในการนำความรู้ไปประยุกต์ใช้ในสาขาอื่น?
ข้อจำกัดนี้เรียกว่าคอขวดของการเรียนรู้แบบถ่ายโอน (transfer learning bottleneck) เนื่องจากแบบจำลองเทียมเรียนรู้เฉพาะความสัมพันธ์ทางคณิตศาสตร์ที่แคบๆ ที่มีอยู่ในชุดข้อมูลฝึกฝนเฉพาะของมันเท่านั้น จึงขาดความเข้าใจเชิงแนวคิดเกี่ยวกับโลกที่กว้างขึ้น ทำให้แบบจำลองล้มเหลวเมื่อรูปแบบโครงสร้างเหล่านั้นเปลี่ยนแปลงไปแม้เพียงเล็กน้อย
คุณสามารถฝึกโครงข่ายประสาทเทียมโดยไม่ต้องติดป้ายกำกับข้อมูลทั้งหมดอย่างชัดเจนได้หรือไม่?
ใช่แล้ว วิธีการนี้เรียกว่าการเรียนรู้แบบกำกับตนเอง หรือการเรียนรู้แบบไม่กำกับ แทนที่จะใช้ป้ายกำกับจากมนุษย์ ระบบจะเรียนรู้โดยการซ่อนบางส่วนของข้อมูลจากตัวมันเอง เช่น การลบคำบางคำในประโยค หรือการเบลอส่วนต่างๆ ของภาพ และฝึกฝนน้ำหนักของระบบโดยพยายามทำนายส่วนที่หายไปเหล่านั้นให้ถูกต้อง