ARC คืออะไร และทำไมจึงมีความสำคัญ?
ชุดข้อมูลการคิดเชิงนามธรรมและการให้เหตุผล (Abstraction and Reasoning Corpus หรือ ARC) ที่สร้างโดย Francois Chollet เป็นเกณฑ์มาตรฐาน AI เฉพาะทางที่ออกแบบมาเพื่อวัดสติปัญญาทั่วไปโดยเฉพาะ ไม่ใช่ความรู้ที่ท่องจำ ชุดข้อมูลนี้ประกอบด้วยปริศนาตารางภาพที่ต้องการให้ระบบอนุมานกฎนามธรรมจากตัวอย่างเพียงไม่กี่ตัวอย่าง เนื่องจากการออกแบบปริศนาเป็นเอกลักษณ์เฉพาะตัวและไม่สามารถแก้ได้โดยการท่องจำข้อความจากอินเทอร์เน็ต แบบจำลองภาษาที่ทันสมัยซึ่งทำคะแนนได้ดีในการสอบความรู้ทั่วไปแบบดั้งเดิมจึงทำได้แย่มากใน ARC ซึ่งเน้นให้เห็นถึงช่องว่างขนาดใหญ่ระหว่างการเก็บรักษาข้อมูลและการให้เหตุผลที่คล่องแคล่ว
เหตุใดแบบจำลองภาษาขนาดใหญ่จึงประสบปัญหาในการแก้ปัญหาทางคณิตศาสตร์ง่ายๆ?
แบบจำลองภาษาประมวลผลคณิตศาสตร์เป็นโทเค็นข้อความแทนที่จะใช้ตรรกะเชิงตัวเลขจริง หากพวกมันเคยเห็นสมการเฉพาะหรือรูปแบบที่คล้ายกันซ้ำๆ ในข้อมูลการฝึกฝน พวกมันจะแสดงคำตอบที่ถูกต้องจากหน่วยความจำ อย่างไรก็ตาม เมื่อเผชิญกับการคำนวณทางคณิตศาสตร์หลายขั้นตอนที่เกี่ยวข้องกับตัวเลขที่ผิดปกติและยาว รูปแบบที่พวกมันจดจำไว้จะพังทลายลง และเนื่องจากพวกมันขาดกลไกการคำนวณภายในหรือหลักเกณฑ์การให้เหตุผลทั่วไป พวกมันจึงสร้างคำตอบที่ผิดอย่างมั่นใจ
ขนาดของหน้าต่างบริบทมีความสัมพันธ์กับความรู้ที่จดจำไว้อย่างไร?
หน้าต่างบริบทของโมเดลทำหน้าที่เหมือนหน่วยความจำใช้งานระยะสั้น โดยเก็บข้อความที่คุณวางลงในเซสชันแชทโดยตรง ในทางกลับกัน ความรู้ที่จดจำไว้จะถูกฝังลึกอยู่ในน้ำหนักถาวรของโมเดลระหว่างขั้นตอนการฝึกฝน แม้ว่าหน้าต่างบริบทขนาดใหญ่จะช่วยให้โมเดลสามารถวิเคราะห์เอกสารเฉพาะได้ทันที แต่ก็ยังต้องอาศัยกรอบการทำงานภายในที่จดจำไว้เพื่อตีความไวยากรณ์และความหมายของเอกสารเหล่านั้น
เราจะสามารถสร้างปัญญาประดิษฐ์ทั่วไป (AI) ได้โดยการเพิ่มข้อมูลเข้าไปเท่านั้นหรือไม่?
มีการถกเถียงกันอย่างดุเดือดในแวดวงปัญญาประดิษฐ์เกี่ยวกับประเด็นนี้โดยเฉพาะ สมมติฐานเรื่องการขยายขนาดชี้ให้เห็นว่า การขยายข้อมูลและพลังการประมวลผลอย่างต่อเนื่องจะทำให้เกิดปัญญาประดิษฐ์ทั่วไปขึ้นเองตามธรรมชาติจากรูปแบบที่ซับซ้อน อย่างไรก็ตาม นักวิจัยที่มีชื่อเสียงหลายคนโต้แย้งว่า การจดจำแบบใช้กำลังทั้งหมดจะถึงจุดที่ผลตอบแทนลดลง และปัญญาประดิษฐ์ทั่วไปที่แท้จริงนั้นต้องการการเปลี่ยนแปลงพื้นฐานไปสู่สถาปัตยกรรมที่แยกหน่วยความจำเชิงข้อเท็จจริงออกจากการประมวลผลเชิงตรรกะ
ในทางจิตวิทยาของมนุษย์ ความฉลาดเชิงไหลลื่นแตกต่างจากความฉลาดเชิงตกผลึกอย่างไร?
กรอบแนวคิดทางจิตวิทยานี้สอดคล้องกับการถกเถียงเรื่องปัญญาประดิษฐ์อย่างสมบูรณ์แบบ สติปัญญาแบบไหลลื่น (Fluid intelligence) เทียบเท่ากับสติปัญญาทั่วไปในทางชีววิทยา คือความสามารถในการคิดอย่างมีเหตุผลและแก้ปัญหาใหม่ๆ ได้อย่างรวดเร็ว โดยไม่ขึ้นอยู่กับความรู้ที่ได้มา สติปัญญาแบบตกผลึก (Crystallized intelligence) เทียบโดยตรงกับความรู้ที่จดจำไว้ คือการสะสมข้อเท็จจริง คำศัพท์ ทักษะ และประสบการณ์ที่รวบรวมได้ตลอดชีวิต มนุษย์ใช้สติปัญญาแบบตกผลึกในการจัดการชีวิตประจำวัน และเก็บสติปัญญาแบบไหลลื่นไว้สำหรับความท้าทายที่ไม่เหมือนใคร
ตัวแทนการเรียนรู้แบบเสริมแรงแสดงให้เห็นถึงความฉลาดทั่วไปได้อย่างไร?
เอージェนต์การเรียนรู้แบบเสริมแรงสามารถแสดงให้เห็นถึงประกายแห่งสติปัญญาโดยทั่วไปเมื่อได้รับการฝึกฝนในสภาพแวดล้อมที่มีพลวัตสูง แทนที่จะจดจำเส้นทางหรือสถานการณ์ที่ตายตัว พวกมันจะได้รับรางวัลสำหรับการเชี่ยวชาญกลยุทธ์เชิงนามธรรม หากเอージェนต์ถูกวางไว้ในระดับเกมใหม่ทั้งหมดที่มีฟิสิกส์เหมือนเดิม แต่มีเค้าโครงที่เปลี่ยนแปลงไปอย่างสิ้นเชิง และยังคงสามารถนำทางไปยังเป้าหมายได้อย่างมีประสิทธิภาพ นั่นพิสูจน์ได้ว่ามันได้เรียนรู้กฎทั่วไปของระบบแล้ว แทนที่จะจดจำเพียงแค่เส้นทางเฉพาะ
เหตุใดระบบที่อาศัยความรู้จากการท่องจำเพียงอย่างเดียวจึงเปราะบางนัก?
ระบบดังกล่าวเปราะบางเพราะมันพึ่งพาการที่อดีตเลียนแบบอนาคตอย่างสิ้นเชิง มันทำงานบนสมมติฐานของโลกปิด โดยเชื่อมโยงข้อมูลป้อนเข้ากับเครือข่ายความสัมพันธ์ทางประวัติศาสตร์ที่ตายตัว ทันทีที่โลกแห่งความเป็นจริงนำเสนอตัวแปรใหม่ การเปลี่ยนแปลงทางการเมือง หรือการเปลี่ยนแปลงโครงสร้างที่ไม่เคยเกิดขึ้นมาก่อน การเชื่อมโยงทางสถิติก็จะพังทลายลงอย่างสิ้นเชิง ทำให้ระบบเกิดข้อผิดพลาดอย่างมั่นใจ เพราะมันขาดสามัญสำนึกที่จะชี้ให้เห็นความผิดปกติ
การออกแบบคำถามกระตุ้นความคิดสามารถเปลี่ยนระบบการจดจำให้เป็นระบบการใช้เหตุผลได้หรือไม่?
เทคนิคทางวิศวกรรมที่รวดเร็ว เช่น การกระตุ้นความคิดตามลำดับ สามารถช่วยเพิ่มประสิทธิภาพได้ แต่ไม่ได้เปลี่ยนแปลงโครงสร้างพื้นฐานอย่างแท้จริง การสั่งให้โมเดลอธิบายขั้นตอนต่างๆ ออกมาดังๆ จะบังคับให้มันสร้างโทเค็นระดับกลางที่ทำหน้าที่เป็นขั้นบันไดเชิงตรรกะ ซึ่งจะช่วยให้กลไกทางสถิติหาคำตอบที่แม่นยำยิ่งขึ้น แต่ก็ยังคงเป็นการเรียงลำดับรูปแบบที่จดจำไว้ตามลำดับ แทนที่จะใช้กลไกการให้เหตุผลที่เป็นอิสระ