این تحلیل جامع، مکانیک آموزش شبکه عصبی مصنوعی را با رشد شناختی انسان مقایسه میکند. در حالی که یادگیری عمیق برای یافتن الگوهای آماری به پسانتشار، مجموعه دادههای عظیم و میلیاردها تنظیم تکراری متکی است، یادگیری انسان از انعطافپذیری سیناپسی بسیار کارآمد و کمداده که توسط زمینه، تجربه فیزیکی و انتزاع مفهومی هدایت میشود، بهره میبرد.
برجستهها
شبکههای مصنوعی به میلیونها تکرار ریاضی نیاز دارند، در حالی که انسانها به انتزاع زمینهای متکی هستند.
پسانتشار نیاز به هماهنگی سراسری دارد، در حالی که مغزهای بیولوژیکی از طریق بهروزرسانیهای سیناپسی موضعی سازگار میشوند.
مدلهای هوش مصنوعی با فراموشی فاجعهبار دست و پنجه نرم میکنند، مشکلی که انسانها از طریق خواب و تثبیت اطلاعات از آن عبور میکنند.
سیستمهای بیولوژیکی با کسری از انرژی مورد نیاز خوشههای محاسباتی با کارایی بالا کار میکنند.
آموزش شبکه عصبی چیست؟
بهینهسازی ریاضی وزنهای مصنوعی با استفاده از گرادیان نزولی و مجموعه دادههای عظیم برای به حداقل رساندن یک تابع خطا.
در درجه اول به انتشار معکوس برای توزیع سیگنالهای خطا در لایهها متکی است.
برای تسلط بر وظایف سادهی طبقهبندی، به هزاران تا میلیونها مثال واضح نیاز دارد.
وقتی بدون آموزش مجدد با وظایف جدید و نامرتبط مواجه میشود، دچار فراموشی فاجعهبار میشود.
در طول مرحله استنتاج استاندارد، از طریق معماریهای ثابت و ایستا عمل میکند.
برای دستیابی به دقت سطح بالا، انرژی الکتریکی و محاسباتی قابل توجهی مصرف میکند.
فرآیندهای یادگیری انسان چیست؟
سازگاری بیولوژیکی مسیرهای عصبی ناشی از تجربه حسی، کنجکاوی و مفهومسازی زمینهای.
از انعطافپذیری سیناپسی استفاده میکند و به مغز اجازه میدهد تا خود را به طور مداوم و در لحظه بازسازی کند.
قادر به یادگیری بدون مقدمه یا یک مرحلهای، و تسلط بر مفاهیم جدید از یک مواجهه.
چارچوبهای دانش تاریخی را به راحتی حفظ میکند و در عین حال مهارتهای کاملاً جدید را ادغام میکند.
ورودیهای حسی چندوجهی را به طور طبیعی ادغام میکند و بینایی، شنوایی، لامسه و زمینه را با هم ترکیب میکند.
با یک بودجه بیولوژیکی فوقالعاده کارآمد تقریباً 20 وات برق کار میکند.
جدول مقایسه
ویژگی
آموزش شبکه عصبی
فرآیندهای یادگیری انسان
مکانیسم اولیه
نزول گرادیان ریاضی و پس انتشار
انعطافپذیری سیناپسی زیستی و مدولاسیون انتقالدهندههای عصبی
کارایی داده
بسیار کم؛ نیاز به مجموعه دادههای محاسباتی عظیم دارد
بسیار بالا؛ قوانین را از چند مثال خلاصه میکند
مصرف انرژی
مگاوات برای آموزش خوشهای در مقیاس بزرگ
تقریباً 20 وات توان متابولیکی مداوم
یادگیری مداوم
ضعیف؛ مستعد فراموش کردن کامل وظایف قبلی
عالی؛ مهارتهای جدید را روی چارچوبهای قدیمی قرار میدهد
جهت یادگیری
کاملاً هدفمند از طریق کمینهسازی تابع زیان
کاوشگر، خودمحور و آگاه از زمینه
تقسیمبندی سختافزار-نرمافزار
جدایی مشخص بین تراشههای سیلیکونی کد و فیزیکی
جداییناپذیر؛ معماری فیزیکی، نرمافزار است
مقایسه دقیق
مکانیسم سازگاری
شبکههای مصنوعی با تنظیم وزنهای عددی در یک ماتریس صلب یاد میگیرند. در طول پسانتشار، یک الگوریتم مرکزی خطای دقیق یک خروجی را محاسبه میکند و اصلاحات مبتنی بر حساب دیفرانسیل و انتگرال را به عقب از طریق سیستم منتقل میکند. در مقابل، مغز انسان از انعطافپذیری سیناپسی موضعی استفاده میکند. مسیرهای فیزیکی بر اساس زمانبندی جهشهای سلولی تقویت یا تضعیف میشوند و به سیستم بیولوژیکی اجازه میدهند بدون یک الگوریتم اصلی جهانی که تنظیمات را مدیریت میکند، به صورت ارگانیک سازگار شود.
کارایی داده و محاسبات
برای تشخیص یک دوچرخه، یک شبکه مصنوعی باید هزاران تصویر متنوع شامل زوایا، نور و پسزمینههای متنوع را پردازش کند تا مرزهای آماری را ترسیم کند. یک کودک انسان معمولاً فقط یک یا دو بار نیاز دارد که یک دوچرخه را ببیند. شناخت انسان از چارچوبهای ذهنی موجود، فیزیک شهودی و قیاسهای ساختاری بهره میبرد، در حالی که یک شبکه مصنوعی اساساً هر بار که یک معماری جدید راهاندازی میشود، از یک صفحه خالی از نویز تصادفی شروع میکند.
تعمیم و یادگیری انتقالی
سیستمهای مصنوعی خارج از توزیعهای آموزشی محدود خود، به شدت شکننده هستند. مدلی که برای انجام استادانه یک بازی ویدیویی خاص آموزش دیده است، اگر رنگ پسزمینه کمی تغییر کند، کاملاً شکست خواهد خورد، مگر اینکه تحت تنظیم دقیق هدفمند قرار گیرد. انسانها در یادگیری انتقالی برتری دارند و مفاهیم انتزاعی تعادل، تکانه و استراتژی آموخته شده در یک حوزه را به طور یکپارچه در سناریوهای کاملاً ناآشنا به کار میبرند.
حفظ حافظه و سازگاری
وقتی یک شبکه عصبی مصنوعی مجبور به یادگیری یک کار کاملاً جدید میشود، بهروزرسانیهای گرادیان جدید اغلب وزنهای عددی تعیینشده برای کارهای قبلی را بازنویسی میکنند و باعث فراموشی فاجعهبار میشوند. مغز انسان یادگیری مادامالعمر را به زیبایی مدیریت میکند. ما میخوابیم تا تجربیات روزانه را در ساختارهای بلندمدت تثبیت کنیم و اطمینان حاصل کنیم که یادگیری نحوه رانندگی، توانایی ما در نوشتن، صحبت کردن یا تشخیص چهرههای آشنا را کاهش نمیدهد.
مزایا و معایب
آموزش شبکه عصبی
مزایا
+میلیونها ورودی موازی را پردازش میکند
+ثبات ریاضی بیعیب و نقص
+به راحتی قابل کپی و مقیاس بندی است
+الگوهای فرابعدی را شناسایی میکند
مصرف شده
−الزامات دادههای حجیم
−مصرف انرژی بالا
−مستعد فراموشی فاجعهبار
−فاقد عقل سلیم ذاتی است
فرآیندهای یادگیری انسان
مزایا
+بهرهوری باورنکردنی از دادهها
+تعمیم انتزاعی استادانه
+ادغام حافظه مادام العمر
+نیاز به توان بسیار کم
مصرف شده
−مصرف آهسته و متوالی
−مستعد خستگی شناختی
−نمیتوان دانش را فوراً کپی کرد
−سوگیری بر اساس حالات عاطفی
تصورات نادرست رایج
افسانه
شبکههای عصبی مصنوعی دقیقاً مانند مغز بیولوژیکی انسان عمل میکنند.
واقعیت
اصطلاح شبکه عصبی تا حد زیادی یک استعاره است. در حالی که طرحهای اولیه تا حدودی از زیستشناسی الهام گرفته شده بودند، یادگیری عمیق مدرن به حساب دیفرانسیل و انتگرال ماتریسی سفت و سخت و الگوریتمهای بهینهسازی سراسری متکی است که هیچ شباهتی به مکانیک نامرتب، شیمیایی و ناهمزمان بافت زنده مغز ندارند.
افسانه
مدلهای یادگیری عمیق پس از آموزش، نوعی درک شبیه به انسان دارند.
واقعیت
مدلهای هوش مصنوعی در ترسیم همبستگیهای آماری بین ورودیها و خروجیها عالی هستند، اما کاملاً فاقد درک معنایی هستند. یک مدل میتواند توصیفات بیعیب و نقصی از آب بدون هیچ مفهومی از رطوبت، تشنگی یا وجود فیزیکی ارائه دهد.
افسانه
مغز انسان درست مانند بانک حافظه کامپیوتر، ظرفیت ذخیرهسازی ثابتی دارد.
واقعیت
حافظه انسان مانند یک هارد دیسک دیجیتال که با گیگابایتها داده پر میشود، کار نمیکند. حافظه بیولوژیکی سازنده و تداعیگر است؛ یادگیری مفاهیم جدید در واقع قلابهای بیشتری ایجاد میکند که میتوانند کسب اطلاعات آینده را آسانتر کنند، نه اینکه با کمبود فضای فیزیکی مواجه شوند.
افسانه
افزایش اندازه یک شبکه هوش مصنوعی به طور خودکار به آن استدلال در سطح انسانی میدهد.
واقعیت
افزایش پارامترها، تطبیق الگو را بهبود میبخشد و تقلید بسیار پیچیدهای ایجاد میکند، اما محدودیتهای معماری بنیادی را برطرف نمیکند. صرف اندازه، انگیزه درونی، تجسم فیزیکی یا توانایی استدلال عادی در مورد جهان را برای هوش مصنوعی فراهم نمیکند.
سوالات متداول
پسانتشار دقیقاً چیست و آیا مغز انسان از آن استفاده میکند؟
پسانتشار یک تکنیک ریاضی است که برای محاسبه گرادیان یک تابع خطا نسبت به وزنهای یک شبکه عصبی استفاده میشود. این تکنیک سیگنالهای خطا را از طریق لایههای مدل به عقب میفرستد تا اتصالات را تنظیم کند. هیچ مدرک قطعی وجود ندارد که مغز انسان از پسانتشار استفاده کند. نورونهای بیولوژیکی از طریق سیگنالهای الکتریکی رو به جلو و سیگنالهای شیمیایی در سراسر سیناپسها ارتباط برقرار میکنند و به جای دریافت اصلاحات ریاضی جهانی از یک الگوریتم متمرکز، به صورت محلی از طریق الگوهای زمانی تنظیم میشوند.
چرا کامپیوترها برای یادگیری آنچه یک کودک از یک مثال یاد میگیرد، به میلیونها مثال نیاز دارند؟
کودکی با معماری بیولوژیکی تکاملیافتهای متولد میشود که طی میلیونها سال برای بقا در یک جهان فیزیکی بهینه شده است. کودکان درک ذاتی از فیزیک شهودی، پایداری شیء و علت و معلول دارند. وقتی کودکی برای اولین بار حیوانی را میبیند، آن تصویر را به یک چارچوب عظیم و از پیش موجود متصل میکند. مدلهای مصنوعی آموزش خود را به عنوان یک لوح خالی با اعداد تصادفی آغاز میکنند، به این معنی که آنها باید مفاهیم اساسی خطوط، هندسه، روشنایی و حضور را کاملاً از ابتدا استنباط کنند.
آیا یک شبکه عصبی مصنوعی میتواند در طول آموزش کنجکاوی را تجربه کند؟
شبکههای عصبی استاندارد احساسات یا کنجکاوی را تجربه نمیکنند. با این حال، دانشمندان کامپیوتر میتوانند پویایی شناخته شده به عنوان کنجکاوی ذاتی را در عاملهای یادگیری تقویتی شبیهسازی کنند. این امر با اضافه کردن یک پاداش ریاضی به تابع زیان هر زمان که عامل با حالتهای کاملاً جدید یا دادههای غیرقابل پیشبینی مواجه میشود، حاصل میشود. اگرچه این امر کاوش را تشویق میکند و رفتار کنجکاوانه را تقلید میکند، اما همچنان یک بهینهسازی ریاضی محاسبه شده است و نه یک محرک احساسی یا روانی.
فراموشی فاجعهبار چیست و چرا انسانها از آن رنج نمیبرند؟
فراموشی فاجعهبار زمانی رخ میدهد که یک شبکه مصنوعی برای یک کار جدید آموزش داده میشود و بهروزرسانیهای ریاضی حاصل، پیکربندیهای وزنی آموختهشده در طول کارهای قبلی را بازنویسی میکنند و مهارت قدیمی را بیفایده میکنند. انسانها از این امر اجتناب میکنند زیرا مغز ما از ترکیبی پیچیده از سیستمهای یادگیری مکمل استفاده میکند. هیپوکامپ به سرعت تجربیات روزانه جدید را ثبت میکند، در حالی که نئوکورتکس به آرامی آن اطلاعات را در طول خواب در چارچوبهای پایدار و بلندمدت ادغام میکند و از دانش بنیادی در برابر اختلال ناگهانی محافظت میکند.
بهرهوری انرژی آموزش هوش مصنوعی در مقایسه با مغز انسان چگونه است؟
تفاوت در بهرهوری انرژی بسیار زیاد است. آموزش یک مدل یادگیری عمیق پیشرو، نیازمند مراکز دادهای به اندازه انبار است که مگاوات برق مصرف میکنند و اغلب به اندازهای برق مصرف میکنند که برای تأمین برق هزاران خانه برای هفتهها کافی است. مغز انسان همزمان سنتز زبانهای پیچیده، هماهنگی فیزیکی، پردازش حسی و استدلال انتزاعی را مدیریت میکند، در حالی که تنها با 20 وات انرژی بیولوژیکی کار میکند که کاملاً توسط کالری دریافتی اولیه تأمین میشود.
تجسم فیزیکی چه نقشی در یادگیری انسان در مقابل آموزش هوش مصنوعی دارد؟
تجسم، سنگ بنای رشد شناختی انسان است. انسانها با تعامل فیزیکی با محیط اطراف خود، دستکاری اشیاء، احساس جاذبه و تجربه پیامدهای حرکت، یاد میگیرند. این حلقه بازخورد مداوم، درک قوی و پایهای از واقعیت ایجاد میکند. اکثر مدلهای هوش مصنوعی کاملاً غیرجسمانی هستند و توکنها یا پیکسلهای دیجیتال ایستا را به صورت جداگانه و بدون هیچ گونه شرط فیزیکی، حضور مکانی یا نقطه مرجع در دنیای واقعی پردازش میکنند.
آیا مدلهای هوش مصنوعی میتوانند همزمان با استفاده توسط مصرفکنندگان، به طور مداوم در حال یادگیری باشند؟
در استقرارهای استاندارد تولید، مدلهای هوش مصنوعی پس از پایان مرحله آموزش، ثابت میمانند. وقتی با یک مدل تجاری تعامل میکنید، در حالت استنتاج قرار میگیرد، به این معنی که وزنهای داخلی آن بر اساس پرسوجوهای شما تغییر نمیکنند. برای یادگیری از دادههای جدید، مهندسان باید گزارشهای کاربران را جمعآوری کنند، آنها را در دستههای عظیم دستهبندی کنند و یک چرخه بازآموزی متمایز و پرهزینه را اجرا کنند. برعکس، انسانها به صورت پویا یاد میگیرند و مدلهای ذهنی خود را به طور مداوم با هر مکالمه و تجربه بهروزرسانی میکنند.
آیا محاسبات نورومورفیک شکاف بین هوش مصنوعی و یادگیری انسان را از بین خواهد برد؟
محاسبات نورومورفیک با طراحی سختافزاری که ساختار فیزیکی نورونها و سیناپسهای بیولوژیکی را تقلید میکند، قصد دارد این شکاف را پر کند. تراشههای نورومورفیک به جای استفاده از پردازندههای سنتی که دائماً دادهها را بین بانکهای حافظه و CPUها جابجا میکنند، اطلاعات را با استفاده از پالسهای الکتریکی پراکنده و ناهمزمان مستقیماً روی تراشه پردازش میکنند. این رویکرد میتواند مصرف انرژی را به میزان قابل توجهی کاهش دهد و امکان ایجاد مکانیسمهای یادگیری محلیتر و شبیه مغز را در سیستمهای هوش مصنوعی آینده فراهم کند.
حکم
آموزش شبکه عصبی زمانی که نیاز به تجزیه حجم عظیمی از دادههای ساختاریافته برای یافتن الگوهای ظریف و با ابعاد بالا که از چشم انسان پنهان هستند، دارید، بینظیر است. با این حال، یادگیری انسان همچنان استاندارد طلایی برای حل مسئله سازگار و خلاقانه در محیطهای غیرقابل پیشبینی است که در آن دادهها کمیاب هستند و زمینه همه چیز است.