trí tuệ nhân tạokhoa học nhận thứchọc sâukhoa học thần kinh
Quá trình huấn luyện mạng nơ-ron so với quá trình học tập của con người
Phân tích toàn diện này so sánh cơ chế huấn luyện mạng nơ-ron nhân tạo với sự phát triển nhận thức của con người. Trong khi học sâu dựa vào lan truyền ngược, tập dữ liệu khổng lồ và hàng tỷ lần điều chỉnh lặp đi lặp lại để tìm ra các mô hình thống kê, thì quá trình học tập của con người sử dụng tính dẻo dai của khớp thần kinh hiệu quả cao, với lượng dữ liệu thấp, được thúc đẩy bởi ngữ cảnh, kinh nghiệm thực tế và sự trừu tượng về khái niệm.
Điểm nổi bật
Mạng lưới nhân tạo đòi hỏi hàng triệu phép tính toán học lặp đi lặp lại, trong khi con người dựa vào sự trừu tượng hóa theo ngữ cảnh.
Sự lan truyền ngược đòi hỏi sự phối hợp toàn cục, trong khi bộ não sinh học thích nghi thông qua các cập nhật khớp thần kinh cục bộ.
Các mô hình AI gặp khó khăn với hiện tượng quên lãng nghiêm trọng, một vấn đề mà con người khắc phục được nhờ giấc ngủ và quá trình củng cố kiến thức.
Các hệ thống sinh học hoạt động với lượng năng lượng chỉ bằng một phần nhỏ so với lượng năng lượng cần thiết cho các cụm máy tính hiệu năng cao.
Huấn luyện mạng nơ-ron là gì?
Tối ưu hóa toán học các trọng số nhân tạo bằng phương pháp giảm độ dốc và sử dụng tập dữ liệu khổng lồ để giảm thiểu hàm lỗi.
Phương pháp này chủ yếu dựa vào lan truyền ngược để phân phối tín hiệu lỗi ngược trở lại qua các lớp.
Để thành thạo các nhiệm vụ phân loại đơn giản, cần phải có hàng nghìn đến hàng triệu ví dụ cụ thể.
Bị chứng quên nghiêm trọng khi được giao các nhiệm vụ mới, không liên quan mà không được đào tạo lại.
Hoạt động thông qua các kiến trúc tĩnh, cố định trong giai đoạn suy luận tiêu chuẩn.
Tiêu tốn lượng điện năng và năng lượng tính toán đáng kể để đạt được độ chính xác cao.
Quá trình học tập của con người là gì?
Sự thích nghi sinh học của các đường dẫn thần kinh được thúc đẩy bởi kinh nghiệm giác quan, sự tò mò và sự hình thành khái niệm theo ngữ cảnh.
Sử dụng tính dẻo dai của khớp thần kinh, cho phép não bộ liên tục tự tái cấu trúc trong thời gian thực.
Có khả năng học mà không cần huấn luyện hay chỉ cần huấn luyện một lần, nắm vững các khái niệm mới chỉ sau một lần tiếp xúc.
Dễ dàng duy trì các khuôn khổ kiến thức lịch sử đồng thời tích hợp các kỹ năng hoàn toàn mới.
Tích hợp tự nhiên các đầu vào cảm giác đa phương thức, kết hợp thị giác, thính giác, xúc giác và ngữ cảnh.
Hoạt động với ngân sách sinh học cực kỳ hiệu quả, chỉ khoảng 20 watt điện năng.
Bảng So Sánh
Tính năng
Huấn luyện mạng nơ-ron
Quá trình học tập của con người
Cơ chế chính
Thuật toán giảm độ dốc và lan truyền ngược trong toán học
Tính dẻo dai của khớp thần kinh sinh học và sự điều hòa chất dẫn truyền thần kinh
Hiệu quả dữ liệu
Cực kỳ thấp; đòi hỏi bộ dữ liệu tính toán khổng lồ.
Cực kỳ cao; rút ra các quy tắc từ một vài ví dụ.
Tiêu thụ năng lượng
Công suất megawatt cho đào tạo cụm quy mô lớn
Công suất chuyển hóa liên tục khoảng 20 watt
Học tập liên tục
Kém cỏi; dễ quên hoàn toàn những việc đã làm trước đó.
Xuất sắc; kết hợp các kỹ năng mới với các kiến thức nền tảng cũ.
Định hướng học tập
Hoàn toàn hướng đến mục tiêu thông qua việc tối thiểu hóa hàm mất mát.
Mang tính khám phá, tự chủ và nhạy bén với bối cảnh.
Phân tách phần cứng-phần mềm
Sự tách biệt rõ ràng giữa mã lập trình và chip silicon vật lý
Không thể tách rời; kiến trúc vật lý chính là phần mềm.
So sánh chi tiết
Cơ chế thích nghi
Mạng nơ-ron nhân tạo học bằng cách điều chỉnh các trọng số số học trên một ma trận cố định. Trong quá trình lan truyền ngược, một thuật toán trung tâm tính toán sai số chính xác của đầu ra và truyền các hiệu chỉnh dựa trên phép tính vi phân ngược trở lại hệ thống. Ngược lại, bộ não con người sử dụng tính dẻo dai của khớp thần kinh cục bộ. Các đường dẫn vật lý mạnh lên hoặc yếu đi dựa trên thời điểm phát xung tế bào, cho phép hệ thống sinh học thích nghi một cách tự nhiên mà không cần một thuật toán chủ toàn cục quản lý các điều chỉnh.
Hiệu quả dữ liệu và tính toán
Để nhận dạng một chiếc xe đạp, mạng lưới trí tuệ nhân tạo phải xử lý hàng ngàn hình ảnh đa dạng với các góc độ, ánh sáng và phông nền khác nhau để lập bản đồ các ranh giới thống kê. Một đứa trẻ thường chỉ cần nhìn thấy một chiếc xe đạp một hoặc hai lần. Nhận thức của con người tận dụng các khuôn khổ tư duy hiện có, vật lý trực quan và sự tương đồng về cấu trúc, trong khi mạng lưới trí tuệ nhân tạo về cơ bản bắt đầu từ một trang giấy trắng với nhiễu ngẫu nhiên mỗi khi một kiến trúc mới được khởi tạo.
Khái quát hóa và học chuyển giao
Các hệ thống trí tuệ nhân tạo nổi tiếng là dễ bị tổn thương khi hoạt động ngoài phạm vi huấn luyện hẹp của chúng. Một mô hình được huấn luyện để chơi thành thạo một trò chơi điện tử cụ thể sẽ hoàn toàn thất bại nếu màu nền thay đổi dù chỉ một chút, trừ khi nó được tinh chỉnh có mục tiêu. Con người lại xuất sắc trong việc học chuyển giao, áp dụng một cách liền mạch các khái niệm trừu tượng về sự cân bằng, động lượng và chiến lược đã học được trong một lĩnh vực vào các tình huống hoàn toàn xa lạ.
Khả năng ghi nhớ và thích ứng
Khi một mạng nơ-ron nhân tạo bị buộc phải học một nhiệm vụ hoàn toàn mới, các cập nhật gradient mới thường ghi đè lên các trọng số số học đã được thiết lập cho các nhiệm vụ trước đó, gây ra hiện tượng quên nghiêm trọng. Não bộ con người xử lý việc học tập suốt đời một cách tinh tế. Chúng ta ngủ để củng cố những trải nghiệm hàng ngày thành các cấu trúc dài hạn, đảm bảo rằng việc học lái xe không làm suy giảm khả năng viết, nói hoặc nhận diện khuôn mặt quen thuộc của chúng ta.
Ưu & Nhược điểm
Huấn luyện mạng nơ-ron
Ưu điểm
+Xử lý hàng triệu đầu vào song song
+Tính nhất quán toán học hoàn hảo
+Dễ dàng sao chép và mở rộng quy mô
+Xác định các mô hình siêu chiều
Đã lưu
−Yêu cầu dữ liệu khổng lồ
−Tiêu thụ năng lượng cao
−Dễ bị quên lãng thảm khốc
−Thiếu óc phán đoán thông thường.
Quá trình học tập của con người
Ưu điểm
+Hiệu quả dữ liệu đáng kinh ngạc
+Khái quát hóa trừu tượng bậc thầy
+Tích hợp trí nhớ suốt đời
+Yêu cầu năng lượng cực thấp
Đã lưu
−Uống chậm, tuần tự
−Dễ bị mệt mỏi về nhận thức
−Không thể sao chép kiến thức ngay lập tức
−Bị chi phối bởi trạng thái cảm xúc
Những hiểu lầm phổ biến
Huyền thoại
Mạng nơ-ron nhân tạo hoạt động chính xác như bộ não sinh học của con người.
Thực tế
Thuật ngữ mạng nơ-ron chủ yếu là một phép ẩn dụ. Mặc dù các thiết kế ban đầu được lấy cảm hứng một cách lỏng lẻo từ sinh học, nhưng học sâu hiện đại dựa trên phép tính ma trận chặt chẽ và các thuật toán tối ưu hóa toàn cục, hoàn toàn không giống với cơ chế phức tạp, hóa học và bất đồng bộ của mô não sống.
Huyền thoại
Các mô hình học sâu sở hữu một dạng hiểu biết giống con người sau khi được huấn luyện.
Thực tế
Các mô hình AI rất giỏi trong việc lập bản đồ các mối tương quan thống kê giữa đầu vào và đầu ra, nhưng chúng hoàn toàn thiếu khả năng hiểu ngữ nghĩa. Một mô hình có thể tạo ra những mô tả hoàn hảo về nước mà không cần bất kỳ khái niệm nào về sự ẩm ướt, khát nước hoặc sự tồn tại vật lý.
Huyền thoại
Não bộ con người có dung lượng lưu trữ cố định, giống như bộ nhớ của máy tính.
Thực tế
Trí nhớ con người không hoạt động giống như một ổ cứng kỹ thuật số chứa đầy hàng gigabyte dữ liệu. Trí nhớ sinh học mang tính xây dựng và liên kết; việc học các khái niệm mới thực sự tạo ra nhiều "mối liên kết" hơn, giúp việc tiếp thu thông tin trong tương lai dễ dàng hơn, thay vì lo lắng về việc hết dung lượng lưu trữ vật lý.
Huyền thoại
Việc tăng quy mô của mạng lưới AI sẽ tự động giúp nó có khả năng suy luận ở cấp độ con người.
Thực tế
Việc mở rộng các tham số giúp cải thiện khả năng nhận diện mẫu và tạo ra sự bắt chước vô cùng tinh vi, nhưng nó không khắc phục được những hạn chế kiến trúc cơ bản. Kích thước đơn thuần không thể cung cấp cho AI động lực nội tại, hình thể vật lý hoặc khả năng suy luận một cách thông thường về thế giới.
Các câu hỏi thường gặp
Vậy chính xác thì lan truyền ngược là gì, và não bộ con người có sử dụng nó không?
Lan truyền ngược là một kỹ thuật toán học được sử dụng để tính toán độ dốc của hàm lỗi so với trọng số của mạng nơ-ron. Nó gửi tín hiệu lỗi ngược trở lại qua các lớp của mô hình để điều chỉnh các kết nối. Không có bằng chứng chắc chắn nào cho thấy não người sử dụng lan truyền ngược. Các nơ-ron sinh học giao tiếp thông qua các xung điện và tín hiệu hóa học truyền về phía trước qua các khớp thần kinh, điều chỉnh cục bộ thông qua các mô hình thời gian chứ không phải nhận các hiệu chỉnh toán học toàn cục từ một thuật toán tập trung.
Tại sao máy tính cần hàng triệu ví dụ để học được những gì một đứa trẻ học được từ một ví dụ?
Một đứa trẻ sinh ra đã sở hữu một cấu trúc sinh học tiến hóa được tối ưu hóa qua hàng triệu năm để tồn tại trong một vũ trụ vật chất. Trẻ em có sự hiểu biết bẩm sinh về vật lý trực quan, tính bền vững của vật thể và quan hệ nhân quả. Khi một đứa trẻ nhìn thấy một con vật lần đầu tiên, chúng sẽ kết nối hình ảnh đó vào một khuôn khổ khổng lồ, có sẵn từ trước. Các mô hình nhân tạo bắt đầu quá trình huấn luyện như một trang giấy trắng với các số ngẫu nhiên, có nghĩa là chúng phải tự suy luận ra các khái niệm cơ bản về đường nét, hình học, ánh sáng và sự hiện diện hoàn toàn từ đầu.
Liệu mạng nơ-ron nhân tạo có thể trải nghiệm sự tò mò trong quá trình huấn luyện?
Các mạng nơ-ron tiêu chuẩn không có cảm xúc hay sự tò mò. Tuy nhiên, các nhà khoa học máy tính có thể mô phỏng một động lực được gọi là sự tò mò nội tại trong các tác nhân học tăng cường. Điều này đạt được bằng cách thêm một phần thưởng toán học vào hàm mất mát bất cứ khi nào tác nhân gặp phải các trạng thái hoàn toàn mới hoặc dữ liệu không thể dự đoán được. Mặc dù điều này khuyến khích sự khám phá và bắt chước hành vi tò mò, nhưng nó vẫn là một sự tối ưu hóa toán học được tính toán chứ không phải là một động lực cảm xúc hay tâm lý.
Quên thảm khốc là gì và tại sao con người không bị ảnh hưởng bởi nó?
Hiện tượng quên thảm khốc xảy ra khi một mạng lưới nhân tạo được huấn luyện trên một nhiệm vụ mới, và các cập nhật toán học thu được sẽ ghi đè lên các cấu hình trọng số đã học được trong các nhiệm vụ trước đó, khiến kỹ năng cũ trở nên vô dụng. Con người tránh được điều này vì bộ não của chúng ta sử dụng sự kết hợp phức tạp của các hệ thống học tập bổ sung cho nhau. Vùng hải mã nhanh chóng ghi nhận những trải nghiệm mới hàng ngày, trong khi vỏ não mới từ từ tích hợp thông tin đó vào các khuôn khổ ổn định, dài hạn trong khi ngủ, bảo vệ kiến thức nền tảng khỏi sự gián đoạn đột ngột.
Hiệu quả sử dụng năng lượng của quá trình huấn luyện trí tuệ nhân tạo so với não bộ con người như thế nào?
Sự khác biệt về hiệu quả năng lượng là rất lớn. Việc huấn luyện một mô hình học sâu tiên tiến đòi hỏi các trung tâm dữ liệu có kích thước bằng nhà kho, tiêu thụ hàng megawatt điện, thường tiêu tốn lượng điện đủ để cung cấp năng lượng cho hàng nghìn ngôi nhà trong nhiều tuần. Trong khi đó, não bộ con người xử lý đồng thời quá trình tổng hợp ngôn ngữ phức tạp, phối hợp thể chất, xử lý cảm giác và suy luận trừu tượng chỉ với 20 watt năng lượng sinh học, được cung cấp hoàn toàn bằng lượng calo cơ bản.
Vai trò của thể xác trong quá trình học tập của con người so với quá trình huấn luyện trí tuệ nhân tạo là gì?
Sự hiện diện vật lý là nền tảng của sự phát triển nhận thức của con người. Con người học hỏi bằng cách tương tác vật lý với môi trường xung quanh, thao tác với các vật thể, cảm nhận trọng lực và trải nghiệm hậu quả của chuyển động. Vòng phản hồi liên tục này xây dựng nên một sự hiểu biết vững chắc và có cơ sở về thực tại. Hầu hết các mô hình AI đều hoàn toàn phi vật thể, xử lý các mã thông báo kỹ thuật số tĩnh hoặc các điểm ảnh một cách độc lập mà không có bất kỳ sự hiện diện vật lý, không gian hoặc điểm tham chiếu nào trong thế giới thực.
Liệu các mô hình AI có thể học hỏi liên tục trong quá trình người tiêu dùng sử dụng chúng không?
Trong các triển khai sản xuất tiêu chuẩn, các mô hình AI được đóng băng sau khi giai đoạn huấn luyện kết thúc. Khi bạn tương tác với một mô hình thương mại, nó đang ở chế độ suy luận, nghĩa là các trọng số nội bộ của nó không thay đổi dựa trên các truy vấn của bạn. Để học hỏi từ dữ liệu mới, các kỹ sư phải thu thập nhật ký người dùng, đóng gói chúng thành các lô lớn và chạy một chu kỳ huấn luyện lại riêng biệt, tốn kém. Ngược lại, con người học hỏi một cách năng động và liên tục cập nhật mô hình tư duy của họ với mỗi cuộc trò chuyện và trải nghiệm.
Liệu điện toán mô phỏng thần kinh có thu hẹp khoảng cách giữa trí tuệ nhân tạo và khả năng học hỏi của con người?
Điện toán mô phỏng thần kinh (neuromorphic computing) hướng đến việc thu hẹp khoảng cách này bằng cách thiết kế phần cứng bắt chước cấu trúc vật lý của các tế bào thần kinh và khớp thần kinh sinh học. Thay vì sử dụng các bộ xử lý truyền thống liên tục chuyển dữ liệu giữa các vùng nhớ và CPU, chip mô phỏng thần kinh xử lý thông tin bằng cách sử dụng các xung điện thưa thớt, không đồng bộ trực tiếp trên chip. Cách tiếp cận này có thể giảm đáng kể mức tiêu thụ năng lượng và cho phép các cơ chế học tập cục bộ, giống não bộ hơn trong các hệ thống AI tương lai.
Phán quyết
Việc huấn luyện mạng nơ-ron là vô song khi bạn cần phân tích khối lượng lớn dữ liệu có cấu trúc để tìm ra các mẫu hình tinh tế, đa chiều mà mắt người không thể nhận ra. Tuy nhiên, khả năng học hỏi của con người vẫn là tiêu chuẩn vàng cho việc giải quyết vấn đề một cách thích ứng và sáng tạo trong môi trường khó lường, nơi dữ liệu khan hiếm và bối cảnh là tất cả.