Phát biểu trong lễ nhận giải chính VinFuture 2024 tối 6/12 tại Hà Nội GS Yoshua Bengio, 60 tuổi, nhà sáng lập Viện nghiên cứu Mila cho biết ông bén duyên với AI từ khi vào đại học. Tại thời điểm đó, ông cùng các cộng sự của mình không nghĩ sẽ đạt được thành tựu như thế nào trên hành trình này, chỉ mong muốn hiểu được nguyên tắc đằng sau trí tuệ nhân tạo. Tại giải thưởng VinFuture, hội đồng khoa học ghi nhận ông đã có những nghiên cứu tiên phong về mạng thần kinh nhân tạo (nơ-ron) bao gồm những tiến bộ quan trọng trong học biểu diễn (representation learning) và các mô hình tạo sinh (generative models).
Nhà khoa học máy tính nổi tiếng Yoshua Bengio sinh tại Paris, Pháp, có cha là dược sĩ và mẹ là giáo viên. Gia đình ông chuyển tới Montreal, Canada khi ông còn nhỏ và ông trải phần lớn thời gian đầu đời ở đó. Bengio tỏ rõ niềm đam mê với toán và khoa học từ rất sớm. Cha mẹ ông khích lệ tính ham học hỏi và bồi dưỡng phát triển trí tuệ cho ông. Việc tiếp xúc sớm với thế giới khoa học và toán học định hình đáng kể con đường sự nghiệp tương lai của Bengio.
Quá trình giáo dục chính quy của Bengio bắt đầu ở trường Collège Stanislas tại Montreal, một trường học tư nhân ở Pháp nổi tiếng với chương trình học nặng. Tại đây, ông tỏ ra xuất sắc ở các môn toán và vật lý, thể hiện năng lực giải quyết vấn đề phức tạp và tư duy trừu tượng. Thành tích của ông ở những môn này thúc đẩy ông theo đuổi bằng cử nhân kỹ thuật điện ở Đại học McGill tại Montreal.
Ở Đại học McGill, niềm say mê với trí tuệ nhân tạo (AI) của Bengio bắt đầu bén rễ. Ông đặc biệt quan tâm tới tiềm năng của AI nhằm phỏng theo trí thông minh của con người và những ứng dụng trong các lĩnh vực đa dạng. Vì vậy, Bengio quyết định theo đuổi bằng thạc sĩ Khoa học máy tính ở Đại học Montreal, nơi ông tập trung vào học máy, một nhánh của AI bao gồm phát triển thuật toán cho phép máy tính học hỏi và ra quyết định dựa trên dữ liệu.
Bengio lấy bằng tiến sĩ ngành khoa học máy tính ở Đại học McGill. Tại đó, ông tìm hiểu sự phức tạp của học máy. Luận văn tiến sĩ mang tên "Learning Deep Architectures for AI" của ông đã đặt nền móng cho nghiên cứu trong tương lai về học sâu, một nhánh của học máy liên quan tới thuật toán lấy cảm hứng từ cấu trúc và chức năng của bộ não gọi là mạng thần kinh nhân tạo.
Sự nghiệp học hành của Bengio cung cấp nền tảng vững chắc cho nghề nghiệp tương lai của ông như một nhà nghiên cứu hàng đầu trong lĩnh vực AI. Đam mê toán học và khoa học được nuôi dưỡng từ khi còn nhỏ, kết hợp với đào tạo chính quy, trang bị cho ông những kỹ năng và tri thức cần thiết để tạo ra nhiều đóng góp to lớn cho lĩnh vực AI và học máy.
Sự ra đời của học sâu: những đóng góp ban đầu của Bengio
Học sâu, một nhánh của học máy, đã cách mạng hóa lĩnh vực AI trong thập kỷ qua. Những đóng góp ban đầu của Bengio cho học sâu giữ vai trò chủ chốt trong việc định hình lĩnh vực AI như chúng ta thấy ngày nay.
Nghiên cứu thời đầu của Bengio tập trung vào mạng thần kinh nhân tạo, một loại mô hình học máy lấy ý tưởng từ não người. Trong một bài báo hội thảo năm 1995, Bengio và đồng nghiệp đề xuất cách mới để huấn luyện mạng này bằng kỹ thuật mang tên lan truyền ngược. Phương pháp bao gồm điều chỉnh trọng số của mạng dựa trên sai số dự đoán. Nghiên cứu của Bengio về lan truyền ngược cho phép phát triển mạng thần kinh ngày càng mạnh và phức tạp hơn.
Ngoài nghiên cứu về lan truyền ngược, Bengio còn có nhiều đóng góp trong phát triển kỹ thuật học không giám sát. Trong một bài báo năm 2003, ông giới thiệu khái niệm tiền huấn luyện không giám sát phân theo lớp, phương pháp giúp mạng thần kinh học hỏi dữ liệu hữu ích mà không cần ví dụ dán nhãn. Đây là một đột phá lớn trong lĩnh vực, tạo điều kiện cho huấn luyện mạng thần kinh sâu, trước đây từng được cho là không thể huấn luyện do vấn đề độ dốc biến mất.
Nghiên cứu của Bengio cũng đóng vai trò chủ chốt trong phát triển mạng thần kinh hồi quy (RNN), loại mạng thần kinh được thiết kế để xử lý dữ liệu chuỗi. Trong một nghiên cứu năm 1997, Bengio và đồng nghiệp giới thiệu loại RNN mới gọi là mạng Bộ nhớ ngắn - dài hạn (LSTM). Mạng LSTM bao gồm cơ chế nhớ và quên thông tin theo thời gian, từ sau đó trở thành công cụ tiêu chuẩn trong lĩnh vực xử lý ngôn ngữ tự nhiên.
Một đóng góp to lớn khác của Bengio đối với học sâu là nghiên cứu về mô hình sản sinh dữ liệu mới. Trong bài báo năm 2014, ông giới thiệu khái niệm Mạng đối nghịch tạo sinh (GAN), loại mạng có thể sản sinh dữ liệu mới giống dữ liệu huấn luyện. GAN từ sau đó được dùng trong hàng loạt ứng dụng rộng rãi, từ tạo ra hình ảnh thực tới tổng hợp giọng nói.
Vai trò của Bengio trong thành lập Viện nghiên cứu thuật toán Montreal
Bengio đóng vai trò mấu chốt trong việc thành lập Viện nghiên cứu thuật toán Montreal (MILA). Kỳ vọng của ông đối với MILA là tạo ra một trung tâm nghiên cứu và đổi mới AI, tăng cường cộng tác giữa giới học giả và khối công nghiệp. Bengio không chỉ là người thúc đẩy phía sau ý tưởng mà còn chịu trách nhiệm đảm bảo ngân sách. Danh tiếng và sự gắn bó với cộng đồng AI của ông giúp thu hút những nhà nghiên cứu hàng đầu và sinh viên tới viện,
Nghiên cứu thời đầu của Bengio tập trung vào các khía cạnh lý thuyết của AI, nhấn mạnh đặc biệt vào mạng thần kinh. Trong một bài báo hội thảo năm 1995, Bengio và đồng nghiệp đề xuất thuật toán học hỏi mới dành cho mạng thần kinh nhiều lớp, đặt nền móng cho sự phát triển của học sâu. Thuật toán này dựa trên khái niệm lan truyền ngược, huấn luyện mạng thần kinh thông qua điều chỉnh trọng lượng của những kết nối giữa neuron để ứng phó với lỗi trong đầu ra của mạng.
Vào đầu thập niên 2000, Bengio chuyển trọng tâm sang ứng dụng thực tiễn của AI. Ông là một trong những người đầu tiên nhận thấy tiềm năng sử dụng lượng dữ liệu lớn để huấn luyện mạng thần kinh sâu, khái niệm trụ cột của AI hiện đại. Trong một bài báo công bố năm 2003, Bengio và đồng nghiệp chứng minh các cấu trúc sâu có thể được huấn luyện hiệu quả, sử dụng tập dữ liệu lớn, mở đường cho phát triển hệ thống AI mạnh có thể nhận dạng mô hình trong lượng dữ liệu khổng lồ.
Nghiên cứu của Bengio cũng ảnh hưởng to lớn tới lĩnh vực xử lý ngôn ngữ tự nhiên (NLP), một nhánh của AI tập trung vào tương tác giữa máy tính và ngôn ngữ con người. Năm 2011, Bengio và đồng nghiệp giới thiệu mô hình biểu đạt ngôn ngữ mới, gọi là mô hình ngôn ngữ mạng thần kinh, sử dụng mạng thần kinh để dự đoán xác suất của một từ dựa trên ngữ cảnh. Từ sau đó, mô hình này được ứng dụng rộng rãi trong NLP, dẫn tới những cải tiến lớn trong nhiệm vụ như dịch máy và nhận dạng giọng nói.
Trong vài năm gần đây, Bengio chú ý tới tác động về mặt đạo đức của AI. Ông ủng hộ phát triển hệ thống AI một cách rõ ràng, minh bạch và công bằng. Ông kêu gọi điều phối AI nhiều hơn để tránh sử dụng sai trái. Theo Bengio, AI nên được dùng để làm lợi cho xã hội.
Dự đoán của Bengio về tương lai của AI
Bengio đưa ra một số dự đoán về tương lai của AI. Một trong số đó là AI sẽ tiếp tục tiến hóa thành dạng trí tuệ tổng quát hơn, trái với xu hướng hiện nay ở các hệ thống AI chuyên dụng. Bengio tin rằng tương lai của AI nằm ở hệ thống có thể hiểu và học hỏi từ thế giới theo cách tương tự con người thay vì huấn luyện cho những nhiệm vụ cụ thể. Theo ông, bước tiếp theo trong phát triển AI là hệ thống có thể học hỏi để hiểu về thế giới thông qua học không giám sát. Hệ thống AI sẽ nhận biết những mô hình và đưa ra dự đoán mà không cần được lập trình để làm vậy. Bengio cũng dự đoán AI sẽ được tích hợp nhiều hơn vào đời sống hàng ngày nhưng cần thực hiện theo cách thức tôn trọng những giá trị đạo đức.
Ngoài dự đoán, Bengio hy vọng AI sẽ được sử dụng để giải quyết một số vấn đề cấp bách nhất trên thế giới như biến đổi khí hậu và bất bình đẳng. Ông tin chắc AI có tiềm năng cách mạng hóa nhiều lĩnh vực từ chăm sóc sức khỏe tới giáo dục.
An Khang - Minh Thư