Các nhà khoa học đã phát triển một hệ thống AI không xâm lấn có khả năng chuyển dịch hoạt động não bộ con người thành luồng văn bản, theo một nghiên cứu được đánh giá và công bố trên tạp chí Nature Neuroscience.
Hệ thống AI, được gọi là bộ giải mã ngữ nghĩa, nếu thành công sẽ mang lại lợi ích cho những bệnh nhân mất khả năng giao tiếp về thể chất sau khi bị đột quỵ, tê liệt hoặc những bệnh thoái hóa khác khiến con người mất khả năng giao tiếp bằng ngôn ngữ hoặc cử chỉ.
Các nhà khoa học tại Đại học Texas (UT) ở Austin, Mỹ đã phát triển một phần của hệ thống AI này, sử dụng mô hình máy chuyển dịch ngữ nghĩa (máy học sâu), tương tự như mô hình AI hỗ trợ chatbot Bard của Google và chatbot ChatGPT của OpenAI.
Nghiên cứu, được công bố trên tạp chí Khoa học thần kinh tự nhiên, do ông Jerry Tang, nghiên cứu sinh TS khoa học máy tính và Alex Huth, PGS khoa học thần kinh và khoa học máy tính tại UT Austin.
Nghiên cứu sinh TS Jerry Tang chuẩn bị thu thập dữ liệu hoạt động não bộ tại Trung tâm hình ảnh y sinh tại Đại học Texas ở Austin. Ảnh: Nolan Zunk/Đại học Texas ở Austin.
Có ưu điểm hơn hẳn các hệ thống giải mã ngôn ngữ khác đang được phát triển, hệ thống này không yêu cầu các đối tượng được giải mã suy nghĩ phải phẫu thuật cấy ghép, khiến quá trình này trở nên không xâm lấn. Người tham gia thí nghiệm cũng không cần chỉ sử dụng các từ trong danh sách quy định.
Hoạt động của não được đo bằng máy quét fMRI liên tục để đào tạo chuyên sâu cho bộ giải mã, trong đó người tham gia thí nghiệm nghe hàng giờ các tệp tin âm thanh (podcast) khi trong máy quét. Bộ giải mã ngữ nghĩa, sử dụng thuật toán Máy học sâu sẽ thu thập và xử lý những hình ảnh biến động của não bộ, từ đó dự đoán ngôn ngữ tư duy của não trên cơ sở sự biến động của dữ liệu hình ảnh.
Sau khi hệ thống AI được đào tạo, bộ giải mã ngữ nghĩa sẽ tạo ra một luồng văn bản khi người tham gia đang nghe hoặc tưởng tượng đang kể một câu chuyện mới. Văn bản thu được không phải là một bản chép lại chính xác một nội dung, mà các nhà nghiên cứu đã thiết kế hệ thống với mục đích ghi lại những suy nghĩ hoặc ý tưởng của người đang được quét ảnh não bộ.
Theo thông cáo báo chí của nhóm nghiên cứu, hệ thống AI được đào tạo đưa ra văn bản khớp chặt chẽ hoặc chính xác với ý nghĩa dự định những từ gốc của người tham gia trong khoảng một nửa thời gian thí nghiệm.
Ví dụ, khi một người tham gia thí nghiệm nghe thấy cụm từ “Tôi chưa có bằng lái xe” trong cuộc thử nghiệm, thì suy nghĩ đó được chuyển thành “Cô ấy thậm chí còn chưa bắt đầu học lái xe.”
Alexander Huth, một trong những nhà khoa học dẫn đầu nghiên cứu cho biết: “Đối với phương pháp không xâm lấn, đây là một bước tiến thực sự so với những kết quả nghiên cứu đã được thực hiện trước đây, thường là những từ đơn hoặc câu ngắn. Chúng tôi đang phát triển mô hình AI để giải mã ngôn ngữ liên tục trong thời gian dài với những ý tưởng phức tạp hơn.”
Thông cáo báo chí cho biết, những người tham gia thí nghiệm cũng được xem 4 video không có âm thanh khi đang trong máy quét, hệ thống AI đã mô tả chính xác “một số sự kiện” từ các video này.
Các nhà khoa học Alex Huth , Shailee Jain và Jerry Tang chuẩn bị thu thập dữ liệu hoạt động của não tại Trung tâm Hình ảnh Y sinh tại Đại học Texas ở Austin. Ảnh: Nolan Zunk/Đại học Texas ở Austin.
Tính đến ngày 2/5, bộ giải mã AI không thể được sử dụng bên ngoài môi trường phòng thí nghiệm vì phụ thuộc vào máy quét fMRI. Nhưng các nhà khoa học tin rằng, trong tương lai cuối cùng hệ thống có thể được sử dụng trên cơ sở những hệ thống chụp ảnh não di động linh hoạt và gọn nhẹ hơn.
Các nhà khoa học, chủ nhiệm đề tài nghiên cứu đã nộp đơn xin cấp bằng sáng chế của Hiệp ước Hợp tác Bằng sáng chế (PCT) cho công nghệ này.