Công ty DeepMind thuộc Google phát triển mô hình AI tự đào tạo cho robot công nghiệp, giảm tối thiểu thời gian đào tạo của một thiết bị và hình thành mô hình điều khiển robot công nghiệp đa năng.
Robot hiện nay có thể thực hiện nhiều nhiệm vụ khác nhau khi
thiết bị được đào tạo bằng dữ liệu thực tế. Nhưng nếu có phướng pháp bỏ qua bước
này, sẽ xuất hiện nhiều robot đa năng, phát triển với tốc độ nhanh hơn.
Công ty DeepMind của tập đoàn Google đã giới thiệu một mô
hình AI tự học tập và hoàn thiện, được đặt tên RoboCat, có thể là chìa khóa giúp
robot tự tạo dữ liệu đào tạo mới, nâng cao năng lực kỹ thuật của thiết bị mà
không cần quá nhiều sự can thiệp của con người.
Trang Kỹ thuật Thú vị (Engineering Interesting) dẫn một bài
viết trên blog của công ty, xuất bản ngày 20/4 cho biết.
“RoboCat học nhanh hơn nhiều so với những mô hình robot hiện
đại khác. Mô hình AI có thể nhận một nhiệm vụ mới chỉ với 100 bản trình diễn do
được xây dựng trên cơ sở một tập dữ liệu lớn và đa dạng. Khả năng này sẽ giúp tăng
tốc quá trình nghiên cứu robot do mô hình cho phép giảm nhu cầu đào tạo thiết bị
với sự hỗ trợ, giám sát của con người, đồng thời là một bước quan trọng phát
triển robot đa năng mục đích chung.” các nhà nghiên cứu nhận định.
Nhóm nhà khoa học giải thích, mô hình AI mới được phát triển
trên nền tảng mô hình đa phương thức Gato (tiếng Tây Ban Nha có nghĩa là “con
mèo”) của DeepMind. Mô hình đa phương thức cho phép xử lý ngôn ngữ, hình ảnh và
hành động trong cả môi trường mô phỏng và vật lý thực tế.
<iframe width="720" height="385" src="https://www.youtube.com/embed/535W4Pih1C0" title="RoboCat: A self-improving robotic agent" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" allowfullscreen></iframe>
Huấn luyện Mohinh AI RoboCat điều khiển cánh tay người máy. Video GoogleDeepMind
Các nhà nghiên cứu đã sử dụng kiến trúc đa phương thức của
Gato cùng với một tập dữ liệu đào tạo quy mô lớn, bao gồm các chuỗi hình ảnh và
hành động của rất nhiều cánh tay rô-bốt khác nhau, giải quyết hàng trăm nhiệm vụ
thực tế khác nhau.
Sau đó, nhóm nghiên cứu huấn luyện mô hình AI RobotCat học
các nhiệm vụ mới với 5 bước sau:
1. Thu thập 100-1000 bản trình diễn của một nhiệm vụ hoặc robot
mới, sử dụng cánh tay robot do con người điều khiển.
2. Điều chỉnh RoboCat trên nhiệm vụ cho cánh tay robot, tạo
ra một chương trình phụ (spin-off) chuyên biệt.
3. Chương trình phụ chuyên biệt (spin-off) thực hành tác vụ
của cánh tay robot mới này trung bình 10.000 lần, tạo ra tập dữ liệu huấn luyện
lớn hơn.
4. Tích hợp dữ liệu trình diễn và dữ liệu tự tạo vào tập dữ
liệu đào tạo hiện có của RoboCat.
5. Huấn luyện mô hình RoboCat mới trên tập dữ liệu huấn luyện
mới.
Khóa đào tạo đa dạng này đã huấn luyện mô hình AI vận hành những
cánh tay robot khác nhau trong vòng vài giờ và mô hình RobotCat nhanh chóng
thích nghi với các cánh tay robot và nhiệm vụ mới. Mặc dù mô hình AI được huấn
luyện về cánh tay với bộ kẹp hai ngạnh, nhưng RobotCat vẫn có thể thích ứng với
một cánh tay phức tạp hơn với bộ kẹp ba ngón và gấp đôi lượng thông tin điều
khiển đầu vào.
Ưu điểm của mô hình AI RoboCat là càng được học nhiều nhiệm
vụ, mô hình AI càng nhanh chóng hơn học được cách thực hiện những nhiệm vụ mới
bổ sung.
Các phiên bản đầu tiên của mô hình AI RoboCat chỉ thành công
36% thời gian đối với những tác vụ chưa từng thấy trước đó. Tuy nhiên, RoboCat
mới nhất và tiên tiến nhất, được đào tạo về nhiều nhiệm vụ đa dạng trước đó,
tăng hơn gấp đôi tỷ lệ thành công này trên cùng một nhiệm vụ (một tác vụ hoàn
toàn mới chưa được đào tạo).