Chuyển dịch ảnh ngựa thành ngựa vằn và trí thông minh nhân tạo (AI) giúp nhóm nghiên cứu thuộc Đại học Carnegie Mellon, Mỹ dạy một robot nhận biết nước và đổ nước vào ly.
Nước là một thách thức khó khăn đối với robot vì là vật chất
trong suốt. Robot đã học cách đổ nước trước đây, nhưng phải sử dụng các kỹ thuật
như đun nóng nước và sử dụng camera ảnh nhiệt hoặc đặt cốc thủy tinh trước
phông nền ô vuông bàn cờ, hoàn toàn không phù hợp với cuộc sống hàng ngày. Một
giải pháp dễ dàng hơn có thể cho phép robot phục vụ đổ đầy cốc nước, robot dược
sĩ đo và trộn thuốc hoặc robot làm vườn tưới cây .
Gautham Narasimhan, ThS thuộc Viện Robotics, phối hợp với một
nhóm nhà khoa học Phòng thí nghiệm Nhận thức và Thực hiện Robot thuộc Viện, sử
dụng AI và dịch chuyển hình ảnh để giải quyết thách thức này.
Các thuật toán dịch chuyển hình ảnh sử dụng những bộ sưu tập
hình ảnh để huấn luyện trí thông minh nhân tạo (AI) dịch chuyển hình ảnh từ
phong cách này sang phong cách khác như chuyển đổi một bức ảnh thành một bức
tranh theo phong cách Monet hoặc dịch chuyển hình ảnh một con ngựa thành một
con ngựa vằn. Trong nghiên cứu này, nhóm nhà khoa học sử dụng một phương pháp gọi
là học tập tương phản chuyển dịch ảnh sang ảnh không ghép đôi (CUT).
David Held, PGS tại Viện Robotics, cố vấn cho Narasimhan cho
biết, cần một số cách để thuật toán biết câu trả lời đúng và sai trong giai đoạn
học tập và đào tạo.Nhưng việc ghi nhãn dữ liệu là một quá trình tốn thời gian,
đặc biệt khi dạy robot đổ nước là không thể do không thể dán nhãn các giọt nước
riêng lẻ trong một hình ảnh.
<iframe width="720" height="385" src="https://www.youtube.com/embed/-UcEoKMPNr0" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
Một robot sử dụng AI và dịch hình ảnh để rót một cốc nước. Video:
Đại học Carnegie Mellon
Tương tự như việc huấn luyện Máy học chuyển dịch hình ảnh một
con ngựa giống như ngựa vằn, hoàn toàn có thể huấn luyện Máy học chuyển dịch một
hình ảnh chất lỏng có màu thành hình ảnh chất lỏng trong suốt. Nhóm nghiên cứu
sử dụng mô hình này để giúp robot hiểu được chất lỏng trong suốt.
Một chất lỏng trong suốt như nước rất khó để robot nhìn thấy
vì cách nước phản xạ, khúc xạ và hấp thụ ánh sáng khác nhau tùy thuộc vào nền.
Để dạy máy tính cách nhìn những hình nền khác nhau qua một cốc nước, nhóm
nghiên cứu chạy video YouTube phía sau một cốc nước trong suốt. Huấn luyện hệ
thống theo cách này sẽ giúp robot có thể rót nước trên các bối cảnh khác nhau
trong thế giới thực trong mọi tình huống.
Sử dụng phương pháp Máy học này, robot có thể rót nước cho đến
khi đạt đến độ cao nhất định trong ly . Thử nghiệm được lặp đi lặp lại với những
loại kính có hình dạng và kích thước khác nhau.
ThSNarasimhan cho biết, có nhiều khả năng mở rộng nghiên cứu
trong tương lai theo phương pháp này như trong các điều kiện ánh sáng khác
nhau, huấn luyện robot đổ nước từ thùng chứa này sang thùng chứa khác, ước tính
không chỉ chiều cao của nước mà cả thể tích nước đã rót.
Nghiên cứu được giới thiệu tại Hội nghị Quốc tế IEEE về
Robot và Tự động hóa vào tháng 5.2022 ở Philadelphia và có được sự quan tâm đặc
biệt của các nhà robot học và tự động hóa sâu do công trình nghiên cứu được thực
hiện trong thế giới thực, không phải trong mô phỏng và đây là phương pháp Máy học
đơn giản nhưng hiệu quả.