Công ty trí tuệ nhân tạo (AI) và nhà sản xuất chip Nvidia đã công bố công cụ Trí tuệ Nhân tạo (AI) mới nhất Neuralangelo, cho phép tạo dựng mô hình 3D đối tượng, được ghi lại trong video.
Neuralangelo là một mô hình AI, cho phép chuyển đổi các
video clip 2D thành những cấu trúc 3D chi tiết. Mô hình sử dụng các mạng thần
kinh để tái tạo 3D, cung cấp các bản sao ảo giống như thật của tác phẩm điêu khắc,
công trình xây dựng, tòa nhà và các vật thể trong thế giới thực khác.
Tên gọi Neuralangelo là một bài thơ ca ngợi nhà điêu khắc và
họa sĩ nổi tiếng nhất thế giới Michelangelo, được biết đến với tác phẩm điêu khắc
David thời Phục hưng, bức vẽ trần nhà nguyện Sistine và nhiều kiệt tác nghệ thuật
khác.
Trong bản demo được giới thiệu, Neuralangelo tái tạo các vật
thể mang tính biểu tượng như tượng David của Michelangelo và phổ biến như một chiếc
xe tải ảnh 2D.
Công cụ AI Neuralangelo của NVIDIA Research tái tạo mô hình 3D từ video clip 2D. Video NVIDIA Research
Mô hình AI Neuralangelo là sản phẩm của một nghiên cứu được
thực hiện với sự phối hợp của nhóm nghiên cứu NVIDIA và các nhà khoa học trẻ
thuộc Đại học Johns Hopkins ở Maryland, Mỹ.
Neuralangelo là một trong gần 30 dự án của NVIDIA Research,
sẽ được trình bày tại Hội nghị về Thị giác máy tính và Nhận dạng mẫu (CVPR), diễn
ra từ ngày 18 đến 22/6 tại Vancouver. Công ty trong một bài viết trên blog cho
biết, các báo cáo sẽ bao gồm những chủ đề như ước tính tư thế, tái tạo cấu trúc
3D và tạo dựng video.
Phương thức hoạt động là mô hình do AI hỗ trợ sẽ quan sát độ
sâu, hình dạng và kích thước của các nhân vật hoặc đối tượng trong video 2D từ
nhiều góc độ. Đầu tiên, Neuralangelo sẽ tạo một bản mô tả 3D ban đầu của khung
cảnh, sau đó sẽ tối ưu hóa mô hình 3D dựa trên phân tích góc chiếu ánh sáng, độ
sâu để làm rõ nét và phù hợp các chi tiết và kết cấu phức tạp.
Sau đó, các chuyên gia sáng tạo có thể sử dụng kết quả mô
hình 3D trong thiết kế các ứng dụng, chỉnh sửa mô hình để sử dụng trong các sản
phẩm nghệ thuật sáng tạo, phát triển trò chơi điện tử và tạo môi trường đào tạo
người máy, công ty cho biết trong một bài viết trên blog. Mô hình AI cũng trang
bị cho người dùng khả năng tạo bản sao kỹ thuật số thế giới thực bằng phương
pháp sử dụng các thiết bị di động thông thường như camera điện thoại thông minh
hoặc camera kỹ thuật số mà không phải xây dựng một mô hình 3D với phần mềm
chuyên dụng và trình độ đồ họa cao cấp.
Nhiều người đang đặt câu hỏi, những ứng dụng công nghệ này có
ý nghĩa gì đối với ngành công nghiệp games 3D, trong đó bộ card đồ họa của
Nvidia đang dẫn đầu. Công ty gần đây đã ra mắt card đồ họa Nvidia RTX 4060 Ti mới,
bản nâng cấp tiếp theo của RTX 4070.
Ming-Yu Liu, giám đốc nghiên cứu cao cấp và đồng tác giả của
bài viết trên blog cho biết: “Khả năng tái tạo 3D mà Neuralangelo cung cấp sẽ
mang lại lợi ích to lớn cho nhà sáng tạo, giúp người dùng tái tạo thế giới thực
trong thế giới kỹ thuật số.”
“Công cụ này trong tương lai, với sự phát triển mạnh mẽ của
AI sẽ cho phép các nhà phát triển nhập các đối tượng chi tiết, dù là những bức
tượng nhỏ hay tòa nhà đồ sộ vào môi trường ảo cho trò chơi điện tử hoặc phát
triển cặp song sinh kỹ thuật số công nghiệp.”
Như một người dùng Twitter đã mô tả, mô hình AI là “phép
quang trắc ảnh trên Máy học”, những phương pháp tái tạo bề mặt thần kinh được sử
dụng trong Neuralangelo đã cho thấy tiềm năng vượt qua những quan sát mơ hồ như
những vùng lớn có màu đồng nhất, các mẫu kết cấu lặp đi lặp lại hoặc những biến
thể màu mạnh. Phép quang trắc ảnh là một kỹ thuật sử dụng ảnh làm phương tiện để
đo các đối tượng vật lý.
NVIDIA 3D MoMa cho phép tạo mô hình 3D từ tập hợp ảnh và đưa vào công cụ đồ họa để thao tác kỹ thuật số. Video NVIDIA Research
Khái niệm công nghệ quang trắc ảnh và mô hình AI của
Neuralangelo không phải là mới. Nghiên cứu của NVIDIA năm 2022 đã tạo ra mô
hình NVIDIA 3D MoMa, cho phép các kiến trúc sư, nhà thiết kế và nhà phát triển
games chụp ảnh đối tượng, tạo dựng mô hình 3D, sau đó nhập các đối tượng vào một
công cụ đồ họa để thực hiện các thao tác kỹ thuật số.