Liệu AI có thể sớm viết tiểu thuyết, tạo ra các video dài hoặc
soạn nhạc? Đó là những gì Google đang nghiên cứu và cố gắng tìm
hiểu. Với dự án Wordcraft mới, chatbot LaMDA của Google hiện đang viết tiểu
thuyết trên cơ sở dữ liệu đầu vào của các nhà văn.
LaMDA là AI đàm thoại của Google đã gây tranh cãi vào đầu
năm 2022 sau khi một kỹ sư CNTT khẳng định, AI có tri giác và nhận thức. Google
công bố tại sự kiện AI của công ty ở New York, doanh nghiệp đang “hợp tác với
các nhà văn chuyên nghiệp, sử dụng trình chỉnh sửa Wordcraft để tạo ra một tập
truyện ngắn”. Những câu chuyện này hiện đã có sẵn trực tuyến cho công
chúng đọc.
Douglas Eck, Giám đốc Nghiên cứu Cấp cao tại Google
Research, trong một cuộc họp báo trước sự kiện AI cho biết: “Tôi tin rằng chúng
tôi sẽ thay đổi cách mọi người thể hiện bản thân một cách sáng tạo. Chúng
tôi đã hợp tác với các nhà văn chuyên nghiệp, mời các tác giả viết tiểu thuyết
thử nghiệm bằng cách sử dụng LaMDA như một công cụ chỉnh sửa. Chúng tôi
cũng hiểu rằng điều đó không dễ dàng. LaMDA cũng không thực hiện tất cả
các công đoạn của một chuyện ngắn. Đó là những nhà văn đang làm việc”.
Google có nhìn thấy một tương lai mà một chương trình AI như
LaMDA có thể thay thế các nhà văn con người không? Hiện thì không thể,
theo Eck. Ông thừa nhận rằng nếu một ai đó yêu cầu LaMDA viết toàn bộ câu chuyện,
kết quả sẽ không tốt hoặc hoặc không thú vị.
Douglas Eck giải thích: “Điều thú vị là sử dụng công nghệ
như một thứ gia vị, một sự bổ sung cho những gì tác giả đang cố gắng thực hiện. Chúng
tôi sẽ tiếp tục phát triển những khả năng mà các công cụ công nghệ AI có thể
làm. Nhưng những công cụ này sẽ vẫn là một sự bổ sung có lựa chọn, một
cách tùy chọn để cho phép các nhà văn kể những câu chuyện theo những cách khác
nhau”.
Mặc dù Google xác định, LaMDA hoặc những công cụ AI khác chỉ
là những công cụ hỗ trợ người sáng tác, nhưng rõ ràng với sự phát triển của Máy
học, sẽ xuất hiện những nguy cơ mới, nhưng sản phẩm giả mạo phong cách của các
tác giả trong văn học, hội họa hoặc âm nhạc và đó hoàn toàn không phải là vấn đề
nhỏ.
Douglas Eck cũng thừa nhận, các mô hình AI này tiềm ẩn những
rủi ro nghiêm trọng, mục đích không phải là làm mờ sự phân biệt giữa những gì
là thực và những gì là dựa trên AI. Ông lưu ý: “Chúng ta cũng phải xem xét những
ý kiến, nhận thức về việc phát triển các mô hình AI, giao thoa với tài sản trí
tuệ.
Viết tiểu thuyết không phải là con đường sáng tạo duy nhất
mà Google đang khám phá với sự trợ giúp của những mô hình AI. Google cũng đang nghiên
cứu các mô hình AI, có thể được sử dụng để tạo ra video và âm nhạc.
Trong lĩnh vực sản xuất video trên cơ sở AI, Google giới thiệu
2 mô hình mới có tên là Imagen và Phenaki. Trình Imagen Video sử dụng tính năng
khuếch tán để tạo ra những hình ảnh riêng lẻ chất lượng cao. Google tuyên bố công
nghệ này phù hợp với các video ngắn. Phenaki sử dụng “kỹ thuật Máy học trình tự,
tạo ra một loạt mã thông báo theo thời gian” để tạo ra video dài. Google cho biết,
kết hợp hai mô hình sẽ đảm bảo độ siêu phân giải ở cấp độ khung hình và sự liên
kết theo thời gian.
Imagen Video, sử dụng văn bản và ảnh dữ liệu đầu vào để tạo video của Goople. Video MattVidPro AI
Google cũng giới thiệu video, được tạo bởi 2 mô hình AI. Khi
được hỏi về những thách thức của việc sử dụng AI để tạo video, Eck thừa nhận, mặc
dù nhóm nghiên cứu thấy được khả năng, nhưng vẫn là một nhiệm vụ khó khăn. Ông
giải thích “Khó khăn nhất là đảm bảo sự liên kết mạch lạc giữa từng khung hình.
Nếu dự đoán một khung hình từ khung trước đó, mô hình bắt đầu mất tính liên kết.
Đây là một thách thức cơ bản trong quá trình tạo video mà Google cho biết, vẫn
chưa giải quyết được vấn đề.
Cuối cùng, AudioLM là một khung làm việc mới để tạo ra giọng
nói và âm nhạc thực tế, chỉ dựa trên một mẫu âm thanh ngắn. Hiện tại, dữ liệu âm nhạc đầu vào chỉ là mẫu nhạc piano.
Google cho biết đây "là một mô hình âm thanh thuần túy mà AI cung cấp từ
quá trình đào tạo, không có bất kỳ văn bản hoặc biểu tượng hiển thị âm nhạc
nào."