Trong sự phát triển của CNTT, năm 2022 là năm mang tính bước ngoặt đối với AI với những ứng dụng mới được xã hội hóa. Các ứng dụng như ChatGPT đã tạo lên một sự bùng nổ trên truyền thông đại chúng.
Mặc dù AI đã tồn tại từ nhiều năm nay và lâu hơn nhiều so với
nền văn hóa đại chúng thế giới, nhưng các công cụ như ChatGPT của OpenAI lần đầu
tiên khiến việc triển khai ứng dụng Trí tuệ Nhân tạo (AI) trở nên “thực” ở cấp
độ tiêu dùng thông thường đối với những người thường xuyên “lướt” web.
ChatGPT không phải là công cụ AI duy nhất trở nên phổ biến và
ra mắt trong năm 2022. Đã có hàng loạt các công cụ AI tương tự xuất hiện trong
năm 2022 hoặc sớm hơn một chút mà người dùng có thể khám phá vào năm 2023.
ChatGPT
ChatGPT là công cụ trên trình duyệt hỗ trợ AI được thiết kế
để hiểu, đánh giá và trả lời những câu hỏi dạng dài. Với khả năng hiểu biết
ngôn ngữ loài người chưa từng thấy trước đây, ChatGPT có khả năng trả lời câu hỏi
bằng câu thoại ngắn một dòng, toàn bộ một bài luận và những nội dung khác được
nêu.
Whisper AI
Whisper AI là một công cụ khác của OpenAI, nhưng thay vì đưa
ra phản hồi, công cụ hoạt động như một thiết bị trợ thính. Whisper là hệ thống
nhận dạng giọng nói tự động (ASR) đào tạo dựa trên 680.000 giờ dữ liệu được
giám sát đa ngôn ngữ và đa tác vụ thu thập từ web. Dung lượng dữ liệu lớn và đa
dạng xác định chắc chắn các dấu trọng âm, loại trừ tiếng ồn xung quanh và làm
rõ ngôn ngữ kỹ thuật. Phần mềm AI cho phép phiên âm bằng nhiều ngôn ngữ, dịch từ
các ngôn ngữ đó sang tiếng Anh. Whisper AI là mô hình mã nguồn mở và mã suy luận
làm nền tảng cho xây dựng các ứng dụng hữu ích. Điểm mạnh lớn nhất của Whisper
là khả năng tự cải thiện liên tục và phát triển cao nữa khả năng xác định thông
tin giao tiếp.
Codex
Một sản phẩm khác của OpenAI API, Codex hoạt động với những
chức năng khác so với các công cụ AI phổ biến. Công cụ này đặc biệt có khả năng
dịch ngôn ngữ tự nhiên sang mã mãy tính và thành thạo hơn một chục ngôn ngữ lập
trình như Python, JavaScript, Go, Perl và Ruby và một số ngôn ngữ khác.
Hiện tại, ứng dụng được nhắm mục tiêu vào các trường hợp sử
dụng trong kinh doanh sản xuất phần mềm, nhưng bao gồm những khả năng kỳ diệu
như chỉ cần sử dụng lệnh thoại để điều khiển bất kỳ phần mềm nào trên Giao diện
lập trình ứng dụng API.
Midjourney và DALL-E
Những cái tên nổi tiếng đã nổi lên trong thế giới nghệ thuật
kỹ thuật số, Midjourney và DALL-E là những công cụ được hỗ trợ bởi AI giúp tạo
ra hình ảnh từ các từ dựa trên lời nhắc văn bản.
DALL-E 2 là các mô hình học sâu do OpenAI phát triển để tạo
hình ảnh kỹ thuật số từ các mô tả ngôn ngữ tự nhiên , được gọi là "lời nhắc".
DALL-E được OpenAI giới thiệu trong một bài đăng trên blog
vào tháng 1/2021, sử dụng phiên bản GPT-3 tạo ra hình ảnh. Tháng 4/2022, OpenAI
công bố DALL-E 2, phiên bản tiếp theo được thiết kế để tạo ra hình ảnh chân thực
hơn, độ phân giải cao hơn "có thể kết hợp các ý tưởng, thuộc tính và phong
cách".
Midjourney là một phòng thí nghiệm nghiên cứu độc lập khám
phá các phương tiện tư tư duy và sức mạnh trí tưởng tượng. Công ty cung cấp một
chương trình AI độc quyền cùng tên để tạo ra hình ảnh từ các mô tả văn bản,
tương tự như DALL-E của OpenAI. Công cụ này hiện đang ở giai đoạn thử nghiệm mở,
được đưa vào sử dụng vào ngày 12/7/2022.
Các công cụ này mạnh mẽ đến mức hình thành một thể loại nghệ
thuật hoàn toàn mới cho người dùng, đặc biệt với những người ham thích phát triển
sức tưởng tượng siêu thực bằng hình ảnh.
Rytr
Một công cụ viết nội
dung do AI cung cấp, Rytr được quảng cáo là Nhà văn AI, Trình tạo nội dung
& Trợ lý viết tốt nhất, giúp người dùng tạo nội dung trên quy mô lớn, hỗ trợ
những nhà sáng tạo nội dung nhỏ có được lưu lượng truy cập trên trang web mà
không cần phải thuê những người viết đòi hỏi chi phí cao. Công cụ Rytr sử dụng Máy
học để hiểu ngữ cảnh của bài viết, tạo ra các ý tưởng có liên quan, sau đó sử dụng
các từ hoặc cụm từ hay nhất để chuyển những ý tưởng này thành các bài viết trên
blog.