NVIDIA ra mắt 4 nền tảng suy luận tùy chỉnh cho những ứng dụng AI tổng quát mới nổi như chatbot, chuyển đổi văn bản thành hình ảnh, video, kết hợp với các dịch vụ đám mây đưa AI đến mọi lĩnh vực công nghệ.
Trí tuệ Nhân tạo (AI) sáng tạo đã cách mạng hóa nhiều ngành công nghiệp khác nhau trên cơ sở những tiến bộ công nghệ trong học máy, sức mạnh tính toán và tính sẵn có của cơ sở dữ liệu.
Những tập đoàn công nghệ hàng đầu như Microsoft và Google đã áp dụng các công nghệ AI tổng quát để tạo ra các ứng dụng mang tính đột phá. Microsoft đã tích hợp AI vào các sản phẩm như Bing, ứng dụng di động Edge và Skype.
Người dùng cũng có thể thấy được những ứng dụng Trí tuệ Nhân tạo (AI) gần đây của Google trong những dịch vụ như Google Cloud, MakerSuite và Google Workspace, cung cấp cho các nhà phát triển và doanh nghiệp những công cụ tiên tiến nhất trên cơ sở AI.
Đến thời điểm này, nhà cung cấp sức mạnh tính toán cho AI, công ty NVIDIA giới thiệu cho thế giới thấy được những phát minh AI sáng tạo của doanh nghiệp.
Khi AI tổng quát mở rộng, những ứng dụng tiềm năng và ảnh hưởng của công nghệ AI trên nhiều lĩnh vực gia tăng nhanh chóng. Tại Hội nghị Công nghệ GPU do NVIDIA tổ chức (GTC), công ty giới thiệu 4 nền tảng suy luận, được thiết kế riêng cho hàng loạt những ứng dụng AI tổng quát mới ra mắt, cho phép các nhà phát triển nhanh chóng tạo ra những ứng dụng điều khiển bằng AI chuyên biệt, cung cấp những dịch vụ mới và đưa ra những ý tưởng sáng tạo mới.
Những nền tảng này là sự kết hợp bộ phần mềm suy luận toàn diện của NVIDIA với những bộ xử lý NVIDIA Ada, Hopper và Grace Hopper tiên tiến nhất, bao gồm GPU NVIDIA L4 Tensor Core và GPU NVIDIA H100 NVL. Mỗi nền tảng đều được tinh chỉnh để đáp ứng khối lượng công việc có nhu cầu cao như xử lý video AI, tạo hình ảnh từ lời nhắc, triển khai mô hình ngôn ngữ lớn và suy luận đề xuất.
Jensen Huang, nhà sáng lập kiêm Giám đốc điều hành (CEO) của NVIDIA trong một bài phát biểu đã nhấn mạnh, sự phát triển nổi bật ngày càng tăng của AI tổng quát đòi hỏi phải có những nền tảng điện toán suy luận mạnh mẽ hơn. Ông nhấn mạnh: “Số lượng ứng dụng cho AI tổng hợp là vô hạn, chỉ giới hạn trong khuôn khổ trí tưởng tượng của con người. Việc trang bị cho các nhà phát triển nền tảng điện toán suy luận mạnh mẽ và linh hoạt đỉnh cao sẽ đẩy nhanh tiến trình tạo ra những dịch vụ mới, giúp phát triển và hoàn thiện cuộc sống của chúng ta theo những cách chưa từng có,” ông nói thêm.
Người sáng lập kiêm Giám đốc điều hành NVIDIA Jensen Huang với bộ xử lý NVIDIA DGX H100 trong bài phát biểu quan trọng tại GTC.
Tăng tốc tập hợp khối lượng công việc suy luận đa dạng của AI tổng quát
Mỗi nền tảng được nêu đều có GPU NVIDIA, tối ưu hóa cho khối lượng công việc suy luận AI tổng quát cụ thể, cùng với phần mềm chuyên dụng. Bộ xử lý đầu tiên NVIDIA L4, theo Ian Buck, Phó chủ tịch Hyperscale và HPC tại NVIDIA, có yếu tố hình thức nhỏ gọn.
Bộ GPU một khe nhỏ, cấu hình thấp này phù hợp với bất kỳ máy chủ nào, có tính năng xử lý video AI vượt trội, cho tốc độ tính toán nhanh gấp 120 lần so với máy chủ CPU thông thường, khiến đầu tư phần cứng giảm hơn 120 lần và mức tiêu thụ năng lượng ít hơn 99%.
Bộ vi xử lý GPU NVIDIA L4 dành cho video AI. Ảnh Tech Wire Asia
GPU NVIDIA L4 rất linh hoạt phù hợp với nhiều công việc khác nhau có khối lượng tính toán lớn như giải mã và chuyển mã video nâng cao, truyền phát video, thực tế tăng cường và video AI tổng hợp.
Bộ xử lý AI NVIDIA L40 ứng dụng cho Tạo hình ảnh, một nền tảng khác, được thiết kế để tạo đồ họa và tạo hình ảnh 2D, video và 3D với hỗ trợ AI. GPU cung cấp sức mạnh tính toán cho NVIDIA Omniverse, một nền tảng được sử dụng để phát triển và vận hành các ứng dụng metaverse trong trung tâm dữ liệu, cung cấp hiệu suất suy luận gấp 7 so với Hiệu suất Khuếch tán ổn định và hiệu suất Omniverse cao gấp 12 lần so với những phiên bản tiền nhiệm.
Bộ xư lý NVIDIA H100 NVL sử dụng cho triển khai những mô hình ngôn ngữ lớn (LLM), lý tưởng để triển khai những LLM như ChatGPT trên quy mô rộng. Với bộ nhớ 94GB và khả năng tăng tốc của Công cụ Máy học (Transformer Engine), H100 NVL đạt được hiệu suất suy luận nhanh hơn tới 12 lần cho GPT-3, sử dụng bộ xử lý A100 thế hệ trước ở quy mô Trung tâm dữ liệu.
“GPU tuyệt vời này giảm đáng kể tổng chi phí sở hữu (TCO) để chạy và thực hiện suy luận trên những mô hình ngôn ngữ lớn và trên nền tảng GPT. Bộ xử lý đóng vai trò quan trọng trong tiến trình dân chủ hóa GPT và những mô hình ngôn ngữ lớn, cho phép sử dụng rộng rãi trong cộng đồng người dùng phi kiến thức AI,” Buck nói.
Tăng tốc liên kết hợp tác AI tổng quát
Google Cloud, đối tác đám mây quan trọng và là khách hàng đầu tiên của những nền tảng suy luận do NVIDIA phát triển đang tích hợp nền tảng L4 vào nền tảng Máy học của doanh nghiệp, Vertex AI. Công ty cũng là dịch vụ đám mây đầu tiên, cung cấp những phiên bản L4 thông qua bản xem trước riêng tư của các máy ảo G2.
NVIDIA và Google trong các thông báo riêng rẽ cho biết, Descript và WOMBO là một trong những tổ chức đầu tiên có quyền truy cập sớm vào L4 trên Google Cloud. Descript sử dụng trí tuệ nhân tạo AI hỗ trợ người sáng tạo sản xuất video và podcast, WOMBO cung cấp ứng dụng chuyển văn bản thành tác phẩm nghệ thuật kỹ thuật số, có tên gọi là Dream trên nền tảng AI.
NVIDIA hợp tác với Microsoft cung cấp cho người dùng - doanh nghiệp quyền truy cập vào tài nguyên siêu máy tính công nghiệp và siêu máy tính AI thông qua dịch vụ đám mây Microsoft Azure. Sự hợp tác này bao gồm NVIDIA Omniverse Cloud và NVIDIA DGX Cloud, kết nối những ứng dụng của Microsoft 365 với NVIDIA Omniverse. Trong đó NVIDIA Omniverse ™ Cloud là nền tảng dạng dịch vụ (PaaS) cung cấp cho các nhà phát triển và doanh nghiệp một môi trường đám mây toàn ngăn để thiết kế, phát triển, triển khai và quản lý những ứng dụng metaverse công nghiệp.
NVIDIA mang trí tuệ nhân tạo đến mọi nơi, lên một tầm cao mới
Bốn nền tảng suy luận của NVIDIA được tối ưu hóa cho một tập hợp đa dạng ứng dụng AI tổng quát đang phát triển nổi bật nhanh chóng, từ trái sang phải: L4 dành cho video AI, L40 dành cho phát triển hình ảnh, H100 NVL dành cho LLM và Grace Hopper dành cho các mẫu đề xuất.
Những quan hệ đối tác này sẽ thúc đẩy nhanh quá trình chuyển đổi số của doanh nghiệp, tham gia vào siêu dữ liệu công nghiệp và đào tạo những mô hình tiên tiến trên nền tảng AI tổng quát và những ứng dụng khác.
Ông Jensen Huang cho biết: “Những công ty lớn nhất thế giới đang chạy đua để số hóa mọi lĩnh vực kinh doanh sản xuất, tự chuyển đổi trở thành các công ty công nghệ do phần mềm xác định. Những nền tảng Trí tuệ nhân tạo như NVIDIA AI và Omniverse hỗ trợ tăng cường chuyển đổi số công nghiệp. Việc xây dựng NVIDIA Omniverse Cloud trong Microsoft Azure mang đến cho khách hàng những khả năng kết hợp tốt nhất của cả hai doanh nghiệp trong chuyển đổi số.”
Mang AI đến với các doanh nghiệp trên thế giới bằng những dịch vụ đám mây
NVIDIA đang giới thiệu một bộ sưu tập những dịch vụ đám mây, cho phép các doanh nghiệp tạo, tinh chỉnh và triển khai những mô hình ngôn ngữ lớn tùy chỉnh và những mô hình AI tổng quát, phù hợp với các tác vụ cụ thể bằng phương pháp sử dụng dữ liệu độc quyền của từng doanh nghiệp. Các công ty Adobe, Getty Images, Morningstar, Quantiphi và Shutterstock sẽ tận dụng những dịch vụ tạo mô hình của NVIDIA AI Foundation trong các môi trường ngôn ngữ, hình ảnh, video và mô phỏng 3D.
Các doanh nghiệp có thể phát triển các ứng dụng AI tổng quát tùy chỉnh, dành riêng cho từng miền cụ thể bằng phương pháp sử dụng dịch vụ ngôn ngữ NVIDIA NeMo và dịch vụ hình ảnh, video và 3D NVIDIA Picasso. NVIDIA cũng công bố những mô hình mới cho dịch vụ đám mây NVIDIA BioNeMo trong lĩnh vực sinh học.
Các dịch vụ NVIDIA NeMo và Picasso có thể được truy cập thông qua trình duyệt trên Đám mây NVIDIA DGX, cung cấp những mô hình đã được đào tạo trước đó, khung xử lý dữ liệu, cơ sở dữ liệu vector, công cụ suy luận được tối ưu hóa, API và sự hỗ trợ kỹ thuật từ các chuyên gia NVIDIA.
Dịch vụ NeMo cho phép các nhà phát triển điều chỉnh những mô hình ngôn ngữ lớn (LLM) cho phù hợp với nhu cầu kinh doanh, đồng thời dịch vụ NVIDIA Picasso tối ưu và hợp lý hóa công nghệ mô phỏng và thiết kế sáng tạo trên các trường hình ảnh, video và 3D.
NVIDIA và Adobe đang mở rộng quan hệ đối tác R&D của hai doanh nghiệp nhằm phát triển các mô hình AI tổng quát tiên tiến, tập trung vào tính minh bạch và Thông tin xác thực nội dung. Một số mô hình này sẽ được tích hợp vào những sản phẩm dịch vụ Adobe Creative Cloud và NVIDIA Picasso.
Hiện NVIDIA cũng đang hợp tác với Getty Images nhằm tạo ra các mô hình nền tảng chuyển văn bản thành hình ảnh và văn bản thành video tổng quát có trách nhiệm, sử dụng những nội dung được cấp phép đầy đủ, không vi phạm bản quyền tác giả.
NVIDIA cũng đang hợp tác với Shutterstock để phát triển mô hình nền tảng chuyển văn bản thành hình ảnh kỹ thuật số 3D tổng quát, sử dụng dịch vụ NVIDIA Picasso nhằm đơn giản hóa tiến trình tạo mô hình 3D. Shutterstock sẽ cung cấp mô hình tạo 3D này trên nền tảng, phát triển khả năng tạo nội dung 3D và đẩy nhanh quá trình phát triển cặp song sinh kỹ thuật số công nghiệp và bố cục thế giới ảo 3D trong NVIDIA Omniverse.