28/01/2025 19:32

CEO OpenAI nói “ấn tượng” khi đánh giá về mô hình AI DeepSeek R1

Giám đốc điều hành của OpenAI, Sam Altman, đã gọi mô hình AI R1 của công ty khởi nghiệp Trung Quốc DeepSeek là "ấn tượng", mặc dù vậy, ông vẫn nhấn mạnh rằng OpenAI tin rằng sức mạnh tính toán lớn hơn chính là chìa khóa thành công của mình.

Theo bài đăng trên tài khoản WeChat chính thức của DeepSeek là DeepSeek-R1, được ra mắt vào tuần trước, có giá thành phải chăng hơn từ 20 đến 50 lần so với mô hình o1 của OpenAI, tùy thuộc vào nhiệm vụ.

"R1 của DeepSeek là một mô hình ấn tượng, đặc biệt là khi xét đến những gì nó có thể mang lại với mức giá này", CEO OpenAI là Sam Altman cho biết trên X.

"Nhưng chủ yếu là chúng tôi rất vui mừng khi tiếp tục thực hiện lộ trình nghiên cứu của mình và tin rằng khả năng tính toán quan trọng hơn bao giờ hết để thành công trong sứ mệnh của chúng tôi", Altman nói thêm.

CEO OpenAI Sam Altman phải nhận định về đối thủ DeepSeek là một mô hình ấn tượng.

Không chỉ Sam Altman, một trong những "bố già AI" Yann LeCun, Giám đốc khoa học AI của Meta cũng có những đánh giá tích cực về mô hình trí tuệ nhân tạo đến từ Trung Quốc này.

Yann LeCun cho biết, bài học lớn nhất từ thành công của DeepSeek không phải sức ép cạnh tranh ngày càng tăng từ Trung Quốc, mà là giá trị của duy trì các mô hình AI dưới dạng mã nguồn mở để mọi người có thể hưởng lợi.

"Vấn đề không phải là AI Trung Quốc vượt qua Mỹ, mà là các mô hình mã nguồn mở đang vượt mặt những mô hình độc quyền", ông cho hay.

DeepSeek R1 dùng mã nguồn mở giống Llama của Meta. Trong khi đó, OpenAI được thành lập với sứ mệnh tạo ra công nghệ vì lợi ích của toàn nhân loại, nhưng gần đây lại chuyển mô hình AI từ nguồn mở sang nguồn đóng.

LeCun nói DeepSeek hưởng lợi từ nghiên cứu mở. "Họ đưa ra những ý tưởng mới và xây dựng chúng trên công trình của người khác. Vì công trình của họ được công bố và dựa trên mã nguồn mở, mọi người đều có thể hưởng lợi. Đó là sức mạnh của nghiên cứu mở và mã nguồn mở", ông nói.

Sự xuất hiện của DeepSeek đã làm dấy lên nghi ngờ về lý do đằng sau quyết định đầu tư hàng tỷ USD vào AI của một số công ty công nghệ Hoa Kỳ và cổ phiếu của một số công ty công nghệ lớn, bao gồm Nvidia.

Nvidia đã chứng kiến mức lỗ kỷ lục trong một ngày là 593 tỷ USD giá trị thị trường vào thứ Hai, đánh dấu mức lỗ trong một ngày lớn nhất đối với bất kỳ công ty nào trên Phố Wall.

Không chỉ dấy lên sự hoài nghi đối với sự đầu tư cho phát triển AI của các công ty trí tuệ nhân tạo, mới đây DeepSeek tiếp tục tạo nên sự kinh ngạc mới sau khi phát hành mô hình AI đa phương thức, tuyên bố đánh bại công cụ tạo ảnh Dall-E 3 của OpenAI.

Các mô hình đang có sẵn để tải về từ nền tảng Hugging Face, nằm trong bộ mô hình mới mà DeepSeek gọi là Janus-Pro. Chúng có kích thước dao động từ 1 tỷ đến 7 tỷ tham số. Số lượng tham số càng lớn, mô hình càng hoạt động tốt hơn.

Bộ công cụ tạo hình ảnh mới mà DeepSeek gọi là Janus-Pro mới ra mắt, tuyên bố đánh bại công cụ tạo ảnh Dall-E 3 của OpenAI.

Janus-Pro có thể phân tích và tạo ra hình ảnh mới. Theo DeepSeek, trên hai phép đo hiệu chuẩn AI GenEval và DPG-Bench, Janus-Pro-7B đánh bại Dall-E 3 cũng như các mô hình khác như PixArt-alpha, Emu3-Gen và Stable Diffusion XL.

Hầu hết các mô hình còn lại của Janus-Pro chỉ có thể phân tích các hình ảnh cỡ nhỏ, độ phân giải tối đa 384 x 384. Dù vậy, hiệu suất quả Janus-Pro vẫn ấn tượng, xét đến kích thước nhỏ gọn của nó.

DeepSeek, startup mới thành lập năm 2023 của Trung Quốc, bất ngờ thu hút chú ý những ngày qua sau khi chatbot của startup này vươn lên dẫn đầu bảng xếp hạng App Store tại Mỹ. Các mô hình ngôn ngữ lớn của startup được đào tạo bằng kỹ thuật tính toán hiệu quả và ít tốn kém chi phí đã khiến Phố Wall đặt câu hỏi liệu Mỹ có thể duy trì vị thế dẫn đầu trong cuộc đua AI không và liệu nhu cầu chip AI có bền vững không.

Minh Châu

Link nội dung: https://dothi.reatimes.vn/ceo-openai-noi-an-tuong-khi-danh-gia-ve-mo-hinh-ai-deepseek-r1-9386.html