Alibaba phát hành mô hình AI mới, tự quảng cáo là vượt trội hơn DeepSeek

Minh Châu

07:30 30/01/2025

Tập đoàn công nghệ Alibaba của Trung Quốc vừa phát hành một phiên bản mới của mô hình trí tuệ nhân tạo Qwen 2.5, với mô hình này họ tuyên bố vượt trội hơn DeepSeek-V3. Điều này đang thu hút sự quan tâm của giới công nghệ toàn cầu.

Thời điểm phát hành Qwen 2.5-Max khá đặc biệt: vào ngày đầu tiên của kỳ nghỉ lễ Tết Nguyên đán, khi hầu hết người dân Trung Quốc được nghỉ làm và ở bên gia đình. Điều này cho thấy phần nào áp lực của các công ty công nghệ Trung Quốc trước làn sóng xoay quanh sự tiến bộ của DeepSeek trong thời gian qua.

Alibaba cho biết trong một bài viết đăng tải trên tài khoản WeChat chính thức của doanh nghiệp: “Qwen 2.5-Max vượt trội hơn hầu hết các mô hình GPT-4o, DeepSeek-V3 và Llama-3.1-405B".

Alibaba tự tin vào mô hình AI mới của mình, mạnh mẽ hơn nhiều mô hình AI hàng đầu khác của các công ty trí tuệ nhân tạo như OpenAI, Google, DeepSeek...

Việc phát hành trợ lý AI DeepSeek vào ngày 10/1, sử dụng mô hình DeepSeek-V3, cũng như việc phát hành mô hình R1 vào ngày 20/1 đã gây chấn động Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc. Bởi vì với chi phí phát triển và sử dụng được cho là thấp bất ngờ của công ty khởi nghiệp Trung Quốc đã khiến các nhà đầu tư đặt câu hỏi về kế hoạch chi tiêu khổng lồ của các công ty AI hàng đầu tại Mỹ.

Tuy nhiên, thành công của DeepSeek không chỉ khiến các công ty công nghệ của Mỹ “choáng váng” mà còn dẫn đến một cuộc chạy đua giữa các đối thủ cạnh tranh tại Trung Quốc để nâng cấp các mô hình AI của riêng họ.

Hai ngày sau khi DeepSeek-R1 được phát hành, chủ sở hữu TikTok là ByteDance cũng đã phát hành Doubao-1.5-pro, bản nâng cấp cho mô hình AI chủ lực của mình, được cho là vượt trội hơn o1 của OpenAI trong AIME - một bài kiểm tra chuẩn đánh giá mức độ hiểu và phản hồi của các mô hình AI với các hướng dẫn phức tạp.

DeepSeek đã thu hút sự chú ý rộng rãi trong giới AI toàn cầu vào tháng trước sau khi các cuộc thử nghiệm cho thấy mô hình ngôn ngữ lớn V3 của công ty này vượt trội hơn so với OpenAI và Meta, mặc dù có ngân sách phát triển nhỏ hơn và có kế hoạch tính phí người dùng ít hơn rất nhiều.

Tiền thân của mô hình V3 của DeepSeek là DeepSeek-V2, đã gây ra một cuộc chiến về giá mô hình AI tại Trung Quốc sau khi được phát hành vào tháng 5 năm ngoái.

Thực tế là DeepSeek-V2 là mã nguồn mở và có giá rẻ chưa từng có, chỉ 1 nhân dân tệ (0,14 USD) cho 1 triệu token - đơn vị dữ liệu được xử lý bởi mô hình AI - đã khiến đơn vị đám mây của Alibaba phải công bố mức giảm giá lên tới 97% cho một loạt các mô hình.

Liang Wenfeng, nhà sáng lập bí ẩn của DeepSeek cho biết, công ty khởi nghiệp này "không quan tâm" đến cuộc chiến giá cả và việc đạt được AGI (trí tuệ nhân tạo tổng quát) là mục tiêu chính của họ.

Liang Wenfeng, nhà khoa học bí ẩn đứng sau mô hình AI DeepSeek đang gây "sóng gió" trên thị trường AI toàn cầu.

Trong khi các công ty công nghệ lớn của Trung Quốc như Alibaba có hàng trăm nghìn nhân viên, DeepSeek hoạt động như một phòng thí nghiệm nghiên cứu, chủ yếu gồm những sinh viên mới tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc.

Trong cuộc phỏng vấn vào tháng 7, Liang cho biết ông tin rằng các công ty công nghệ lớn nhất Trung Quốc có thể không phù hợp với tương lai của ngành công nghiệp AI, khi so sánh chi phí cao và cơ cấu áp đặt từ trên xuống của họ với hoạt động tinh gọn và phong cách quản lý lỏng lẻo của DeepSeek.

Ông nói thêm, "Các mô hình nền tảng lớn đòi hỏi sự đổi mới liên tục, còn khả năng của những gã khổng lồ công nghệ thì có giới hạn".