Đối thủ của OpenAI ra mắt mô hình trí tuệ nhân tạo mới, Grok 3 – “mạnh nhất thế giới”

Công ty khởi nghiệp trí tuệ nhân tạo xAI của Elon Musk đã chính thức giới thiệu mô hình AI mới nhất của mình, Grok 3 – được cho là mô hình AI mạnh nhất thế giới, có khả năng đánh bại cả GPT-4o của OpenAI.

Trước đó, mô hình Grok 3 của xAI dự kiến sẽ  ra mắt vào năm 2024 nhưng đã lỡ thời hạn đó. Theo công ty, xAI đã sử dụng một trung tâm dữ liệu khổng lồ ở Memphis chứa khoảng 200.000 GPU để đào tạo Grok 3. 

Trong một  bài đăng trên X, ông chủ Elon Musk tuyên bố rằng Grok 3 được phát triển với sức mạnh tính toán lớn hơn “10 lần” so với người tiền nhiệm của nó, Grok 2.

“Grok 3 có khả năng hơn Grok 2 gấp nhiều lần”, Musk cho biết trong bài thuyết trình phát trực tiếp vào thứ Hai, đồng thời nhấn mạnh đây là mô hình “AI tìm kiếm sự thật tối đa, ngay cả khi sự thật đó đôi khi trái ngược với những gì được xem là chính trị đúng đắn”.

screenshot-2025-02-17-at-112353pm-1739875041.webp
Các thành viên của xAI giới thiệu về mô hình trí tuệ nhân tạo mới nhất Grok 3 với năng lực "mạnh hơn cả GPT-4o".

Grok 3 là một họ các mô hình. Trong đó bao gồm một phiên bản nhỏ hơn là Grok 3 mini, có khả năng trả lời các câu hỏi nhanh hơn nhưng độ chính xác sẽ không bằng các phiên bản cao cấp còn lại. Cho tới hiện tại, không phải tất cả các mô hình và tính năng liên quan của Grok 3 đều khả dụng (một số đang trong giai đoạn beta), nhưng chúng đã bắt đầu được tung ra vào thứ Hai.

xAI tuyên bố Grok 3 đánh bại GPT-4o về các điểm chuẩn bao gồm AIME (đánh giá hiệu suất của mô hình trên một mẫu các câu hỏi toán học) và GPQA (đánh giá các mô hình sử dụng các bài toán vật lý, sinh học và hóa học cấp độ tiến sĩ). 

Một phiên bản đầu tiên của Grok 3 cũng đạt điểm cạnh tranh trong Chatbot Arena - một bài kiểm tra do cộng đồng đóng góp, đưa các mô hình AI khác nhau ra so sánh và người dùng bỏ phiếu cho câu trả lời ưa thích của họ.

Hai mô hình còn lại trong họ Grok 3 mới là Grok 3 Reasoning và Grok 3 mini Reasoning, có thể "suy nghĩ thấu đáo" các vấn đề, tương tự như các mô hình "lý luận" o3-mini của OpenAI và R1 của DeepSeek. Các mô hình lý luận này sẽ cố gắng tự kiểm tra thực tế trước khi đưa ra kết quả, giúp chúng tránh được một số cạm bẫy thường khiến các mô hình bị sai sót.

xAI tuyên bố rằng Grok 3 Reasoning vượt trội hơn phiên bản tốt nhất của o3-mini là o3-mini-high trên một số điểm chuẩn phổ biến, bao gồm điểm chuẩn toán học mới hơn có tên là AIME 2025.

Các mô hình lý luận này có thể được truy cập thông qua ứng dụng Grok. Người dùng có thể yêu cầu Grok 3 "Think" (suy nghĩ) hoặc tận dụng chế độ "Big Brain" (Bộ não lớn) để lý luận về những vấn đề phức tạp hơn. 

ss-1739875204.jpg
Bảng so sánh điểm chuẩn một số chỉ tiêu năng lực của Grok 3 với các mô hình trí tuệ nhân tạo hàng đầu hiện nay.

Ngoài ra, các mô hình lý luận của Grok 3  cũng hỗ trợ một tính năng mới có tên là DeepSearch - quét internet và mạng xã hội X để phân tích thông tin và cung cấp bản tóm tắt để trả lời một câu hỏi.

Theo Elon Musk, trong tuần tới, ứng dụng Grok sẽ có "chế độ giọng nói. Vài tuần sau đó, các mô hình Grok 3 sẽ khả dụng thông qua API doanh nghiệp của xAI, cùng với khả năng DeepSearch.

Musk cho biết xAI có kế hoạch mở mã nguồn Grok 2 trong những tháng tới: “Khi Grok 3 đã hoàn thiện và ổn định, có thể là trong vòng vài tháng nữa, thì chúng tôi sẽ mã nguồn mở Grok 2”.

Đáng lưu ý, xAI cho biết Grok 3 khi mới phát hành sẽ có một số lỗi, do đó người dùng có thể gặp một số vấn đề cho đến khi AI "trưởng thành và ổn định"