OpenAI ra mắt mô hình AI nhỏ, giá rẻ hơn GPT-4o mini

Nhà sản xuất ChatGPT, OpenAI, cho biết sẽ ra mắt GPT-4o mini, một mô hình AI nhỏ tiết kiệm chi phí, nhằm mục đích làm cho công nghệ của họ có giá cả phải chăng hơn và ít tốn năng lượng hơn, tiếp cận được nhiều người dùng hơn.

Được Microsoft hậu thuẫn phía sau, OpenAI - công ty dẫn đầu thị trường trong lĩnh vực phần mềm AI, đã nỗ lực giúp các nhà phát triển xây dựng các ứng dụng dựa trên mô hình của mình nhanh hơn và rẻ hơn. Đặt trong bối cảnh các đối thủ lớn như Meta, Google đang nỗ lực giành lấy thị phần, OpenAI cũng đang âm thầm phát triển nhiều mô hình AI mới để đa dạng hơn nữa tệp khách hàng của mình.

openai-1721373702.jfif
Mô hình GPT-4o Mini có sức mạnh tính toán ít hơn, giá thành rẻ hơn so với các mô hình tiêu chuẩn của OpenAI, vì vậy có khả năng tiếp cận nhiều đối tượng khách hàng hơn.

Nhà sản xuất ChatGPT cho biết, GPT-4o mini sẽ được cung cấp với giá 15 cent cho mỗi triệu token đầu vào và 60 cent cho mỗi triệu token đầu ra, rẻ hơn 60% so với GPT-3.5 Turbo. Mặc dù nhỏ hơn, mô hình này thậm chí còn vượt trội hơn GPT-4 về tùy chọn trò chuyện và đạt 82% về mức độ hiểu ngôn ngữ đa nhiệm hàng loạt (MMLU).

MMLU là chuẩn mực về trí thông minh và lý luận văn bản được sử dụng để đánh giá khả năng của các mô hình ngôn ngữ. Điểm MMLU cao hơn có nghĩa là nó có thể hiểu và sử dụng ngôn ngữ tốt hơn trên nhiều lĩnh vực, nâng cao khả năng sử dụng trong thế giới thực.

Theo OpenAI, điểm số của mô hình mini GPT-4o cao hơn so với 77,9% của Gemini Flash của Google và 73,8% của Claude Haiku của Anthropic.

GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất mà OpenAI cung cấp.  

Các mô hình ngôn ngữ nhỏ hơn đòi hỏi ít sức mạnh tính toán hơn để chạy, khiến chúng trở thành lựa chọn hợp lý hơn cho các công ty có nguồn lực hạn chế muốn triển khai AI tạo sinh trong hoạt động của mình.

Với mô hình thu nhỏ hiện đang hỗ trợ văn bản và API trong giao diện lập trình ứng dụng, OpenAI cho biết hỗ trợ đầu vào và đầu ra văn bản, hình ảnh, video và âm thanh sẽ được cung cấp trong tương lai.

OpenAI không tiết lộ chính xác GPT-4o mini lớn đến mức nào, nhưng cho biết nó gần như cùng cấp với các mô hình AI nhỏ khác, chẳng hạn như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, công ty tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu trong ngành.

bieu-do-so-sanh-1721374406.jpg
Biểu đồ so sánh các mô hình AI nhỏ từ Artificial Analysis. Đơn vị tính dựa trên sự kết hợp của các mã thông báo đầu vào và đầu ra.

“So với các mô hình tương đương, GPT-4o mini rất nhanh, với tốc độ đầu ra trung bình là 202 token mỗi giây”, George Cameron, Đồng sáng lập đơn vị phân tích dữ liệu Artificial Analysis, cho biết trong email gửi TechCrunch.

OpenAI cho biết, bắt đầu từ thứ Năm tuần này, người dùng các gói Free, Plus và Team của ChatGPT sẽ có thể truy cập GPT-4o mini — có dữ liệu đào tạo đến tháng 10 năm 2023 thay cho GPT-3.5 Turbo, còn người dùng doanh nghiệp sẽ có quyền truy cập bắt đầu từ tuần tới.

"Để mọi ngóc ngách trên thế giới được AI hỗ trợ, chúng ta cần phải làm cho các mô hình trở nên dễ tiếp cận hơn nhiều. Tôi nghĩ GPT-4o mini là một bước tiến thực sự lớn theo hướng đó", Olivier Godement, giám đốc API sản phẩm của OpenAI, cho biết.