Meta ra mắt mô hình AI mã nguồn mở “mạnh nhất thế giới”, cạnh tranh cùng OpenAI

Meta vừa ra mắt mô hình AI Llama mới nhất với sự hỗ trợ của Nvidia và các đối tác đám mây của mình. Llama mới bao gồm 3 phiên bản khác nhau với một biến thể lớn nhất, tiềm năng nhất của Meta từ trước tới nay.

Meta đã công bố phiên bản mới nhất của mô hình trí tuệ nhân tạo Llama, được gọi là Llama 3.1. Công nghệ Llama mới nhất có 3 phiên bản khác nhau, với một biến thể là mô hình AI lớn nhất và có khả năng nhất từ ​​Meta cho đến nay. Giống như các phiên bản trước của Llama, mô hình mới nhất vẫn là mã nguồn mở, có nghĩa là có thể truy cập miễn phí.

Mô hình AI mã nguồn mở lớn nhất từ trước đến nay, được công ty tuyên bố vượt trội hơn GPT-4o và Claude 3.5 Sonnet của Anthropic trên một số tiêu chuẩn đánh giá. Họ cũng đang mở rộng trợ lý AI Meta AI dựa trên Llama tới nhiều quốc gia và ngôn ngữ hơn, đồng thời bổ sung tính năng có thể tạo hình ảnh dựa trên diện mạo cụ thể của một người. CEO Mark Zuckerberg hiện dự đoán rằng Meta AI sẽ trở thành trợ lý được sử dụng rộng rãi nhất vào cuối năm nay, vượt mặt cả ChatGPT.

llama-31-1721801465.jpg
Meta đã ra mắt mô hình Llama 3.1 với cấu hình mạnh nhất từ trước đến nay, cạnh tranh cùng OpenAI.

So với các mô hình Llama 3 nhỏ hơn ra mắt cách đây vài tháng, Llama 3.1 phức tạp hơn đáng kể. Phiên bản lớn nhất có 405 tỷ tham số và được huấn luyện với hơn 16.000 GPU H100 cực kỳ đắt tiền của Nvidia. Meta không tiết lộ chi phí phát triển Llama 3.1, nhưng dựa trên chi phí của riêng các chip Nvidia, có thể ước tính con số này lên tới hàng trăm triệu USD.

Nhìn chung, một LLM lớn với nhiều tham số có thể thực hiện các tác vụ phức tạp hơn so với các LLM nhỏ hơn, chẳng hạn như hiểu ngữ cảnh trong các luồng văn bản dài, giải các phương trình toán học phức tạp và thậm chí tạo ra dữ liệu tổng hợp có thể được sử dụng để cải thiện các mô hình AI nhỏ hơn.

Meta cũng đang phát hành các phiên bản nhỏ hơn của Llama 3.1 được gọi là các mô hình Llama 3.1 8B và Llama 3.1 70B. Về cơ bản, chúng là các phiên bản nâng cấp của phiên bản trước và có thể được sử dụng để hỗ trợ chatbot và trợ lý mã hóa phần mềm, công ty cho biết.

Meta cũng cho biết người dùng WhatsApp tại Mỹ của công ty và khách truy cập trang web Meta.AI có thể tiếp cận Llama 3.1 bằng cách tương tác với trợ lý kỹ thuật số của công ty. Trợ lý kỹ thuật số sẽ chạy trên phiên bản Llama mới nhất, sẽ có thể trả lời các bài toán phức tạp hoặc giải quyết các vấn đề về mã hóa phần mềm, một phát ngôn viên của Meta giải thích.

Sự ra mắt của Llama 3.1 cho thấy những nỗ lực của Meta trong việc đuổi theo các mô hình AI hàng đầu của các công ty như OpenAI, Anthropic, Google và Amazon.

Thông báo của Nvidia cũng nhấn mạnh mối quan hệ đối tác ngày càng phát triển giữa Meta và Nvidia. Nhà sản xuất chip AI hàng đầu thế giới hiện đang là đối tác quan trọng của Meta, cung cấp cho công ty mẹ Facebook các chip điện toán gọi là GPU để giúp đào tạo các mô hình AI của mình, bao gồm cả phiên bản Llama mới nhất.

meta-and-nvidia-1721801601.jfif
Meta và Nvidia đang có mối quan hệ khá tốt.

Trong khi các công ty như OpenAI đặt mục tiêu kiếm tiền bằng cách bán quyền truy cập vào LLM độc quyền của họ hoặc cung cấp các dịch vụ giúp khách hàng sử dụng công nghệ, Meta không có kế hoạch ra mắt mô hình cạnh tranh thu phí của riêng mình.

Thay vào đó, công ty đang hợp tác với một số công ty công nghệ để cung cấp cho khách hàng của họ quyền truy cập vào Llama 3.1 thông qua nền tảng điện toán đám mây tương ứng. Một số trong 25 đối tác doanh nghiệp liên quan đến Llama của Meta bao gồm Amazon Web Services, Google Cloud, Microsoft Azure, Databricks và Dell...

Mặc dù CEO của Meta, Mark Zuckerberg đã nói với các nhà phân tích rằng công ty tạo ra một số doanh thu từ các quan hệ đối tác Llama của công ty, một phát ngôn viên của Meta cho biết bất kỳ lợi ích tài chính nào cũng chỉ là gia tăng. Thay vào đó, Meta tin rằng bằng cách đầu tư vào Llama và các công nghệ AI liên quan và cung cấp chúng miễn phí thông qua mã nguồn mở, công ty có thể thu hút được những nhân tài chất lượng cao.

Việc Meta đang đào tạo các mô hình nguồn mở mà các công ty khác có thể sử dụng và điều chỉnh cho doanh nghiệp của họ mà không phải trả phí cấp phép hoặc xin phép có thể mở rộng nhu cầu sử dụng chip của Nvidia.

Các mô hình nguồn mở có thể tốn hàng trăm triệu hoặc hàng tỷ USD để tạo ra. Không có nhiều công ty có khả năng tài chính để phát triển và phát hành các mô hình như vậy với số tiền đầu tư tương tự. Google và OpenAI, mặc dù là khách hàng của Nvidia, nhưng vẫn giữ kín các mô hình tiên tiến nhất của họ.

Mặt khác, Meta cần nguồn cung cấp GPU mới nhất đáng tin cậy để đào tạo các mô hình ngày càng mạnh mẽ. Giống như Nvidia, Meta đang cố gắng thúc đẩy hệ sinh thái các nhà phát triển AI với phần mềm nguồn mở của công ty làm trung tâm.

Ash Jhaveri, Phó Chủ tịch phụ trách quan hệ đối tác AI của công ty, cho biết phương pháp tiếp cận nguồn mở có lợi cho Meta bằng cách cho các nhà phát triển tiếp cận các công cụ nội bộ của công ty và mời họ xây dựng dựa trên công cụ này.

Zuckerberg cho biết, công ty đang áp dụng “cách tiếp cận khác” đối với bản phát hành Llama trong tuần này và nói thêm: “Chúng tôi đang tích cực xây dựng quan hệ đối tác để nhiều công ty trong hệ sinh thái này cũng có thể cung cấp chức năng độc đáo cho khách hàng của họ”.