Mô hình AI chuyên về toán học của Alibaba có gì đặc biệt?

Alibaba Group Holding (Alibaba) đang đặt mục tiêu nâng cao tiêu chuẩn trong phát triển trí tuệ nhân tạo (AI) bằng cách ra mắt một nhóm các mô hình ngôn ngữ lớn (LLM) chuyên về toán học có tên là Qwen2-Math. Công ty tuyên bố nhóm này có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực.

“Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lý luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học và toán học của chúng”, đại diện nhóm Qwen, một bộ phận của đơn vị điện toán đám mây Alibaba cho biết.

Theo đó, các LLM mới nhất của công ty được xây dựng trên các LLM Qwen2 do Alibaba phát hành vào tháng 6 trước đó, bao gồm ba mô hình dựa trên thang tham số của chúng – thuật ngữ máy học dành cho các biến có trong hệ thống AI suốt quá trình đào tạo, giúp thiết lập cách dữ liệu nhắc nhở tạo ra đầu ra mong muốn.

llm-toan-hoc-1723359534.jpg

Trước đó, một số thử nghiệm cho thấy nhiều mô hình LLM lớn trên thế giới bao gồm ChatGPT, Qwen LLM cũng phải "đau đầu" vì những bài toán cơ bản.

Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất, Qwen2-Math-72B-Instruct, đã vượt trội hơn các LLM độc quyền do Mỹ phát triển trong các chuẩn mực toán học. Những chuẩn mực đó bao gồm GPT-4o, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama -3.1-405B của Meta Platforms.

Bài đăng của nhóm nghiên cứu cho biết: "Chúng tôi hy vọng Qwen2-Math có thể đóng góp cho cộng đồng trong việc giải quyết các bài toán phức tạp".

Cũng theo thông báo phát đi, các mô hình AI Qwen2-Math đã được thử nghiệm trên cả chuẩn toán tiếng Anh và tiếng Trung. Trong đó bao gồm GSM8K, một tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ chất lượng cao; OlympiadBench, một chuẩn khoa học đa phương thức song ngữ cấp cao; và gaokao - kỳ thi tuyển sinh đại học khó khăn của Trung Quốc đại lục.

Nhóm Qwen cho biết, các mô hình mới vẫn còn một số hạn chế do "chỉ hỗ trợ tiếng Anh". Theo kế hoạch, nhóm sẽ sớm phát hành các mô hình song ngữ, với các LLM đa ngôn ngữ cũng đang trong quá trình phát triển.

Các mô hình toán học cụ thể của Alibaba càng củng cố thêm uy tín về AI của công ty có trụ sở tại Hàng Châu này sau khi chương trình LLM Qwen-72B-Instruct của công ty này gần đây đã dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giới.

thong-tri-thien-van-llm-1723360335.jpg

Các mô hình LLM của Tongyi Quanwen đang phát triển mạnh mẽ khả năng về toán học.

Tongyi Qianwen đã mở cửa cho các nhà phát triển bên thứ ba trong hơn một năm. Mã nguồn mở cung cấp quyền truy cập công khai vào mã nguồn của chương trình, cho phép các nhà phát triển phần mềm bên thứ ba sửa đổi hoặc chia sẻ thiết kế, sửa các liên kết bị hỏng hoặc mở rộng khả năng của chương trình.

Sự công nhận dành cho nhóm mô hình ngôn ngữ lớn của Alibaba Group Holding cho thấy sự tiến bộ nhanh chóng của công ty trong lĩnh vực trí tuệ nhân tạo. Vào tháng 7, Qwen2-72B-Instruct đã được xếp hạng ngay sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng LLM của SuperClue - một nền tảng đánh giá chuẩn mực đánh giá các mô hình dựa trên các số liệu như tính toán, suy luận logic, mã hóa và hiểu văn bản, cùng nhiều số liệu khác.

Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Hoa Kỳ dường như đang thu hẹp lại khi Trung Quốc đại lục đã đạt được tiến bộ đáng kể trong việc thúc đẩy các chương trình LLM trong nước trong nửa đầu năm nay.

Một bài kiểm tra riêng biệt được công bố vào tháng 7 bởi LMSYS - một tổ chức nghiên cứu mô hình AI được Đại học California, Berkeley hỗ trợ - cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Minh Châu

Link nội dung: https://dothi.reatimes.vn/mo-hinh-ai-chuyen-ve-toan-hoc-cua-alibaba-co-gi-dac-biet-5626.html