Các mô hình lý luận AI đáng lẽ đã có thể đã xuất hiện từ cách đây 20 năm

Noam Brown, người đứng đầu nhóm nghiên cứu lý luận AI tại OpenAI cho rằng, một số dạng mô hình AI "lý luận" nhất định có thể đã xuất hiện sớm hơn 20 năm nếu các nhà nghiên cứu "biết phương pháp tiếp cận đúng" và thuật toán chứ không phải đợi đến hiện tại.

Bàn về vấn đề này, Noam Brown phát biểu: “Có nhiều lý do khiến hướng nghiên cứu này bị bỏ qua. Tôi nhận thấy trong quá trình nghiên cứu của mình rằng, OK, có điều gì đó còn thiếu. Con người dành nhiều thời gian để suy nghĩ trước khi hành động trong một tình huống khó khăn. Có lẽ điều này sẽ rất hữu ích trong AI.”

Brown đang nhắc đến công trình của ông về AI chơi trò chơi tại Đại học Carnegie Melon, bao gồm Pluribus, đã đánh bại các chuyên gia ưu tú của con người trong trò chơi poker. Hệ thống AI mà Brown giúp tạo ra là duy nhất vào thời điểm đó theo nghĩa là nó "lý luận" thông qua các vấn đề thay vì cố gắng áp dụng cách tiếp cận thô bạo hơn.

Brown là một trong những kiến trúc sư đằng sau o1, một mô hình mà AI OpenAI đã sử dụng một kỹ thuật gọi là suy luận thời gian thử nghiệm để "suy nghĩ" trước khi phản hồi các truy vấn. Suy luận thời gian thử nghiệm đòi hỏi phải áp dụng thêm tính toán vào các mô hình đang chạy để thúc đẩy một dạng "lý luận". Các nhà khoa học nhất trí gọi gọi nó là mô hình lý luận chính xác và đáng tin cậy hơn các mô hình truyền thống, đặc biệt là trong các lĩnh vực như toán học và khoa học.

math-ai-brownmv0k4unj-z1eklo0-1742428708.webp

Trưởng nhóm nghiên cứu OpenAI Noam Brown.

Brown thừa nhận rằng điều đó trở nên khó khăn hơn trong những năm gần đây khi các mô hình ngày càng đòi hỏi nhiều điện toán hơn, nhưng giới học thuật có thể tạo ra tác động bằng cách khám phá các lĩnh vực đòi hỏi ít điện toán hơn, như thiết kế kiến trúc mô hình.

Bình luận của Brown được đưa ra vào thời điểm chính quyền của tổng thống Donald Trump đang cắt giảm mạnh các khoản tài trợ khoa học. Các chuyên gia AI bao gồm cả người đoạt giải Nobel Geoffrey Hinton đã chỉ trích những khoản cắt giảm này, nói rằng chúng có thể đe dọa các nỗ lực nghiên cứu AI trong và ngoài nước.

Brown gọi chuẩn AI là một lĩnh vực mà học viện có thể tạo ra tác động đáng kể. Ông cho biết "Tình trạng chuẩn AI thực sự tệ và không đòi hỏi nhiều tính toán để thực hiện".

"Như chúng tôi đã viết trước đây, các chuẩn AI phổ biến hiện nay có xu hướng kiểm tra  kiến thức chuyên sâu và đưa ra điểm số không tương quan với trình độ thành thạo trong các nhiệm vụ mà hầu hết mọi người quan tâm. Điều đó dẫn đến sự nhầm lẫn rộng rãi về khả năng và cải tiến của các mô hình", Brown nói.

Liên quan tới cuộc chạy đua tạo ra các mô hình lý luận AI tiên tiến, mới đây OpenAI cũng đã ra mắt phiên bản mạnh mẽ hơn của mô hình AI “lý luận” o1  là o1-pro trong API dành cho nhà phát triển.

Theo công ty, o1-pro sử dụng nhiều tính toán hơn o1 để cung cấp "phản hồi tốt hơn một cách nhất quán". Hiện tại, nó chỉ khả dụng cho một số nhà phát triển được chọn — những người đã chi ít nhất 5 USD cho các dịch vụ API OpenAI và nó rất đắt.

images-15-1742428905.jpg

OpenAI mới đây cũng đã tung ra mô hình lý luận AI o1-pro, một mô hình cực đắt đỏ nhưng được kỳ vọng là sẽ đem lại hiệu suất cao hơn cho các nhà nghiên cứu.

OpenAI tính phí 150 USD cho mỗi triệu token ( tương đương 750.000 từ) được đưa vào mô hình và 600 USD cho mỗi triệu token do mô hình tạo ra. Giá này gấp đôi GPT-4.5 của OpenAI cho đầu vào và gấp 10 lần giá của o1 thông thường.

OpenAI đang đặt cược rằng hiệu suất được cải thiện của o1-pro sẽ thuyết phục các nhà phát triển chi trả số tiền lớn đó.

Tuy nhiên, những ấn tượng ban đầu về o1-pro, đã có sẵn trên nền tảng chatbot hỗ trợ AI ChatGPT của OpenAI dành cho những người đăng ký ChatGPT Pro kể từ tháng 12, lại không mấy tích cực. Người dùng phát hiện ra rằng mô hình này gặp khó khăn với các câu đố Sudoku và bị vấp ngã bởi những trò đùa ảo ảnh quang học đơn giản.

Hơn nữa, một số chuẩn mực nội bộ của OpenAI từ cuối năm ngoái cho thấy o1-pro chỉ hoạt động tốt hơn một chút so với o1 tiêu chuẩn về mã hóa và các bài toán. Tuy nhiên, các chuẩn mực cho thấy nó trả lời các bài toán đó đáng tin cậy hơn.