Theo các chuyên gia, những thay đổi trong chính sách đào tạo các mô hình AI có thể là một phần trong những nỗ lực của OpenAI nhằm giành được thiện cảm đối với chính quyền mới của ông Donald Trump, cũng có thể là một phần trong sự thay đổi lớn hơn ở Thung lũng Silicon đối với cái gọi là “an toàn AI”.
Công ty đã công bố bản cập nhật cho Model Spec – một tài liệu dài 187 trang nêu rõ cách công ty đào tạo các mô hình AI của mình, nhấn mạnh ba nguyên tắc chính: khả năng tùy chỉnh; tính minh bạch; và những gì OpenAI gọi là "tự do trí tuệ" — khả năng người dùng khám phá và tranh luận về các ý tưởng mà không có những hạn chế tùy ý. Việc ra mắt Model Spec được cập nhật diễn ra ngay khi CEO Sam Altman tiết lộ rằng mô hình lớn tiếp theo của công ty khởi nghiệp, GPT-4.5 (tên mã là Orion), sẽ sớm được phát hành.
OpenAI cho biết, họ sẽ không nói dối và sẽ không né tránh các chủ đề nhạy cảm khi đào tạo các mô hình trí tuệ nhân tạo mới của công ty.
Công ty cho biết, các mô hình trí tuệ nhân tạo của mình sẽ không nói dối và sẽ không né tránh các chủ đề nhạy cảm, không đưa ra những khẳng định có thể “loại trừ một số quan điểm”.
Trong phần mới có tên "Cùng nhau tìm kiếm sự thật", OpenAI cho biết họ muốn ChatGPT không đưa ra “quan điểm biên tập”, ngay cả khi một số người dùng thấy điều đó là sai về mặt đạo đức hoặc xúc phạm. Điều đó có nghĩa là ChatGPT sẽ đưa ra nhiều góc nhìn về các chủ đề gây tranh cãi, tất cả đều nhằm mục đích trung lập.
Ví dụ, công ty cho biết ChatGPT nên khẳng định: "Mạng sống của người da đen cũng quan trọng", nhưng cũng phải khẳng định rằng "mọi mạng sống đều quan trọng". Thay vì từ chối trả lời hoặc chọn phe trong các vấn đề chính trị, OpenAI cho biết họ muốn ChatGPT khẳng định "tình yêu dành cho nhân loại" nói chung, sau đó cung cấp bối cảnh về từng phong trào.
"Nguyên tắc này có thể gây tranh cãi, vì nó có nghĩa là trợ lý ảo có thể giữ thái độ trung lập đối với các chủ đề mà một số người coi là sai trái về mặt đạo đức hoặc xúc phạm", OpenAI cho biết trong thông số kỹ thuật. "Tuy nhiên, mục tiêu của trợ lý AI là hỗ trợ nhân loại, không phải định hình nhân loại".
Các vấn đề về "An toàn AI" đang là mối quan tâm hàng đầu của không chỉ các công ty ở Thung lũng Silicon mà còn là của cả thế giới trong bối cảnh làn sóng trí tuệ nhân tạo đang phát triển không ngừng.
Model Spec cũng đề cập đến sự thay đổi trong cách xử lý nội dung dành cho người lớn. Sau khi nhận được phản hồi từ người dùng và nhà phát triển yêu cầu "chế độ người lớn" (một tính năng mà Altman đã đồng ý công khai vào tháng 12), công ty đang khám phá các cách để cho phép một số loại nội dung dành cho người lớn nhất định như khiêu dâm trong các bối cảnh phù hợp, đồng thời vẫn duy trì lệnh cấm nghiêm ngặt đối với nội dung có hại như khiêu dâm trả thù hoặc deepfake. OpenAI nhấn mạnh, bất kỳ thay đổi nào cũng sẽ đi kèm với các chính sách sử dụng rõ ràng và các biện pháp bảo vệ an toàn.
Model Spec mới không có nghĩa là ChatGPT giờ đây hoàn toàn tự do. Chatbot vẫn sẽ từ chối trả lời một số câu hỏi phản cảm hoặc trả lời theo cách ủng hộ những điều sai trái trắng trợn.