ChatGPT có phiên bản mới, gây sởn gai ốc vì khả năng trò chuyện bằng giọng nói như người thật

OpenAI vừa chính thức công bố một phiên bản mới của mô hình trí tuệ nhân tạo lớn hàng đầu của họ là GPT-4o, có khả năng trò chuyện bằng giọng nói thực tế và có thể tương tác qua văn bản bằng hình ảnh,

Mô hình mới vừa được công bố tại một sự kiện phát trực tiếp của OpenAI. Các nhà nghiên cứu đã thể hiện khả năng của GPT-4o như có thể nói chuyện trực tiếp với người dùng và phản hồi theo thời gian thực. Thậm chí, người dùng có thể cắt ngang lời của ChatGPT khi nó đang nói chuyện và nó có phản ứng lại ngay lập tức.

Giám đốc điều hành OpenAI Sam Altman chia sẻ: “Cảm giác giống như AI trên phim vậy. Nói chuyện với máy tính chưa bao giờ thực sự tự nhiên đối với tôi. Tuy nhiên, bây giờ đã khác”.

gpt-4o-1715667734.jpg
Bài đăng của Sam Atlman giới thiệu về "Cô ấy" (GPT - 4o).

Tại sự kiện, các nhà nghiên cứu của OpenAI đã trình diễn khả năng trợ lý giọng nói mới của GPT. Trong một bản demo, ChatGPT đã sử dụng khả năng thị giác và giọng nói của mình để nói chuyện với nhà nghiên cứu cách giải phương trình toán trên một tờ giấy.

Trong một bản demo khác, các nhà nghiên cứu đã cho thấy khả năng dịch ngôn ngữ theo thời gian thực của GPT-4o.

Các cuộc trình diễn của phiên bản mới nhất của GPT khiến nhiều người không khỏi rùng mình so sánh với các bộ phim khoa học viễn tưởng, khi AI và con người có thể đối thoại với nhau một cách linh hoạt, thậm chí có thể đùa cợt… Nhà nghiên cứu của OpenAI nói với Chatbot rằng mình đang khá vui vì “bạn (GPT-4o) hữu ích và tuyệt vời thế nào”. Lúc này, GPT phản hồi lại: “Thôi, dừng lại đi. Bạn làm tôi cảm thấy xấu hổ”.

Sam Altman đã đăng trên X sau khi công bố bản demo về “cô ấy” – một ví dụ thú vị, ám chỉ đến bộ phim được đặt tên năm 2013 của Spike Jonze về một người đàn ông phải lòng trợ lý AI của mình (do Sacrlett Johansson lồng tiếng).

Giám đốc công nghệ của OpenAI là Mira Murati cho biết, mô hình mới sẽ được cung cấp miễn phí vì nó tiết kiệm chi phí hơn so với các mô hình trước đó của công ty. Người dùng GPT-4o trả phí sẽ có được giới hạn dung lượng lớn hơn so với người dùng miễn phí. GPT-4o sẽ có mặt thương mại trong vài tuần tới.

gpt-4o-1715667867.jpg
Giám đốc công nghệ OpenAI là Mira Murati.

Người dùng ChatGPT miễn phí cũng có quyền truy cập và tính năng “browse”, cho phép ứng dụng hiển thị thông tin cập nhật từ web. Công ty cũng không có ý định kiếm tiền từ người dùng miễn phí thông qua việc bán quảng cáo.

ChatGPT được đánh giá là ứng dụng có tốc độ phát triển nhanh nhất lịch sử khi đạt 100 triệu người dùng hoạt động hàng tháng, tuy nhiên theo công ty phân tích Sameweb, lưu lượng truy cập toàn thế giới vào web của ChatGPT đã tăng vọt trong năm qua và hiện chỉ mới quay trở lại mức cao nhất vào tháng 5/2023.

Việc giới thiệu mô hình mới của GPT được triển khai một ngày trước khi Alphabet công bố sẽ tổ chức hội nghị các nhà phát triển Google hàng năm – nơi được cho là sẽ giới thiệu các tính năng AI mới nhất trên các sản phẩm của gã khổng lồ tìm kiếm.

OpenAI hiện đang phải đối mặt với sự cạnh tranh ngày càng nhiều từ phía các đối thủ trong và ngoài ngành. Bên cạnh đó, những yêu cầu mới về luật pháp, về dữ liệu người dùng tại các quốc gia và khu vực cũng ngày càng nhiều hơn. Một số công ty trong ngành thậm chí đã phải bỏ ra những khoản tiền khổng lồ cho người dùng và các nhà xuất bản để có thể sử dụng dữ liệu để đào tạo AI.