Công cụ mới của OpenAI có thể sao chép giọng nói chỉ với 15 giây

Trong một thông báo mới nhất, OpenAI cho biết, công nghệ AI mới có thể Voice Engine của họ có thể cho phép “nhân bản” giọng nói của con người chỉ với 15 giây âm thanh.

Voice Engine được đánh giá cao nhờ khả năng tạo ra những lời nói “nghe có vẻ tự nhiên” và “giàu cảm xúc thực tế”.

Công nghệ này đã được phát triển dựa trên thành tựu của một công cụ chuyển văn bản thành giọng nói có sẵn của API, hoạt động từ năm 2022. Với sự tham gia vào quá trình phát triển của OpenAI, các nhà khoa học đã giúp cho các giọng nói trong cơ sở dữ liệu của API trở nên hoàn thiện hơn, hỗ trợ khả năng đọc văn bản một cách tốt hơn.

OpenAI đã đưa ra khá nhiều clip âm thanh minh họa cho tính năng này trên blog của công ty.

voice-engine-1711886966.jpg

OpenAI vừa tạo ra một công cụ mới có khả năng sao chép giọng nói chỉ với 15 giây âm thanh có trước.

OpenAI khẳng định, công nghệ này hữu ích trong hỗ trợ đọc, dịch ngôn ngữ và giúp đỡ những người mắc chứng thoái hóa giọng nói đột ngột và dần mất đi khả năng nói.

Công ty cũng đã đưa công cụ mới vào một chương trình thí điểm tại Đại học Brown. Kết quả cho thấy, những kết quả khả quan trong việc hỗ trợ một bệnh nhân bị chứng suy thoái khả năng ngôn ngữ.

Việc OpenAI công bố công cụ AI mới của họ đang dấy lên những tranh cãi về các mặt tốt và xấu của Voice Engine. Mặt tốt nằm trong mục đích phát triển sản phẩm mà công ty tuyến bố là không thể phủ nhận. Tuy nhiên, mặt xấu cũng không ít tiềm tàng. Cùng với sự phát triển của công nghệ deepfake ngày càng tinh vi, nếu kẻ xấu có được trong tay Voice Engine thì hậu quả sẽ thật khôn ường. Bên cạnh đó, những lo ngại về quyền riêng tư cũng khiến các nhà nghiên cứu phải đối diện với rất nhiều câu hỏi trong thời gian tới.

gettyimages-14580452381-640x381-1711887105.jpg

Khi công nghệ "nhân bản" giọng nói của OpenAI kết hợp với deepfake thì hậu quả sẽ khôn lường.

Bản thân OpenAI cũng thừa nhận, công nghệ này có những rủi ro nghiêm trọng, đặc biệt là thời gian tới, khi những cuộc bầu cử quan trọng diễn ra trên khắp nước Mỹ. Để hạn chế những rủi ro, công ty đang kết hợp phản hồi với các cơ quan, tổ chức, chính phủ, từ khắp các lĩnh vực như khoa học, văn hóa, giáo dục, xã hội, truyền thông…. để tăng cường các biện pháp phòng ngừa.

Tất cả những người tham gia thử nghiệm bản demo của Voice Engine đều phải ký cam kết cụ thể với OpenAI, cấm mạo danh cá nhân khác mà không có sự đồng ý hoặc quyền hợp pháp; phải công khai với người nghe/các khán giả của mình rằng giọng nói được tạo ra bởi AI.

Để nâng cao mức an toàn lên hơn nữa, OpenAI cũng đã dự phòng các biện pháp như hình mờ để theo dõi nguồn gốc của bất kỳ âm thanh nào và giám sát chủ động cách mà hệ thống hoạt động. Khi sản phẩm chính thức được ra mắt, nó sẽ bao gồm một danh sách các giọng nói bị cấm nhằm phát hiện và ngăn chặn hành vi mạo danh người nổi tiếng với những mục đích khác nhau.

Theo các nguồn tin, khả năng Voice Engine sẽ có giá 150 USD cho 1 triệu ký tự, tương đương với khoảng 162.599 từ. Phiên bản cao cấp “HD” thậm chí có giá cao gấp đôi, tuy nhiên công ty chưa tiết lộ nhiều về phiên bản này.

Tuần này, OpenAI cũng đã công bố hợp tác với Microsoft để xây dựng một siêu máy tính dựa trên AI có tên “Stargate” với mức đầu tư khoảng 100 tỷ USD.

Minh Châu

Link nội dung: https://dothi.reatimes.vn/cong-cu-moi-cua-openai-co-the-sao-chep-giong-noi-chi-voi-15-giay-2183.html