Vào tháng 6/2023, Paul Skye Lehrman và bạn là Linnea Sage đang lái xe về nhà, lắng nghe một podcast về các cuộc đình công đang diễn ra ở Hollywood và trí tuệ nhân tạo (AI) có thể ảnh hưởng đến ngành công nghiệp như thế nào. Paul và bạn là người lồng tiếng, giống như những nhà sáng tạo khác, họ lo sợ rằng máy tạo giọng nói giống con người có thể khiến họ bị thay thế trong tương lai. Podcast mà cả hai lắng nghe có một điểm nhấn khá độc đáo: Họ phỏng vấn một bot trò chuyện hỗ trợ AI, được trang bị phần mềm chuyển văn bản thành giọng nói. Người phỏng vấn đã hỏi AI về việc nó sẽ ảnh hưởng thế nào đến công việc ở Hollyworld.
Nhưng khi nói, giọng điệu của nó nghe giống hệt như giọng của Paul khiến họ phải dừng xe lại. “Thật trớ trêu khi AI đang tấn công ngành công nghiệp giải trí, và đây là tiếng nói của tôi, nó được sử dụng để nói về khả năng hủy diệt của ngành công nghiệp này, thực sự rất đáng kinh ngạc."
Đêm đó, họ dành hàng giờ trực tuyến, tìm kiếm manh mối cho đến khi họ tìm thấy trang web của nền tảng chuyển văn bản thành giọng nói Lovo. Khi đến đó, cô Sage cho biết cô cũng tìm thấy một bản sao giọng nói của mình.
Họ hiện đã đệ đơn kiện Lovo ngay sau đó. Cặp đôi cho rằng, công ty đã có được giọng nói của mình bằng thủ đoạn gian dối.
Nhà đồng sáng lập Lovo, Tom Lee trước đây từng nói, phần mềm sao chép giọng nói của họ chỉ cần người dùng đọc khoảng 50 câu để tạo ra bản sao giống hệt giọng nói thật. Trong vụ kiện, cặp đôi này cáo buộc những nhân viên ẩn danh của Lovo đã liên lạc để ghi âm các nội dung âm thanh trên Fiverr, một trang web tìm kiếm tài năng tự do phổ biến, nơi họ bán dịch vụ cung cấp âm thanh cho truyền hình, radio, trò chơi điện tử và các phương tiện truyền thông khác.
Đầu tiên, vào năm 2019, cô Sage cho biết một người dùng đã liên hệ với cô và yêu cầu cô ghi âm hàng chục kịch bản phát thanh thử nghiệm có âm thanh chung chung.
Bản ghi thử nghiệm thường được sử dụng trong phim và truyền hình cho các nhóm tập trung, các cuộc họp nội bộ hoặc làm bản ghi tạm thời cho các tác phẩm đang tiến hành. Vì chúng sẽ không được chia sẻ rộng rãi nên các bản ghi này có giá thành thấp hơn nhiều so với âm thanh dùng để phát sóng.
Cô Sage cho biết cô đã hoàn thành công việc, giao hồ sơ và được trả 400 USD. Khoảng 6 tháng sau, đồng nghiệp của cô là Paul Skye Lehrman cũng nhận được yêu cầu tương tự là ghi âm hàng chục quảng cáo radio có nội dung chung chung.
Trong tin nhắn mà cặp đôi chia sẻ, người dùng Fiverr ẩn danh cho biết đoạn âm thanh sẽ được sử dụng để nghiên cứu về "tổng hợp giọng nói".
Sau khi yêu cầu người dùng đảm bảo rằng các tập lệnh sẽ không được sử dụng ngoài dự án nghiên cứu cụ thể của họ, ông Paul Skye Lehrman đã đặt câu hỏi về mục tiêu của dự án là gì.
"Các tập lệnh sẽ không được sử dụng cho bất kỳ mục đích nào khác", người dùng nói, "và tôi vẫn chưa thể cho bạn biết mục tiêu vì đây là công việc đang được tiến hành ".
Ông Lehrman hỏi liệu các tập tin đã hoàn thành có được sử dụng lại hay theo thứ tự khác không. Người dùng cho biết các tập tin sẽ chỉ được sử dụng cho mục đích nghiên cứu. John cho biết đã giao các tập tin và được trả 1200 USD.
Cả hai người đều nói, họ không có hợp đồng bằng văn bản, chỉ có những cuộc trò chuyện. Họ đã đệ trình một vụ kiện vào tháng 5 cáo buộc Lovo đã sử dụng bản ghi âm giọng nói của mình để tạo ra các bản sao cạnh tranh bất hợp pháp với giọng nói thật của mình mà không được phép và không có khoản bồi thường thỏa đáng.
Đây là vụ kiện tập thể - nghĩa là họ hy vọng những người khiếu nại khác sẽ tham gia, mặc dù cho đến nay vẫn chưa có ai tham gia.
Quyền công khai về sở hữu trí tuệ nhân tạo
Giáo sư Kristelia Garcia, chuyên gia về luật sở hữu trí tuệ tại Đại học Georgetown ở Washington DC, cho biết vụ việc có khả năng tập trung vào một lĩnh vực luật pháp Hoa Kỳ có tên là quyền công khai, theo đó hành vi vi phạm quyền công khai của một người thường xuất phát từ việc sử dụng sai hoặc xuyên tạc hình ảnh hoặc giọng nói của người khác. Bà cũng cho biết có khả năng sẽ xảy ra vi phạm hợp đồng liên quan đến giấy phép mà bà Sage và ông Lehrman đã cấp cho người dùng đã ủy quyền ghi âm.
"Giấy phép là sự cho phép sử dụng một cách rất cụ thể và hạn hẹp. Tôi có thể cấp cho bạn giấy phép sử dụng hồ bơi của tôi vào một buổi chiều nào đó, nhưng điều đó không có nghĩa là bạn có thể đến bất cứ lúc nào bạn muốn và tổ chức tiệc trong hồ bơi của tôi. Điều đó sẽ vượt quá các điều khoản của giấy phép", Giáo sư Kristelia Garcia cho biết.
Bất kể kết quả của vụ kiện là gì, đây là một vụ kiện khác trong danh sách dài các vụ kiện do các nghệ sĩ, tác giả, họa sĩ minh họa và nhạc sĩ đệ đơn vì không muốn mất quyền kiểm soát tác phẩm và sinh kế của mình. Và chúng có thể chỉ là phần nổi của tảng băng chìm.
Một số chuyên gia dự đoán 40% tất cả các công việc cuối cùng sẽ bị ảnh hưởng bởi AI.