Meta công bố mô hình AI mới có thể tạo video có âm thanh, "xịn" hơn cả Sora của OpenAI

Meta – chủ sở hữu của Facebook và Instagram đang tiến gần hơn với mục tiêu Vũ trụ ảo Metaverser khi vừa giới thiệu thành công mô hình AI mới Movie Gen có thể tạo ra các đoạn video và âm thanh có vẻ chân thực, chất lượng không hề kém cạnh các đối thủ cạnh tranh.

Meta, chủ sở hữu của Facebook và Instagram, đã công bố vào thứ sáu rằng họ đã xây dựng một mô hình trí tuệ nhân tạo mới có tên là Movie Gen có thể tạo ra các đoạn video và âm thanh có vẻ ngoài chân thực để phản hồi lời nhắc của người dùng, đồng thời tuyên bố rằng nó có thể cạnh tranh với các công cụ từ các công ty khởi nghiệp truyền thông hàng đầu như OpenAI và ElevenLabs.

Trong tuyên bố mới phát đi trên blog của mình ngày hôm qua, Meta cho biết: “Nghiên cứu mới nhất của chúng tôi chứng minh cách bạn có thể sử dụng các đầu vào văn bản đơn giản để tạo video và âm thanh tùy chỉnh, chỉnh sửa video hiện có và biến hình ảnh cá nhân của bạn thành một video độc đáo. Movie Gen vượt trội hơn các mô hình tương tự trong ngành trên các tác vụ này khi được con người đánh giá”.

1x-1-1728082341.webp
 

Công ty cũng đã đưa ra ví dụ về tính năng mới của Movie Gen với các mẫu sáng tạo bao gồm một số video về động vật bơi lội và lướt sóng, cũng như các clip sử dụng ảnh thật của mọi người để mô tả họ đang thực hiện các hành động như vẽ tranh trên vải.

Công ty nhấn mạnh, mặc dù có nhiều trường hợp sử dụng thú vị cho các mô hình nền tảng này, nhưng điều quan trọng cần lưu ý là AI tạo sinh không phải là sự thay thế cho công việc của các nghệ sĩ và họa sĩ hoạt hình. Meta chia sẻ nghiên cứu này vì họ tin vào sức mạnh của công nghệ AI trong việc giúp mọi người thể hiện bản thân theo những cách mới và tạo cơ hội cho những người khác. 

Meta khẳng định, Movie Gen là bộ mô hình kể chuyện tiên tiến và nhập vai nhất. Mô hình AI mới có bốn khả năng: tạo video, tạo video được cá nhân hóa, chỉnh sửa video chính xác và tạo âm thanh. Công ty đã đào tạo các mô hình này trên sự kết hợp của các tập dữ liệu được cấp phép và công khai.

Để minh họa, Meta đã sử dụng công cụ Movie Gen, sử dụng hình ảnh có sẵn và “gắn” những quả bông (thường được dùng  bởi các hoạt náo viên) vào tay một người đàn ông đang chạy một mình trên sa mạc, trong khi ở một video khác, công cụ này đã biến bãi đậu xe nơi một người đàn ông đang trượt ván từ mặt đất khô ráo thành một bãi đất đầy vũng nước bắn tung tóe.

Meta cho biết video do Movie Gen tạo ra có thể dài tới 16 giây, trong khi âm thanh có thể dài tới 45 giây.

Mô hình AI mới của AI được công bố trong bối cảnh Hollywood đang vật lộn với cách khai thác công nghệ video AI tạo sinh trong năm nay, sau khi OpenAI đầu tiên giới thiệu cách sản phẩm Sora của họ có thể tạo video giống phim truyện theo lời nhắc văn bản vào tháng 2.

Các chuyên gia công nghệ trong ngành giải trí rất muốn sử dụng những công cụ như vậy để nâng cao và đẩy nhanh quá trình làm phim, trong khi những người khác lo ngại về việc áp dụng các hệ thống dường như đã được đào tạo về các tác phẩm có bản quyền mà không được phép.

Các nhà lập pháp cũng nêu bật mối lo ngại về cách thức sử dụng thông tin giả do AI tạo ra (còn gọi là deepfake), trong các cuộc bầu cử trên khắp thế giới, bao gồm cả ở Mỹ, Pakistan, Ấn Độ và Indonesia.

1728049605-meta-movie-gen-models-1728085367.jpg
Meta không có ý định phát hành mô hình Movie AI công khai.

Người phát ngôn của Meta cho biết công ty không có khả năng phát hành Movie Gen để các nhà phát triển sử dụng công khai, như đã làm với loạt mô hình ngôn ngữ lớn Llama, nói rằng họ cân nhắc các rủi ro riêng cho từng mô hình. Họ từ chối bình luận về đánh giá của Meta đối với Movie Gen nói riêng.

Thay vào đó, họ cho biết Meta đang làm việc trực tiếp với cộng đồng giải trí và những người sáng tạo nội dung khác về việc sử dụng Movie Gen và sẽ kết hợp nó vào các sản phẩm của Meta vào thời điểm nào đó trong năm tới.