Google giới thiệu mô hình tạo video AI mới nhất, có thể tích hợp vào YouTube Short để vượt mặt TikTok

Google vừa công bố mô hình AI mới của mình có tên Veo và Imagen 3, có khả năng chuyển đổi văn bản thành hình ảnh chất lượng cao và video với độ phân giải lên tới 1080p, nhằm cạnh tranh trực tiếp với các mô hình tân tiến của OpenAI.

Như vậy, VEO và Imagen 3 sẽ là đối thủ cạnh tranh trực tiếp với các mô hình tạo hình ảnh và video của OpenAI là Sora và Dall-E 3.

google-veo-1715765110.png
Trình tạo video AI Google Veo mới nhất vừa được ra mắt tại hội nghị các nhà phát triển của Google.

Theo Google, VEO có khả năng tạ ra những video có độ phân giải cực cao với nhiều phong cách điện ảnh và hình ảnh đa dạng, có thể kéo dài hơn 1 phút. Với sự hiểu biết nâng cao về ngôn ngữ tự nhiên và ngữ nghĩa trực quan, nó tọ ra video thể hiện chặt chẽ tầm nhìn sáng tạo của người dùng, đồng thời nắm bắt chính xác âm điệu của lời nhắc vf hiển thị một cách chi tiết trong các lời nhắc dài hơn.

Các mô hình này cũng có thể hiểu được các kỹ thuật về hình ảnh và điện ảnh như khái niệm “timelapse” (tua nhanh) hoặc “phong cảnh từ trên không”. Veo tạo ra cảnh quay nhất quán và mạch lạc, nhờ đó con người, động vật và đồ vật chuyển động một cách chân thực trong suốt cảnh quay.

google-io-2024-55-1715765216.jpg
 

Để chứng minh rằng VEO không có ý định cướp đi công việc của các nghệ sĩ, Google cũng đã hợp tác cùng nhà làm phim Donald Glover và studio sáng tạo của ông là Gilga để thể hiện khả năng của mô hình này. Trong một video quảng cáo rất ngắn, có thể thấy Veo đã tạo ra một video về một chiếc xe mui trần cập bến một ngôi nhà ở châu Âu và một chiếc thuyền buồm lướt qua đại dương. VEO có thể mô phỏng vật lý trong thế giới thực tốt hơn so với các mẫu trước đó và nó cũng cải thiện cách hiển thị các cảnh quay có độ phân giải cao.

Google cho biết, Veo được xây dựng dựa trên nhiều năm hoạt động với các mô hình video tổng hợp của công ty, bao gồm Generative Query Network (GQN), DVD-GAN , Imagen-Video , Phenaki , WALT , VideoPoet và Lumiere — kết hợp kiến trúc, luật chia tỷ lệ và các kỹ thuật mới khác để cải thiện chất lượng và độ phân giải đầu ra.

Veo hiện có sẵn bên trong công cụ VideoFX của Google dành cho một số người sáng tạo. Tính năng này cũng sẽ có trên YouTube Short và các sản phẩm khác của công ty. Nếu Veo trở thành một phần tích hợp của YouTube Short thì đó sẽ là một thế mạnh của Google để có thể vượt qua TikTok.

google-image-3-ai-1715765379.jpg
Trình tạo hình ảnh AI Image 3 cũng vừa được giới thiệu, giúp tạo ra những bức ảnh chân thực, sống động hơn.

Đối với Image 3, Google cho biết, đây là mô hình chuyển văn bản thành hình ảnh chất lượng cao nhất của công ty với “mức độ chi tiết đáng kinh ngạc”, cho ra những hình ảnh chân thực, giống như thật. Google cho biết Image 3 xử lý văn bản tốt hơn trước và cũng thông minh hơn trong việc xử lý các chi tiết từ các lời nhắc dài.

Google cũng đang hợp tác với các nghệ sĩ thu âm như Wyclef Jean và Bjorn để thử nghiệm Music AI Sandbox – một bộ công cụ có thể hỗ trợ tạo bài hát và beat.