5月21日消息,在今年的I/O開發(fā)者大會上,谷歌發(fā)布第三代視頻生成模型Veo 3。
據(jù)悉,Veo 3對標OpenAI的Sora,具備生成視頻的同時同步嵌入音效的能力。
谷歌表示,Veo 3不僅可以基于文本和圖像提示生成高質(zhì)量的視頻,還能為人物對白、鳥鳴或街頭交通等場景配上相應的音效,實現(xiàn)更逼真的視聽體驗。
谷歌DeepMind產(chǎn)品副總裁Eli Collins表示:“從文字和圖像提示,到真實世界物理效果與精準的唇形同步,Veo 3的表現(xiàn)都非常出色?!?
目前,該模型主要面向美國地區(qū)的Gemini Ultra訂閱用戶,每月收費249.99美元。
此外,Veo 3也將納入谷歌面向企業(yè)客戶的Vertex AI平臺。
除了Veo 3外,谷歌還發(fā)布了多個與生成式AI相關的新產(chǎn)品,包括升級版圖像生成模型Imagen 4、電影制作輔助工具Flow。
此外,谷歌還宣布對原來的Veo 2進行更新,并新增支持通過文字提示對視頻中物體進行增刪的功能。
目前,生成式AI在圖像和視頻創(chuàng)作領域的應用日益普及。
不過值得注意的是,谷歌在AI圖像生成領域的歷史并非一帆風順。
2024年,谷歌因Imagen 3模型生成帶有歷史錯誤的圖像內(nèi)容而遭遇廣泛批評,隨后被迫重新發(fā)布該工具。
谷歌聯(lián)合創(chuàng)始人Sergey Brin后來坦承,問題源于“測試不充分”。