在今年的I/O开发者大会上,谷歌带来了一项令人瞩目的技术突破——新一代视频生成模型Veo3。这款模型不仅标志着谷歌在视频合成领域的重大进步,还因其能生成视频背景音效而备受瞩目。
据谷歌介绍,Veo3不仅能够合成逼真的画面,还能为各种场景,如鸟鸣、街头交通等,配上相应的音效。更令人惊叹的是,它甚至能生成人物对话,使得生成的视频内容更加生动和真实。这一技术的实现,无疑将极大地推动影视制作行业的发展。
除了音效生成外,Veo3在物理模拟与口型同步方面也展现出了卓越的性能。这意味着,生成的视频内容在视觉和听觉上都将更加贴近真实世界,难以被辨识为AI生成的作品。
然而,目前Veo3的开放范围还相对有限。谷歌表示,该模型目前仅面向美国地区的Gemini Ultra用户和Vertex AI的企业用户开放。同时,Veo3已经集成进了谷歌的AI影视制作工具Flow中,使得用户能够更加方便地使用这一先进技术。
对于已经在使用Flow的用户来说,Veo3的加入无疑将带来更加丰富的创作体验。用户可以通过Flow使用镜头控制功能,对生成的视频内容进行旋转、缩放等操作,甚至可以将画面从竖屏调整为横屏。用户还可以在视频中添加或删除元素,使得最终的作品更加符合自己的创作意图。
随着AI生成技术的不断发展,用户越来越难以辨别出哪些是AI生成的内容。为了应对这一问题,谷歌推出了SynthID Detector工具。用户可以通过上传媒体文件,检测其是否包含SynthID水印,从而判断该内容是否为AI生成。然而,需要注意的是,目前并非所有的图像生成模型都支持这一水印功能。
尽管Veo3的开放范围还相对有限,但谷歌I/O开发者大会仍在如火如荼地进行中。我们有理由相信,随着技术的不断进步和应用的不断拓展,Veo3将有望在未来为更多的用户带来更加便捷和高效的影视制作体验。