谷歌 DeepMind 再度出招,推出旗舰 AI 内容生成工具 Veo 2 视频模型和 Imagen 3 图像模型,向 OpenAI 发起正面挑战。
据 DeepMind 产品副总裁 Eli Collins 透露,公司计划通过 Vertex AI 开发者平台逐步开放 Veo 2,预计明年将带来更多迭代更新。目前,开发者和创作者已可通过 Google Labs 初步体验这一尖端技术。谷歌的路线图显示,到 2025 年,Veo 2 有望广泛集成至 YouTube Shorts 等主流平台。
Veo 2 在视频生成领域展现出卓越实力。这一模型能够生成高达4K分辨率的视频,其规格明显超越 OpenAI 的 Sora 模型——视频分辨率高出 4 倍,时长延长 6 倍有余。谷歌强调,Veo 2 不仅能捕捉人类表情和电影细节,还具备先进的物理和电影学理解能力,可根据用户输入的类型、镜头和特效建议生成令人惊叹的内容。
在图像生成方面,Imagen 3 同样交出了一份亮眼的成绩单。这一模型在图像构图和细节还原上实现了显著提升,能够生成从写实到抽象的多样化图像风格。通过 Gemini 聊天机器人,Imagen 3 已开始提供服务,其生成的图像色彩饱满、质感丰富,在印象派、写实主义、动画等多种艺术风格的呈现上堪称精准。
尽管技术令人振奋,谷歌也坦诚 Veo 2 仍存在一些技术局限,比如偶尔会出现 “多余手指” 等AI生成特有的瑕疵。为缓解潜在的版权和伦理担忧,谷歌为 Veo 2 生成的视频植入了不可见的 SynthID 水印,以标记其 AI 生成属性。
目前,Imagen 3 已在全球 100 多个国家上线,用户可通过 Google Labs 的 ImageFX 工具体验这一尖端影像生成技术。随着 DeepMind 持续推进技术迭代,这场由谷歌和 OpenAI 主导的 AI 内容生成”军备竞赛”正愈演愈烈,有望彻底改变视频和图像创作的未来图景。
资料来源:综合报道;图片来源:谷歌 Deepmind