在今日举行的Google I/O 2025大会上,谷歌宣布了涵盖生成式AI模型的多项重大更新,正式推出新一代视频生成模型Veo 3和图像模型Imagen 4。公司在其官方博客中将这两项技术称为"重大突破",称其能"创造令人惊叹的影像内容,助力艺术家实现创意愿景,同时为大众提供表达自我的强大工具"。

Veo 3:视频生成的革命性进化

作为谷歌"最先进的视频生成模型",Veo 3在Veo 2基础上实现了质的飞跃——首次为生成视频添加环境音效和角色对话功能。该模型在文本理解、照片级场景还原及真实物理规律模拟方面表现尤为突出,甚至能精准实现唇语同步。

"只需输入简短故事描述,模型就能将其转化为生动影像,"谷歌技术团队解释道。目前Veo 3已面向美国地区的Ultra订阅用户通过Gemini应用和Flow工具开放,企业用户可通过Vertex AI平台调用。

Imagen 4:细节表现力再攀高峰

最新图像模型Imagen 4在生成速度与细节处理上全面超越前代产品。无论是复杂织物纹理、水滴飞溅还是动物毛发,都能实现毫米级精度还原,同时支持从超现实到抽象风格的全方位创作。

该模型支持更灵活的画幅比例和2K分辨率输出,文字生成能力显著增强。现已集成至Gemini、Whisk及Vertex AI平台,并深度对接Workspace办公套件。谷歌透露,运算速度提升10倍的"高速版"Imagen 4即将发布。

Ultra订阅服务:高端AI体验入口

作为Veo 3的独家使用通道,谷歌今日推出的Ultra订阅服务(249.99美元/月)囊括了公司最先进的AI模型组合。新用户可享首三月五折优惠,目前仅在美国地区开放。

Ultra套餐包含Gemini终极版、Veo 3视频生成、Flow影视工具、Whisk创意套件、NotebookLM智能笔记本、全平台Gemini集成、Project Mariner智能代理、YouTube Premium会员及30TB云存储空间。

Flow:AI影视创作中枢

专为Veo 3打造的Flow影视工具现已成为Ultra和现有Pro订阅的核心组件。这款"谷歌尖端模型专属创作平台"提供直观的自然语言指令输入、自定义角色导入、专业级镜头控制、场景延展等影视工业化功能。

"Flow的设计灵感来源于心流状态——当时间放缓,创作变得轻松、迭代且充满可能,"开发团队表示。其底层整合了VideoFX实验室技术,目前仅Ultra用户可解锁Veo 3的全部潜能。

通过这组创新,谷歌正重新定义生成式AI的行业标准,将技术边界从静态图像扩展到具备多感官体验的动态叙事领域。对于内容创作者而言,这些工具不仅降低了专业制作门槛,更开辟了前所未有的表达维度。

精选文章:

谷歌以颠覆性AI技术全面超越竞争对手:深度思考、智能购物与对话式视频生成

Tomorrowland 推出首款家具系列,进军家居装饰领域

建筑作为社会创新的工具:以人为本的设计对抗孤独

海报排版:如何让你的信息脱颖而出

这些品牌的端午礼盒,把非遗从博物馆搬进你的生活里!