谷歌连发两款新模型：生图只要4秒，文本就能编辑视频，便宜到离谱

2026-07-01

按住下方图标，点击小程序

免费领取AI学习资料、精选提示词

谷歌刚刚连发两款重磅新模型，Nano Banana 2 Lite和Gemini Omni Flash。

看名字大家应该就能猜到，一个专攻图像生成，一个负责视频制作。这两个模型组合在一起，干活相当顺手。

咱们先说这个Nano Banana 2 Lite，谷歌把它定位为Gemini图像家族里跑得最快、性价比最高的模型。

那到底有多快呢？从你敲完一段描述词到4张1K图片出来，大概就四秒钟。每生成一张高清图，成本只要3.4美分，这性价比非常高。

我知道很多人会问，这么便宜速度这么快，质量会不会拉胯？

其实谷歌这次挺聪明，他们用Elo评分系统做了对比，就像咱们考试排名一样，这个新模型不仅没掉队，反而在画质和编辑能力上都不输给那些更贵的型号。

特别是处理文字和人脸的能力，以前那种画面里字乱码、人脸变形的情况，现在好多了。

那这个模型适合谁用呢？如果你是做电商的朋友，需要批量生产产品图，或者你是设计师，想快速出几十个草图找灵感那选它准没错。

谷歌现在把这个模型定位成极速出图款，跟其他几个兄弟型号拉开了档次，想省钱，又想快就选Lite，追求极致画质就选Pro，各取所需，挺合理的。

接下来聊聊更有意思的视频模型Gemini Omni Flash。大家平时做视频最头疼什么？

肯定是剪辑啊。这个模型最牛的地方在于能听懂人话来剪辑视频。

你不用再去学那些复杂的剪辑软件时间轴，直接告诉它把背景换成海边，或者让人物跑快点，就能自己改。

例如，用Omni Flash制作4个表演魔术的视频，只需要把你的创意告诉它，就能快速、丝滑地呈现出来。如果是用传统的AE、PR来做要耗费大量时间。

这种对话式编辑，极大降低了做视频的门槛。价格也挺公道，生成的每个视频才0.1美元，差不多是7毛钱，跟市面上同类产品比起来很有竞争力。

此外，Omni Flash 不是那种只会简单拼接的工具，背后有 Gemini 大脑，懂历史、懂生物、懂逻辑。这意味着你让它生成一个科普视频，能自己把知识点串起来，不会出现逻辑硬伤。

还能玩多素材联动，比如你给它一张图、一段文字、一段视频，它能把这些揉在一起，风格还能保持统一，这在以前得靠专业剪辑师搞半天。

我觉得最有意思的是把这两个模型串起来用。

恭喜你顺利通过CAIE 注册人工智能工程师认证！你的 AI 专业能力已获官方认可。愿你继续在智能时代保持领先，持续进步、不断升级。