2026-07-01
按住下方图标,点击小程序
免费领取AI学习资料、精选提示词

谷歌刚刚连发两款重磅新模型,Nano Banana 2 Lite和Gemini Omni Flash。
看名字大家应该就能猜到,一个专攻图像生成,一个负责视频制作。这两个模型组合在一起,干活相当顺手。

咱们先说这个Nano Banana 2 Lite,谷歌把它定位为Gemini图像家族里跑得最快、性价比最高的模型。
那到底有多快呢?从你敲完一段描述词到4张1K图片出来,大概就四秒钟。每生成一张高清图,成本只要3.4美分,这性价比非常高。

我知道很多人会问,这么便宜速度这么快,质量会不会拉胯?
其实谷歌这次挺聪明,他们用Elo评分系统做了对比,就像咱们考试排名一样,这个新模型不仅没掉队,反而在画质和编辑能力上都不输给那些更贵的型号。
特别是处理文字和人脸的能力,以前那种画面里字乱码、人脸变形的情况,现在好多了。

那这个模型适合谁用呢?如果你是做电商的朋友,需要批量生产产品图,或者你是设计师,想快速出几十个草图找灵感那选它准没错。
谷歌现在把这个模型定位成极速出图款,跟其他几个兄弟型号拉开了档次,想省钱,又想快就选Lite,追求极致画质就选Pro,各取所需,挺合理的。
接下来聊聊更有意思的视频模型Gemini Omni Flash。大家平时做视频最头疼什么?
肯定是剪辑啊。这个模型最牛的地方在于能听懂人话来剪辑视频。
你不用再去学那些复杂的剪辑软件时间轴,直接告诉它把背景换成海边,或者让人物跑快点,就能自己改。
例如,用Omni Flash制作4个表演魔术的视频,只需要把你的创意告诉它,就能快速、丝滑地呈现出来。如果是用传统的AE、PR来做要耗费大量时间。
这种对话式编辑,极大降低了做视频的门槛。价格也挺公道,生成的每个视频才0.1美元,差不多是7毛钱,跟市面上同类产品比起来很有竞争力。
此外,Omni Flash 不是那种只会简单拼接的工具,背后有 Gemini 大脑,懂历史、懂生物、懂逻辑。这意味着你让它生成一个科普视频,能自己把知识点串起来,不会出现逻辑硬伤。
还能玩多素材联动,比如你给它一张图、一段文字、一段视频,它能把这些揉在一起,风格还能保持统一,这在以前得靠专业剪辑师搞半天。
我觉得最有意思的是把这两个模型串起来用。
登录/注册后继续阅读
立即登录/注册 >