当地时间3月12日,谷歌在AI开发者大会上正式宣布,旗下新一代轻量级图像生成模型——Nano Banana 2(基于Gemini 3.1架构的轻量极速图像模型)面向全球开发者及普通用户全面开放。这一被内部昵称为“小香蕉2号”的产品,以“毫秒级生成、端侧可跑”为卖点,标志着谷歌在AI模型轻量化与平民化方向上迈出了关键一步。

从“大而全”到“小而精”:为何需要轻量版?

过去两年,大语言模型与图像生成模型不断“膨胀”。GPT-4、Gemini Ultra等模型参数量动辄万亿级别,虽然能力惊人,却对算力硬件提出了极高要求,普通消费者难以在手机、平板等设备上流畅使用。谷歌此次推出的Nano Banana 2,正是针对这一痛点进行的手术式精简。

据谷歌AI团队介绍,Nano Banana 2基于Gemini 3.1架构进行深度剪枝与知识蒸馏,参数量压缩至原来的约5%,模型体积仅1.2GB。但通过引入全新的“动态稀疏注意力机制”和“自适应量化加速”技术,其图像生成速度相比Gemini 3.1标准版提升了近10倍,在最新的高通骁龙8 Gen 4移动平台上,生成一张512×512像素的图像仅需0.8秒,几乎实现“所输即所得”。

技术亮点:极速背后的三个“杀手锏”

谷歌副总裁、AI产品负责人萨拉·陈在发布会上详细解读了Nano Banana 2的技术突破:

第一,毫秒级推理引擎。 团队重新设计了模型推理管线,利用谷歌自研的TPU v6e芯片进行离线预编译,在移动端通过“模型切片”技术实现并行计算,延迟比上一代Nano Banana降低了60%。

第二,图像质量不妥协。 尽管参数大幅缩减,但通过对抗训练与感知损失函数的优化,Nano Banana 2生成的图像在FID(弗雷歇初始距离)评分上与标准版差距不超过3%,在色彩还原和细节保真度上甚至优于某些小尺寸模型。

第三,端侧隐私保护。 所有图像生成过程均在本地完成,无需联网上传数据。谷歌强调,用户输入的文字描述与生成的图像“绝不离开设备”,这一设计尤其适合医疗影像辅助、隐私敏感的商业设计等场景。

开放策略:免费与付费并行的“新香蕉计划”

与以往不同,谷歌此次为Nano Banana 2设计了极具侵略性的开放策略。即日起,所有用户均可通过Google AI Studio、Android版Google相册以及独立应用“Nano Banana”免费使用基础版本,每月可生成200张图像。付费版“Pro”则提供无限生成、超分辨率放大以及商业授权,月费定为4.99美元(约合人民币36元),年费用户还可获得专属的“文字编辑图像”功能。

谷歌还同步推出了面向开发者的API接口。开发者可将Nano Banana 2集成到自己的应用中,按调用次数收费,每次推理成本低至0.001美元。这一价格较上一代下降了90%,直接对标开源社区中的Stable Diffusion XL Tiny模型。

行业影响:轻量模型战火再起

Nano Banana 2的发布立即引发了行业震动。分析人士指出,谷歌此举意在抢占“边缘AI”制高点。目前,苹果正依靠其神经网络引擎在移动端AI上持续发力,而Meta的Llama系列轻量模型也拥有大量拥趸。Nano Banana 2的推出,将使图像生成能力真正“飞入寻常百姓家”——用户在拍照后可直接本地生成卡通头像、替换背景、甚至生成3D草图,而无需依赖云端处理。

不过,也有开发者对模型的实际表现表达了审慎态度。一位参与内测的独立开发者表示:“在复杂场景、多人脸、文字渲染等任务上,轻量版仍有不足,但作为日常创意工具,它已经足够惊艳。”

未来展望:从小香蕉到大生态

谷歌透露,Nano Banana 2只是“轻量极速模型家族”的开端。后续还将推出Nano Banana 2 Audio(语音生成)、Nano Banana 2 Text(文本摘要)等一系列产品,最终构建一个能在手机端流畅运行的“全模态AI助手”。而“Nano Banana”这个略带萌感的代号,或许正是谷歌希望向外界传递的信号:AI不再高冷,而是像剥开香蕉一样,人人都能轻松享用。

目前,Nano Banana 2已在全球180余个地区的Google Play和App Store上架。对于普通用户而言,只需一次下载,便能触摸到AI图像生成的最前沿。这粒“小香蕉”能否撬动千亿美元的市场,我们拭目以待。