找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 10|回复: 0

速览 | 香蕉2深夜发布,前端、设计已死

[复制链接]

2079

主题

0

回帖

6425

积分

管理员

积分
6425
发表于 2025-11-23 08:01:38 | 显示全部楼层 |阅读模式
凌晨,谷歌发布了Nano Banana Pro(Gemini 3 Pro Image),这是基于Gemini 3 Pro构建的高保真机型,供开发者访问工作室级图像生成。

该模型能够解锁高保真图像,在文本渲染中更准确,并获得强大的世界知识,并借助谷歌搜索的接地功能,根据用户提示获取数据,增强了这一功能。

接下来带你一起看看本次模型更新了哪些部分。

将任何想法或设计变为现实

Nano Banana Pro 可以可视化任何想法并设计任何东西——从原型、数据表示信息图,到将手写笔记转化为图表。

增强上下文,视觉效果震撼

基于增强的推理能力、世界知识和实时信息,生成更准确、丰富的上下文视觉效果

借助Gemini3的高级推理能力,Nano Banana Pro不仅能生图,还能制作更多信息图。

我们可以获得准确的教育性解释,深入了解我们不太了解的新学科。

比如说,基于你提供内容生成丰富的信息图表和图表。

制作一张关于这种植物的信息图,重点介绍有趣的信息。



常见家植“串”的信息图

或者说理解现实世界的事实。

制作一张关于这种植物的信息图,重点介绍有趣的信息。



制作Elaichi Chai(豆蔻茶)的逐步信息图

Nano Banana Pro还可以连接Google搜索庞大的知识库,能够快速创建食谱快照,或可视化天气、体育等实时信息。



自行车保养与维护信息图,由演示应用生成,制作教育信息图。

比如说,我们使用Nano Banana Pro通过搜索接地实时获取天气,制作了一个波普艺术信息图。



波普艺术信息图高保真度与控制

如果用户需要精准创作的高级工具,Gemini 3 Pro Image 就可以让你控制图像的物理效果(灯光、相机、对焦、调色)和构图,确保专业质量的输出。



通过2K和4K分辨率,可以确保输出达到专业制作所需的分辨率标准。

结合自身的产品图片、元素标志和参考等,能够轻松打造连贯的广告。

官方提供了一个演示应用:

https://aistudio.google.com/apps/bundled/product_mockup,

可以将元素标志与产品搭配,创作属于自己的模型设计。



漫画生成器应用:

http://aistudio.google.com/apps/bundled/personalized_comics



Gemini 3 Pro Image消除了图像生成与定位逻辑之间的障碍。它掌握了图像的语义语境,使菜单、标识或文档等元素的语言变更变得轻松,利用图像对图像生成保持原有艺术风格或布局。



饮料宣传概念图文本渲染成为资产

Gemini 3 Pro Image 将抽象图像生成转化为功能性资产。

擅长处理逻辑和语言,提供最先进的文本渲染,生成清晰、准确的文字,融入您的图片中。

制作8个精致的极简主义标志,每个都是有趣的食物词,用写实的食物字母表达这个词的含义。构图:所有标志在单一纯白背景上的渲染图



创意美食摄影,每个词都用与食物相关的实际食材艺术地拼写出来多语言文本,视觉效果更好

目前来看,Nano Banana Pro 是创建图像中文字正确且易读的最佳模型。

直接在图片中生成更精准、易读的多语言文本,生成更好的视觉效果

前天发布的Gemini3模型就擅长理解深度和细微差别,这为图像编辑和生成提供了强大的基座能力。

我们可以在样图或海报中创建更细致的文本,拥有更多样的纹理、字体和书法,也可以生成多种语言文本,或本地化和翻译内容,非常利于全球化产品。

设计一致性

复杂度更高,参考图更多:混合比以往更多的元素,最多使用14张图片,保持最多5个人的一致性和相似度。

比如说,在复杂构图中保持最多14个输入图像或者元素的一致性。

中景,14个毛茸茸的角色并排挤坐在一张磨损的米色布料沙发上,地上。他们都面向前方,看着一台复古的木盒电视机,放在沙发前的矮木桌上。房间灯光昏暗,左侧窗户透进温暖的光线,电视的光照亮了生物们的脸庞和蓬松的质地。背景是一个温馨、略显杂乱的客厅,铺着编织地毯,一个摆满旧书的书架,背景是质朴的厨房元素。整体氛围温暖、温馨且充满趣味。



还有,在一个镜头里面保持6张输入照片中人物的一致性和相似度。

把这五个人和这只狗放进一张图片里,他们应该能融入一张令人惊艳、获奖的时尚专题照片。五个人的身份、服装和狗的身份必须始终保持一致,但他们可以且应该从不同角度和距离以最自然且适合场景的方式观看。让颜色和灯光看起来自然,它们看起来就像是这场时装秀的自然契合。



一张设定在沙漠景观中的高端时尚编辑镜头

Nano Banana Pro适用于将草图转化为产品,或者将蓝图转化为逼真的3D结构,轻松应用视觉风格和感觉,确保品牌在每个接触点都保持无缝且一致。

工作室级创意控制

这次增加了新的功能:

1、改进的局部编辑,现在你可以选择、细化和转换图像的任何部分。

生成一张具有强烈明暗对比效果的图像。这个男人应该保留他原本的面容和表情。引入强烈的定向光线,看起来像是从上方稍偏左,投射出深邃而清晰的阴影覆盖脸部。只有零星的光线照亮他的眼睛和颧骨,脸的其他部分都笼罩在深深的阴影中。



改变男人脸上的光线,只显示眼睛

2、可以调整摄像机角度、改变焦点并应用复杂的色彩分级,甚至转换场景光线(例如将白天切换到夜晚或制造散景效果)。



光照和对焦控制应用于将场景从白天切换到夜晚

3、支持多种宽高比、多种图像分辨率(2K和4K分辨率)。

通过缩小背景将宽高比改为1:1,角色会完全锁定在当前位置。



通过调整宽高比,改变图像的外观和感觉提示词技巧

首先是确立愿景,包括故事、主题与风格。



请在提示中包含以下元素:【主题+组成+行动+位置+风格+编辑说明】

其次是细节的精炼,在摄影、灯光和格式上下功夫。



设计提示时,超越基础,考虑以下高级要素:

如下是一些实例:

为这个场景制作分镜



一个黑白分镜草图,展示了电影场景的建立镜头、中景、特写和视角镜头

柏林一条阳光明媚的舒适街道景象,浓重的阴影。这些老房子形状奇特,像拼写“BERLIN”的字母,颜色为蓝、红、白、黑。房屋依然看起来像房子,字母的相似度也很微妙。



柏林街景,立面用蓝、红、白、黑四字拼写“BERLIN”

制作8个极简主义标志,每个都是富有表现力的词汇,字母通过视觉传达信息或声音,以戏剧性的方式表达词义。构图:所有标志的平面矢量黑色渲染,单一白色背景



书法灵感源自意义,展示了生成具有表现力的文本,拥有更丰富的质感和字体。

将三个黄色和蓝色罐头上的所有英文文字翻译成韩文,其他内容保持不变



一个饮料活动概念,展示英文文本的准确翻译和呈现

一个色彩鲜艳、引人注目的“排版”设计,背景为有纹理的米白色。字母粗犷、方正、高度浓缩,形成3D效果,明亮的蓝色和热粉色层叠,每层都有半色调点图案,唤起复古印花美学。16:9 宽高比



一款带有复古丝网印刷纹理的“TYPOGRAPHY”字样的平面设计

创建一张图片,展示短语“如果土拨鼠会扔多少木头”,由土拨鼠扔出的木头制成。



通过将短语融入砍木场景中关于更多

Gemini 3 Pro Image 在文字转图像 AI 基准测试中表现出色。



每张使用 Gemini 3 Pro Image 创建或编辑的图片中都集成了 SynthID 数字水印,以标明其 AI 生成或编辑的来源。



赶快玩起来吧。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|花享网 ( 琼ICP备2024046163号-1 )

GMT+8, 2025-12-1 07:54 , Processed in 0.227280 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表