谷歌Nano Banana官方Prompt指南:探索图像生成与编辑的六种范式

谷歌官方发布Nano Banana模型的六大提示词模板,涵盖图像生成、编辑、文本渲染等多种应用。学习这些模板,深入探索AI图像创作的精髓,同时关注用户反馈的问题。

原文标题:刚刚,谷歌放出Nano Banana六大正宗Prompt玩法,手残党速来

原文作者:机器之心

冷月清谈:

谷歌的Nano Banana模型近期在网友中掀起热潮,通过巧妙的提示词,用户已成功探索出产品照片制作、多图合并、一键换装等多种创意应用。为了帮助用户更好地发挥该模型的潜力,谷歌官方发布了六个文本转图像提示词模板,旨在引导用户最大限度地利用Nano Banana的图像生成与编辑能力。

这六大模板包括:照片级写实场景、风格化插画与贴纸、图上添加精准的文字、产品模型与商业摄影、极简与留白设计,以及连续性艺术(漫画分镜 / 分镜头脚本)。 每个模板都提供了具体的构建思路和案例:例如,生成写实场景需要像摄影师一样思考机位、光线和细节;制作风格化插画需明确风格、颜色和线条;文字渲染则强调文字内容、字体风格和整体设计;产品摄影模板注重高分辨率、专业布光和特定角度;极简设计利用留白突出主体;而连续性艺术则依赖清晰的场景描述来构建视觉叙事。

文章指出,掌握这些模板是使用Nano Banana的关键。然而,用户在实际使用中也遇到了一些困扰。例如,用户反馈模型在图像编辑时存在一致性和稳定性问题,有时会返回原图,且在文本转图像方面也有其他模型表现更佳。 有用户提到,在对已有图像进行编辑时,模型有时会返回和原图一模一样的图像,并且在一致性和稳定性上,Nano Banana的表现不如Qwen和Kontext Pro,在文本转图像方面,Imagen可能提供更优质和可控的体验。这些反馈也提示了模型在一些特定应用场景中仍有提升空间,并鼓励用户分享各自的使用心得。

怜星夜思:

1、文章里说提示词是“魔法”,大家觉得现在花大力气学写prompt到底值不值?毕竟AI更新这么快,以后会不会越来越“心有灵犀”了,不用写那么复杂也能出好图?
2、Nano Banana被吐槽说编辑和一致性不如其他模型,那它有没有什么特别的优势,或者说它适合在哪些独特的场景发挥作用?不然AI作图工具这么多,它该怎么立足啊?
3、像Nano Banana这种能做到文本渲染、漫画分镜的AI工具,未来1-3年会对广告设计、漫画创作这些行业带来什么样的冲击和变化?我们人类创作者要怎么应对,或者说会有什么新机会吗?

原文内容

机器之心报道

机器之心编辑部


最近几天,谷歌 Nano Banana 可是被广大网友玩出了新花样。


比如制作精致可爱的产品照片:


来源:https://x.com/azed_ai/status/1962878353784066342


将 13 张图像合并为单个图像 :


来源:https://x.com/MrDavids1/status/1960783672665128970


给人一键换衣:



反正你想到的,想不到的脑洞,都被广大网友挖掘出来了。


但别忘了,这些效果可不是凭空生成的。背后真正的魔法,其实是提示词。网友们正是用一条条巧妙的提示词,把这个模型玩出了无限可能。


就在刚刚,谷歌官方公布了 Nano Banana 六个文本转图像提示:



原文链接:https://x.com/googleaistudio/status/1962957615262224511


根据这些提示,你可以进行以下操作:


  • 文本生成图像:通过简单或复杂的文本描述生成高质量图像。

  • 图像 + 文本生成图像(图像编辑):提供一张图片,并使用文本提示词添加、删除或修改图像元素,调整风格或颜色。

  • 多图合成与风格迁移:输入多张图片,合成新的场景,或将其中一张的风格迁移到另一张上。

  • 迭代式优化:通过对话逐步优化图像,每次做小调整,直到达到理想效果。

  • 文本渲染:生成包含清晰、布局合理文字的图像,适用于 logo、图表、海报等视觉创作。


谷歌强调,这些指令可以最大限度的发挥 Nano Banana 的图像生成能力。


接下来,我们看看这些提示具体包含的内容:


1、照片级写实场景


对于写实风格的图像,要像摄影师一样思考。prompt 中要提及机位角度、镜头类型、光线以及细节描写,这样可以引导模型生成更逼真的效果。


模板如下:


A photorealistic [shot type] of [subject], [action or expression], set in [environment]. The scene is illuminated by [lighting description], creating a [mood] atmosphere. Captured with a [camera/lens details], emphasizing [key textures and details]. The image should be in a [aspect ratio] format.


下图使用的完整 prompt 为「A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation.」



2、风格化插画与贴纸


在制作贴纸、图标或项目素材时,在 prompt 中明确说明需要的风格;另外,如果需要白色背景,记得在 prompt 中提出来。


模板如下:


A [style] sticker of a [subject], featuring [key characteristics] and a [color palette]. The design should have [line style] and [shading style]. The background must be white.


下图使用的完整 prompt 为「A kawaii-style sticker of a happy red panda wearing a tiny bamboo hat. It's munching on a green bamboo leaf. The design features bold, clean outlines, simple cel-shading, and a vibrant color palette. The background must be white.」



3、图上添加精准的文字


Gemini 擅长渲染文字。此类任务最好在 prompt 中明确说明文字内容、字体风格(用描述性的方式),以及整体设计。


模板如下:


Create a [image type] for [brand/concept] with the text "[text to render]" in a [font style]. The design should be [style description], with a [color scheme].


下图使用的完整 prompt 为「Create a modern, minimalist logo for a coffee shop called 'The Daily Grind'. The text should be in a clean, bold, sans-serif font. The design should feature a simple, stylized icon of a coffee bean seamlessly integrated with the text. The color scheme is black and white. 」



4、产品模型与商业摄影


适合在电商、广告或品牌宣传时制作干净、专业的产品照片。


模板如下:


A high-resolution, studio-lit product photograph of a [product description] on a [background surface/description]. The lighting is a [lighting setup, e.g., three-point softbox setup] to [lighting purpose]. The camera angle is a [angle type] to showcase [specific feature]. 

Ultra-realistic, with sharp focus on [key detail]. [Aspect ratio].


下图使用的完整 prompt 为「A high-resolution, studio-lit product photograph of a minimalist ceramic coffee mug in matte black, presented on a polished concrete surface. The lighting is a three-point softbox setup designed to create soft, diffused highlights and eliminate harsh shadows. The camera angle is a slightly elevated 45-degree shot to showcase its clean lines. Ultra-realistic, with sharp focus on the steam rising from the coffee. Square image.」



5、极简与留白设计


适合用于创建网站、演示文稿或营销素材的背景,并在其上叠加文字内容。


模板如下:


A minimalist composition featuring a single [subject] positioned in the [bottom-right/top-left/etc.] of the frame. The background is a vast, empty [color] canvas, creating significant negative space. Soft, subtle lighting. [Aspect ratio].


下图使用的完整 prompt 为「A minimalist composition featuring a single, delicate red maple leaf positioned in the bottom-right of the frame. The background is a vast, empty off-white canvas, creating significant negative space for text. Soft, diffused lighting from the top left. Square image.」



6、连续性艺术(漫画分镜 / 分镜头脚本


通过逐格描绘,创作引人入胜的视觉叙事,适合用于开发分镜头脚本、漫画条幅或任意形式的连续性艺术。重点在于清晰的场景描述。


模板如下:


A single comic book panel in a [art style] style. In the foreground, [character description and action]. In the background, [setting details]. The panel has a [dialogue/caption box] with the text "[Text]". The lighting creates a [mood] mood. [Aspect ratio].


下图使用的完整 prompt 为「A single comic book panel in a gritty, noir art style with high-contrast black and white inks. In the foreground, a detective in a trench coat stands under a flickering streetlamp, rain soaking his shoulders. In the background, the neon sign of a desolate bar reflects in a puddle. A caption box at the top reads "The city was a tough place to keep secrets." The lighting is harsh, creating a dramatic, somber mood. Landscape.」



这一套 prompt 模板学下来,你大概就能掌握使用 Nano Banana 的精髓了。


不过,用户在使用中还有其他困扰,比如「在对已有图像进行编辑时,模型往往会返回一张一模一样的图像。」



另外有人指出了 Nano Banana 在编辑时存在的更多问题,「它在一致性上表现不如 Qwen 和 Kontext Pro,也不够稳定,特别是在持续对话过程中。对于文本转图像,直接用 Imagen 会更好且更可控。」



大家在使用 Nano Banana 的过程中有哪些独到的心得与技巧?欢迎在评论区分享出来。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com