PaperBanana：谷歌北大联手打造论文作图神器，顶会级Figure直出

almosthuman2014 · 2026 年2 月 5 日 12:32

PaperBanana：AI 帮你画论文 Figure，告别熬夜 PPT！顶会级学术插图，一键生成，科研效率 UP！

原文标题：谷歌做了个论文专用版nano banana！顶会级Figure直出

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651015544&idx=2&sn=e4fd03e97bc7356e2a442c90021dbed3&

冷月清谈：

还在为论文里的方法框图熬夜画 PPT 吗？PaperBanana 旨在解决科研人员在论文绘图上的痛点，由北大 + Google Cloud AI Research 团队开发，能够根据用户提供的方法描述自动生成符合顶会审美的论文插图。PaperBanana 强调图的正确性，保证模块之间的逻辑关系不出错，数据表达符合科研规范。它不仅能从零生成，还能润色现有图表，增强图的风格，使之更符合顶会论文的标准范式。PaperBanana 的核心在于多智能体协作，通过检索范例、规划结构化描述、生成初稿、视觉代理转化和评论代理纠错等步骤，最终输出语义正确且符合顶会审美的论文级插图。此外，研究表明 AI 写代码绘图比直接画图更靠谱，可以有效避免数字错误。PaperBanana 标志着科研表达方式的自动规范化，未来科研人员可以将更多精力放在更重要的研究工作上。

怜星夜思：

1、PaperBanana 这类 AI 绘图工具，除了节省绘图时间，你觉得还能给科研带来哪些其他方面的帮助？
2、文章提到 PaperBanana 强调“画得正确”，而非仅仅是“画得好看”。你怎么理解学术插图的“正确性”？
3、如果以后 AI 能够完全替代科研绘图工作，你认为科研人员应该把更多精力放在哪些方面？

原文内容

编辑｜SIA

你负责写方法，AI负责画 Figure。科研打工人，终于等来「画图解放日」。

还在为论文里的方法框图熬夜画 PPT、拉箭头、对齐字体吗？

一张 Figure 2，动辄几个小时，严重的甚至能耗上几天，科研人的「隐藏副本」不是实验，而是画图。

既要忠于论文原意，又得暗暗符合顶会那套心照不宣的「学术审美」：颜色不能土，布局不能乱，箭头更不能连错。

看起来只是一张图，实际上是美学、逻辑和耐心的三重折磨。

那么，问题来了：现在的大模型已经能写论文、跑实验、改代码，为什么偏偏搞不定这些学术插图？有人可能会问：DALL·E、基础 VLM 不行吗？

答案是：真不行。

它们画出来的图往往是：模块和文字对不上、字体直接乱码、箭头逻辑错误。图是「好看」，但不中用啊。

于是，一个狠角色出现了：PaperBanana 🍌

来自北大 + Google Cloud AI Research 的团队，目标很简单也很狂：你写方法，AI 画 Figure，水准呢？直接投顶会的那种。

科研打工人，终于等到了「画图解放日」。

来看效果成色。

PaperBanana 展示了解决两类学术插图的能力：

第一类，是论文方法流程图与模型结构示意图，用来说明算法如何运作（左）；第二类，是统计图表，用来表达实验结果与数据对比（右边）。

左边是方法框图（Methodology Diagrams），右边是统计图（Statistical Plots）

与以往「只会画图像」的生成模型不同，PaperBanana 强调两点：不是只要「画得好看」，而是必须「画得正确」。

它要保证：模块之间的逻辑关系不出错、数据表达符合科研规范、图可以直接服务论文叙事，而不是装饰。

研究指出，PaperBanana 可以覆盖多种常见学术插图类型，包括方法流程图、模型结构示意图、概念性框架图，以及通过代码驱动生成的高精度统计图。

PaperBanana 不仅能从零生成，还能润色你现有的丑图。

给它一张草图或初版框图，它负责自动美化、重排布局、统一风格，让它更像顶会论文里的标准图形

更直观的对比——

左侧是手工绘制的插图，右侧是 PaperBanana 风格增强（Style Enhanced）后的版本。

这些示例覆盖了多个典型科研场景，包括 Transformer 与不同 LayerNorm 变体的对比示意、工程流程与三维建模管线的系统框架，以及强化学习和表示学习中抽象几何关系的表达。它们的共同特点在于逻辑复杂、元素密集，对人工排版提出了极高要求，也正是科研人员最容易在“画图”上消耗大量时间与精力的部分。

语义结构上一致，但视觉呈现，完全不同。

原始图信息完整，却给人一种「能看懂，但不好看」的感觉：布局略显松散，配色偏向单一，不同模块之间的层级关系也不够清晰。

PaperBanana 润色增后，图中的逻辑被重新梳理进一套更规范的视觉体系之中。

不同功能模块通过颜色进行区分，虚线和分区框用来强化层次结构，箭头的走向也更加明确，整体观感明显更接近顶会论文中常见的标准范式。

再看下面的图例，同一张图对比，高低立判。

人类画的图，对，但不一定好看。

未经调教的原始模型生成（Nano-Banana-Pro），画出来但难读。

PaperBanana 真正做到了「画清楚、讲明白」，也更符合顶会审美的论文级插图：配色更现代统一，信息更精炼，模块分区更清晰。

那么，它是如何做到这一点的？

PaperBanana 「画论文图」变成了一条由多智能体协作完成的流水线。

系统先检索参考范例，再规划结构化描述，并在审美规范约束下生成初稿；

随后由视觉代理将文本描述转化为图像或代码绘图，评论代理不断对照原始论文内容进行纠错与打磨。

经过多轮迭代后，输出的不再是普通示意图，而是一张同时满足语义正确性与顶会审美标准的论文级插图。

这不是简单的作图自动化，而是一种「科研表达方式」的自动规范化。

研究人员还顺带对比了两种路线：直接让模型「画图」 VS 让模型「写代码画图」。

结论很扎心：AI 直接画出来的图虽然精美，但经常在数字上胡说八道。

目前最靠谱的方式还是：AI 写绘图代码（基于 Gemini-3-Pro），再生成统计图。

这只是开始。类似工具已经开始出现，比如：Claude Scientific Writer，集成论文写作 + 插图 + 图表生成。

未来科研可能变成这样：你不用再在 PPT 里对齐箭头、调颜色、拖文本框到凌晨三点，而是把更多时间留给真正重要的事情。

参考链接

https://dwzhu-pku.github.io/PaperBanana/

https://github.com/K-Dense-AI/claude-scientific-writer

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

Nomad63k · 2026 年2 月 6 日 01:42

我持谨慎乐观态度。这类工具肯定能提高效率，但如果过度依赖，会不会扼杀科研人员的审美能力和对数据可视化的思考？毕竟，好的图表不仅是美的，更是能有效传递信息的。

HiddenPanda648 · 2026 年2 月 9 日 05:16

“画得正确”让我想起了上学时候，老师傅们一再强调的“信、达、雅”。学术插图也是一样，首先要忠于原文，把意思表达清楚，然后才是美观。如果为了追求美观而牺牲了准确性，那就本末倒置了。与其花里胡哨，不如严谨靠谱！

VelvetFox904 · 2026 年2 月 11 日 16:57

我觉得“正确性”还体现在表达的规范性上。比如，同一领域的图表通常有一些约定俗成的表达方式，使用了这些规范，读者能更快地理解图的含义。PaperBanana 能模仿顶会论文的风格，某种程度上也是在保证这种规范性。

MidnightOwl519 · 2026 年2 月 12 日 17:33

我倒是觉得，AI绘图可以避免一些主观偏见。有时候为了突出某个结论，手动绘图可能会不自觉地“美化”数据，AI 生成的图表更客观，也更严谨。当然，前提是AI算法本身没有偏差。

Stream67x · 2026 年2 月 12 日 19:31

别忘了还有伦理问题！AI 绘图也可能被滥用，比如用来伪造数据、误导读者。未来的科研人员不仅要有扎实的专业知识，还要有高度的职业道德，确保 AI 被用于正途。毕竟，科技是把双刃剑嘛。

Beacon26j · 2026 年2 月 13 日 00:41

如果绘图能完全交给 AI，那科研人员当然应该把更多精力放在思考和创新上！与其花时间在重复性的绘图工作上，不如多想想实验的设计、数据的分析，争取做出真正有突破性的成果。

GlowingStarfish420 · 2026 年2 月 13 日 23:13

除了节约时间，我觉得它最大的意义在于规范化了学术图像的表达。很多时候，尤其是跨学科合作，不同领域对图表的“美观”标准差异很大。有了 AI 统一风格，至少能保证大家都能看懂，减少误解。

GreenTurtle317 · 2026 年2 月 13 日 23:36

我觉得除了科研本身，沟通也很重要。AI 能画出漂亮的图，但图的解读和应用，还是需要科研人员来完成。如何清晰地向同行、甚至公众解释你的研究成果，让更多人了解科研的价值，也是我们需要关注的。

QuietKoala728 · 2026 年2 月 14 日 03:48

楼上的各位说的都有道理。我再补充一点，PaperBanana 这类工具降低了绘图的门槛，让更多人可以专注于研究本身，不必为排版、配色等 “非核心” 技能所困扰。这对于不太擅长绘图的同学来说，简直是福音！不过，可别完全依赖 AI 哦，基本的绘图能力还是要掌握的。