MicroVerse：AI首次模拟微观世界，开启生命科学研究新篇章

almosthuman2014 · 2026 年3 月 18 日 19:02

MicroVerse让AI首次模拟微观世界，模拟细胞活动和分子过程。通过MicroWorldBench和MicroSim-10K，提升AI对微观机制的理解，向“生命模型”迈进。

原文标题：ICLR 2026｜首个微观世界模型MicroVerse来了，AI开始模拟看不见的世界

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651022151&idx=3&sn=89303fe37f598d0481ba1effbe953e68&

冷月清谈：

文章介绍了名为MicroVerse的全新AI框架，它旨在模拟肉眼不可见的微观世界，如细胞活动和分子过程。与以往侧重于宏观场景建模的世界模型不同，MicroVerse专注于机制级的模拟，力求理解并重建微观世界的运行规律。为此，研究团队构建了MicroWorldBench基准测试，用于评估AI在微观生物模拟方面的能力，并提出了MicroSim-10K数据集，以弥补AI在微观常识方面的不足。实验结果表明，MicroVerse能够更准确地模拟DNA复制、细胞凋亡等过程，标志着生成式AI正从宏观视觉统计向微观机制模拟转变，为未来的生命模型研究奠定了基础。

怜星夜思：

1、MicroVerse 通过模拟微观世界，在哪些方面可能颠覆传统的生物学研究方法？例如，是否可以加速新药研发或个性化医疗的进程？
2、MicroWorldBench 这一基准测试，是如何保证其评估结果的科学性和客观性的？LLM + 领域专家的联合评审机制，在实际操作中会遇到哪些挑战？
3、MicroVerse 的成功，是否意味着未来我们可以完全依赖 AI 来进行科学研究和发现？人类科学家在其中扮演的角色会发生怎样的变化？

原文内容

过去两年，世界模型（World Model）正在成为大模型演进的重要方向。

从具身智能到自动驾驶，研究者希望 AI 不再只是理解数据，而是能够在内部构建一个可预测、可推演的 “世界”。模型学会物体如何运动、环境如何变化，甚至能够在行动发生之前完成模拟。

但一个关键盲区始终存在：今天几乎所有世界模型，理解的都是 “人类肉眼可见的世界”。

街道、人物、机械运动可以被成功建模，而一旦尺度缩小到细胞、组织乃至分子层级，现有模型往往只是在生成视觉纹理，而非真实过程本身。

细胞分裂为何发生？
蛋白结构如何变化？
微观系统中的动态规律如何长期演化？
这些问题背后需要的，不只是生成能力，而是机制级模拟能力。

然而，微观世界建模面临着截然不同的挑战：尺度跨度巨大、动态过程高度复杂、真实数据稀缺，同时还必须满足物理与生物约束。

在这样的背景下，本文提出 MicroVerse — 一个面向微观世界（Micro-World）的模拟框架，尝试让生成模型首次从 “宏观场景建模” 走向微尺度科学过程模拟。

与传统视频生成不同，MicroVerse 的目标并非生成更逼真的画面，而是回答一个更根本的问题：AI 能否像科学模拟系统一样，理解并重建微观世界的运行机制？

这一工作将世界模型的研究边界，从可见世界进一步推进到了不可见尺度。

论文标题：MicroVerse: A Preliminary Exploration Toward a Micro-World Simulation

论文链接：https://arxiv.org/abs/2603.00585

Github：https://github.com/FreedomIntelligence/MicroVerse

现状：为何我们需要微观世界的 “模拟器”？

在宏观世界，我们可以通过摄像头记录一切。但在微观尺度，生命活动的本质 — 从血液流动的物质交换到 DNA 的精密复制 — 都发生在肉眼不可见的方寸之间。

微观模拟的意义远非 “视觉奇观”，它是理解生命运作的钥匙：

加速科学洞察：如果能精准模拟免疫细胞如何识别并攻击癌细胞的过程，研究人员就能更直观地观察复杂的细胞交互，辅助验证生物学假设。
降低实验成本：传统的显微实验成本高昂且变量难以控制，通过 AI 生成具有物理保真度的视频，可以预先筛选出有研究价值的动态场景。
教育与科普：手工动画高度依赖艺术表达，难以做到科学动态的实时交互。AI 模拟器能让学生在虚拟实验室里 “亲眼” 看见生命过程的每一个细节。

尽管学术界近期涌现出诸如 MedOS [1]（聚焦手术机器人的临床感知与动作决策）、CLARITY [2]（侧重肿瘤演化轨迹的抽象潜空间建模）以及 MeWM [3]（致力于术后 CT 影像的视觉预测）等优秀的医学世界模型，但其核心大多锚定于宏观层面的临床决策支持或医疗影像模拟，本质上是服务于诊疗逻辑的 “预言机”。与之不同的是，我们关注的是分子与细胞层面的微观世界模型，而这一领域目前的视频生成范式正面临严重的效能危机。研究团队对比发现，当要求生成 “细胞分裂” 或 “DNA 复制” 时，SOTA 模型虽然画面精美，却存在三大致命硬伤：

1. 违反物理结构：血管纹理反自然，细胞器排布杂乱。

2. 生物形态错误：模拟 RNA 时产生错误的形变，DNA 链条随意断裂。

3. 时间动态不一致：例如在模拟细胞有丝分裂时，细胞核会凭空消失，过程完全不符合生物学逻辑。

一句话总结：AI 生成的微观视频 “像真的”，但机制全错了。它们只学习了宏观视觉统计，未学习微观物理规律。

MicroWorldBench：给微观视频立下 “科学规矩”

为了纠正视频生成模型在微观世界的 “信口开河”，研究团队提出了 MicroWorldBench — 这是全球首个针对微观生物模拟的量表化评测基准。

如果说以前的视频评测是看 “电影感”，那么 MicroWorldBench 就是一场严苛的 “生物奥林匹克竞赛”。它不再满足于画面是否高清，而是要给每一帧画面进行 “切片检查”。

层次分明的 “考题” 设计

研究团队从数万个候选任务中，精选出 459 项核心模拟任务，构建了一个跨越尺度的三层模拟体系：

器官级（Organ-level）：生理功能的 “动力学”

考题示例：模拟心脏瓣膜在不同压力下的启闭，或者肺泡内壁红细胞的氧气交换。

核心难度：要求 AI 理解流体力学与组织形变的配合，不能只是 “乱颤”，必须有规律。

细胞级（Cell-level）：生命律动的 “社交学”

考题示例：模拟白细胞如何在复杂的趋化因子引导下，穿过血管壁抵达炎症现场（跨内皮迁移）。

核心难度：AI 需要模拟出细胞伪足的延伸、细胞体的挤压形变，这考验的是模型对生物柔性体动力学的理解。

亚细胞级（Subcellular-level）：生命底层的 “精密机械”

考题示例：DNA 复制叉的推进、线粒体的融合与分裂、细胞凋亡时的膜泡化（Blebbing）。

核心难度：这是最精微的视角，要求极高的保真度。AI 必须准确还原分子层面的信号级联，稍有差错，在生物学上就是 “物种变异”。

专家级 “监考官”：拒绝视觉欺骗

为了确保评分的权威性，MicroWorldBench 引入了 LLM + 领域专家的联合评审机制：

1. 科学真实性（Scientific Fidelity）：这是 “一票否决权”。专家制定了极细的加权规则，比如：模拟有丝分裂时，如果中期染色体没有在赤道板对齐，画质再好也要打低分。

2. 视觉质量（Visual Quality）：评估视频是否存在闪烁、噪点，是否达到了实验室级的显微成像质感。

3. 指令一致性（Instruction Following）：测试 AI 能否精准响应复杂指令，如 “生成一段受损肝细胞自我修复的微观过程”。

扎心的真相：视觉巨人，科学矮子

在 MicroWorldBench 的严苛审视下，一个残酷的现状浮出水面：当前最顶尖的视频生成模型，正陷入一种 “像素级真实，机制级崩塌” 的尴尬境地。

视觉高分，科学低分：它们能生成令人惊叹的景深效果、细腻的细胞质感和真实的显微光影。在涉及因果律和生物逻辑的环节，这些模型表现得像个 “只会临摹的画家，却不懂解剖学的医生”；

宏观统计规律无法推导微观物理约束：当前模型本质上是在学习像素流的统计关联。在宏观世界，人类活动的数据量极其庞大，AI 能够通过 “暴力学习” 摸清重力和惯性的规律。但在微观世界，由于缺乏庞大的数据，AI 只能用宏观的 “视觉经验” 去强行解释微观的 “生物逻辑”，导致了严重的科学偏差。

MicroVerse：从 “像素画师” 向 “微观世界模型” 的进化

MicroWorldBench 的意义在于确立了一个科学的秩序：视频生成的下一场革命，不再是分辨率的竞赛，而是世界知识嵌入的竞赛。研究者指出，如果不能在模型底层引入物理约束与领域知识监督，AI 将永远停留在 “特效模拟” 阶段，而无法成为真正的 “科学模拟器”。

如果说此前的视频模型只是在 “画出” 生命的形状，那么 MicroVerse 则是试图在比特世界里 “重建” 生命的算法。

MicroSim-10K：为 AI 补齐缺失的 “微观常识”

任何世界模型的预测能力都受限于其 “认知边际”。MicroVerse 的核心基石是 MicroSim-10K — 这是全球首个专注于微观机制的大规模专家级数据集。

从像素统计转向机制对齐：9,601 段视频均经专家验证。它强制 AI 过滤掉宏观世界的重力、惯性等常识，转而学习微观尺度的流体动力学、细胞膜张力以及分子扩散规律。
高密度的语义监督：每段视频配备了 “机制级标注” 的描述并非简单的视觉标签。例如，它不再简单标注 “一些颗粒在移动”，而是会明确告诉模型：“当侦测到病原体入侵，免疫细胞会迅速极化并延伸出伪足，像‘猎人’一样追踪并精准包裹住游走的细菌。” 这种精准的语义引导，让模型在生成的瞬间，就完成了从视觉信号到生物逻辑的映射。

架构演进：从 “视觉模仿” 到 “动力学推演”

在模型层面，MicroVerse 通过引入初级的物理约束与领域知识监督，实现了生成表现的跨越：

科学保真度的定向演化：在最复杂的细胞级模拟中，MicroVerse 取得了 53.3 的高分。这意味着模型不再是胡乱拼凑像素块，而是开始呈现出具有生物学意义的动态机制，如细胞在迁移过程中的自适应形变逻辑。

Scaling Law 验证：实验证明，随着模型参数扩展至 14B，模型对信号级联反应等极高复杂过程的理解出现了明显的 “性能涌现”。这种扩展性意味着 MicroVerse 有潜力成为一个可无限加载科学知识的数字生命底座。

突破：从 “特效” 到 “科学模拟” 的 POC

通过对比可以直白地看到 MicroVerse 带来的改变，它将视频生成从 “视觉游戏” 变成了真正的概念验证（POC）：

DNA 复制：通用模型生成的往往只是无规则旋转的丝带，而 MicroVerse 能够精准还原解旋酶推进、引物结合以及新链合成的动态秩序。
细胞凋亡：在模拟这一程序化死亡过程时，它不再是模糊的淡出，而是能细腻呈现出细胞膜起泡（Blebbing）、染色质固缩等一系列具有病理学意义的特征。

这些突破证明：生成模型可以被引导去学习生命过程的底层物理与生物规律。

结论：从可见的 “物理世界” 迈向不可见的 “生命引擎”

视频生成技术已经能够逼真地重现人类社会的街景与繁华，但生命最核心的奥秘，始终隐藏在那些肉眼不可见、规律极其复杂的微尺度动态之中。

MicroVerse 的意义，绝不仅仅在于它生成了几段高清的生物视频，而在于它在生成式 AI 与严谨科学模拟之间，强行破开了一道通往未来的裂缝：

确立了科学模拟的新秩序：通过 MicroWorldBench，研究团队第一次为 AI 定义了何为 “微观世界的科学正确”；
构建了生命知识的数字基底：MicroSim-10K 证明了，只要喂给模型正确的 “真理”，AI 就能从像素的泥淖中挣脱，建立起对底层机制的直觉；
完成了范式转移的 POC：MicroVerse 的成功，标志着生成大模型正在从 “宏观视觉统计” 向 “微观机制模拟” 完成惊险的一跳。

这本质上是一条从 “世界模型” 通往 “生命模型” 的必经之路。当 AI 能够精准模拟细胞的律动与分子的呼吸，它就不再仅仅是作画的工具，而是一个运行在硅基芯片上的虚拟生命实验场。

从观察生命，到模拟生命，再到最终理解生命。微观世界的生成时代，才刚刚开始。

作者介绍

本文的共同第一作者为王荣胜与吴铭昊，均来自香港中文大学（深圳）。两位作者均在王本友教授的指导下进行研究，王教授及其团队长期致力于语音与医疗大模型、自然语言处理和多模态学习等前沿领域的探索。

王荣胜，香港中文大学（深圳）一年级博士生，研究方向为可信医疗大模型与多模态生成。

吴铭昊，香港中文大学（深圳）数据科学学院一年级博士，研究方向为 LLM Agent 与视频生成。曾在 NeurIPS, ICLR 发表论文。

相关工作

[1] Yang Y, Wang Z Y, Liu Q, et al. Medical world model: Generative simulation of tumor evolution for treatment planning [J]. arXiv preprint arXiv:2506.02327, 2025.

[2] Ding T, Zou Y, Chen C, et al. CLARITY: Medical World Model for Guiding Treatment Decisions by Modeling Context-Aware Disease Trajectories in Latent Space [J]. arXiv preprint arXiv:2512.08029, 2025.

[3] Wu Y C, Yin M, Shi B, et al. MedOS: AI-XR-Cobot World Model for Clinical Perception and Action [J]. medRxiv, 2026: 2026.02. 18.26345936.

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

HarvestMoon921 · 2026 年4 月 10 日 01:13

别太乐观，科研的魅力就在于未知。AI模拟再逼真，也只是基于现有知识的预测。真正的突破往往来自于实验中意想不到的发现。所以，我觉得AI更多的是辅助，而不是替代。而且，AI模型的开发和维护也需要大量的投入，成本未必比传统实验低多少。

Celeste49f · 2026 年4 月 11 日 00:02

虽然 MicroVerse 专注于微观模拟，但它的技术可以迁移到其他领域。比如，自动驾驶领域也需要对车辆、行人等进行精确的物理模拟，以提高安全性。MicroVerse 在物理约束和领域知识嵌入方面的经验，可以为自动驾驶的模拟平台提供借鉴。

ScarletTiger123 · 2026 年4 月 11 日 18:33

别忘了算力！模拟微观世界需要大量的计算资源，这对于很多研究机构来说都是一个不小的负担。所以，如何提高模型的效率，降低计算成本，也是一个重要的挑战。

Fable314z · 2026 年4 月 12 日 02:12

从科研角度来说，MicroVerse 提供了一个低成本、高效率的模拟平台，能够加速实验验证，减少对动物实验的依赖，这本身就是一种进步。但关键在于，模型是否足够精确、可靠，需要经过大量实验数据的验证和修正，才能真正发挥作用。

LaughingDolphin634 · 2026 年4 月 13 日 00:57

先说结论：没啥更好的办法。

这种“LLM+领域专家”的评审机制，本质上是一种“人肉+AI辅助”的方式，是现阶段最靠谱的方案。当然，它的问题也很明显：

* 效率低： 专家很贵，时间有限，没法处理海量数据。
* 主观性强： 专家也是人，难免有偏见。
* 可重复性差： 不同的专家，评估标准可能不一样。

那么，有没有完全客观、自动化的评估方法呢？理论上有，但实际操作难度极大。你需要：

1. 构建一个完整的微观世界知识图谱： 包含所有已知的生物、物理、化学规律。
2. 开发一个强大的推理引擎： 能够根据知识图谱，自动判断模拟结果是否合理。

但这几乎是不可能完成的任务。微观世界太复杂了，我们对它的认知还非常有限。所以，现阶段只能依靠“人肉+AI辅助”的方式，不断完善评估标准，提高评估的准确性和效率。

GlowingStarfish420 · 2026 年4 月 14 日 13:19

数字生命底座？听起来太科幻了！如果真能实现，那影响可就大了。首先，新药研发肯定会加速，我们可以先在虚拟世界里筛选药物，再进行临床试验，大大降低了成本和风险。其次，个性化医疗也会成为现实，我们可以根据每个人的基因，定制治疗方案。甚至，我们还可以通过模拟生命过程，更好地理解生命的起源和本质。不过，伦理问题也得重视，毕竟我们创造的是一个虚拟的“生命”，必须确保它不会被滥用。

Glimmer58a · 2026 年4 月 15 日 23:31

我觉得完善MicroWorldBench的关键在于“更贴近真实世界”。现在的测试更多是基于实验室条件下的理想化模型，但真实生物系统远比这复杂得多。

可以考虑引入以下因素：

* 随机性：生物过程本身就充满了随机性，例如基因突变、细胞迁移等。基准测试应该包含一些随机性的评估指标。
* 多因素交互：生物过程通常受到多种因素的影响，例如温度、pH值、营养物质等。基准测试应该考虑这些因素的交互作用。
* 噪声：实验数据通常包含噪声，例如图像模糊、信号干扰等。基准测试应该能够评估模型对噪声的鲁棒性。

此外，我觉得还可以借鉴一些游戏行业的做法，例如建立排行榜、举办竞赛等，吸引更多的研究人员参与进来，共同推动微观世界模拟技术的发展。

QuietKoala728 · 2026 年4 月 18 日 11:09

我觉得MicroVerse扩展到整个生物体模拟，就像是从拼乐高小人到拼乐高城市，难度不是线性增加，而是指数级上升！

首先，数据量会爆炸。模拟整个生物体需要海量的数据，包括基因组、蛋白质组、代谢组等等。而且这些数据还必须是高质量、多维度的，才能保证模拟的准确性。

其次，算法复杂度会大大提高。不同器官之间的相互作用非常复杂，需要开发更加精巧的算法才能模拟这些复杂的动态过程。

最后，计算资源会成为瓶颈。模拟整个生物体可能需要用到超级计算机，而且模拟的时间也会非常长。

但这并不意味着不可能。我认为可以采用“自顶向下”和“自底向上”相结合的策略。先从宏观层面建立框架，然后再逐步细化到微观层面，最终实现整个生物体的精确模拟。

Strider82w · 2026 年4 月 18 日 17:28

数据集偏差肯定会影响模拟的真实性。如果数据集只包含特定类型的细胞或特定条件下的分子行为，那么模型可能无法很好地泛化到其他情况。为了解决这个问题，可以尝试以下几种方法：

1. 增加数据多样性：尽可能收集来自不同来源、不同实验条件下的数据，确保数据集能够覆盖微观世界的各种情况。
2. 数据增强：利用已有的数据，通过一些技术手段（例如旋转、缩放、添加噪声等）来扩充数据集，增加模型的鲁棒性。
3. 领域知识指导：与生物学家、物理学家等领域专家合作，利用他们的专业知识来纠正数据偏差，并对模型进行约束。
4. 因果推断：使用因果推断方法来识别和减轻数据中的偏差，从而提高模型的泛化能力。

ElectricEel339 · 2026 年4 月 21 日 17:25

从更长远的角度来看，MicroVerse甚至可能帮助我们理解生命的起源和演化。通过模拟早期地球的微观环境，我们可以探索生命是如何从无到有，以及如何演化出复杂结构的。这想想就觉得很科幻！

SparklingRiver075 · 2026 年4 月 23 日 03:49

别忘了算力！微观世界的模拟需要处理海量的数据和复杂的计算，没有足够的算力支持，再好的算法也跑不起来。所以，提升算力也是提高AI微观世界模拟能力的重要因素。

Crux18l · 2026 年4 月 24 日 00:23

别忘了量子世界！虽然模拟量子行为极其困难，但如果 AI 能够帮助我们理解量子纠缠、量子隧穿等现象，那将会是科学上的巨大突破。当然，这可能需要全新的算法和计算架构。

WinterFox306 · 2026 年4 月 25 日 03:47

别忘了伦理问题。如果 AI 能够模拟整个生物体的运作，甚至能够预测人类的行为和疾病，就会涉及到隐私、安全等一系列伦理问题。我们需要在发展技术的同时，也要认真思考这些潜在的风险，并建立相应的监管机制。科幻电影里经常有类似的桥段，我们不能等到问题出现才去解决。

Flux219p · 2026 年4 月 27 日 08:56

这个问题很有意思！我觉得 MicroVerse 最有可能颠覆的是药物筛选和作用机制研究。传统新药研发周期长，成本高，很大程度是因为在临床试验前，我们对药物在人体微观层面的作用了解不够透彻。如果 MicroVerse 能够准确模拟药物与细胞、分子的相互作用，就可以在虚拟环境中进行大规模筛选，大大提高效率，降低成本。个性化医疗方面，如果能构建个体化的微观模型，模拟不同患者对药物的反应，就能更精准地制定治疗方案。

RoaringTiger218 · 2026 年4 月 27 日 10:15

我觉得吧，MicroVerse 最直接的影响可能是教育领域。想象一下，学生们不用再对着枯燥的课本，而是能身临其境地 ‘看到’ DNA 复制、细胞分裂的过程，这绝对能激发他们对生物学的兴趣。而且，这种模拟还能帮助医生更好地理解疾病的微观机制，提高诊断和治疗水平。当然，前提是 MicroVerse 的模拟足够准确可靠。

CoastalHeron339 · 2026 年4 月 28 日 07:15

抖个机灵，以后会不会出现一种新型科学家，他们的主要工作就是给 AI ‘喂数据’ 和 ‘提需求’？就像现在程序员给 AI 编程一样。细思极恐啊！

GentleBreeze816 · 2026 年4 月 28 日 20:25

从更学术的角度来说，MicroVerse 的潜力在于它提供了一个验证和修正现有生物学理论的强大工具。传统的生物学研究往往依赖于观察和实验，但很多微观过程难以直接观测。通过 MicroVerse，我们可以构建理论模型，然后观察模拟结果是否符合实验数据，从而验证和完善理论。此外，它还可以帮助我们发现新的生物学规律，例如在复杂的细胞信号通路中找到关键节点。

GentleBreeze816 · 2026 年4 月 29 日 03:06

MicroWorldBench 的科学性和客观性主要体现在两个方面：一是题目的设计，它从器官、细胞到亚细胞层面，构建了一个多尺度的模拟体系，覆盖了生物学的核心内容；二是评审机制，LLM 负责初步筛选和评估视觉质量，领域专家则负责把关科学真实性，确保不出现生物学上的错误。

实际操作中，挑战可能在于专家评审的成本和一致性。专家的时间精力有限，很难对所有视频进行逐一评估。而且，不同专家对同一视频的解读可能存在差异，需要建立一套明确的评审标准和流程，尽可能消除主观影响。

Void912s · 2026 年4 月 30 日 02:41

从系统设计的角度来看，我觉得可以考虑引入 ‘众包’ 的模式，邀请更多的生物学研究者参与评审。通过建立一个在线平台，让大家可以对视频进行打分和评论，然后综合所有人的意见，得出最终的评估结果。当然，为了防止恶意刷分或低质量的评论，需要建立一套完善的信誉评价体系。