上交大AI突破:深度学习实现胚胎发育“时间倒流”,揭示基因调控新细节

上交大AI突破:1分钟级解码固定胚胎发育,揭示基因调控动态。

原文标题:上交大团队首次完成基因调控逐帧解码,将胚胎发育成像带入1分钟级时间分辨率

原文作者:数据派THU

冷月清谈:

传统成像技术在追踪胚胎发育的动态基因调控网络时面临时间和灵敏度的挑战。上海交通大学团队近期提出一种创新的多尺度集成深度学习方法,成功地从固定果蝇胚胎图像的核形态中,以1分钟的超高分辨率精确推断出胚胎的绝对发育时间。该方法通过整合三种独立的卷积神经网络模型,捕捉多尺度空间形态特征,并展现出极高的准确性(平均准确率达96.25%),甚至在核DNA图像上也能通过“接力学习”实现精确推断。这项技术成功揭示了Kr基因在胚胎发育早期前所未见的两个精细表达峰值,极大地提升了对基因调控时空动态的理解。展望未来,该通用框架有望与单细胞测序、空间转录组等技术无缝对接,将“静态切片”转化为“高清延时影片”,应用于从果蝇到人类器官芯片等更广泛的生物学研究领域

怜星夜思:

1、文章里提到固定胚胎成像弥补了传统实时成像的不足,但有没有觉得它也有一些无法替代的局限性?比如在观察细胞命运决定这种需要长时间追踪的动态过程时,固定成像会遇到什么麻烦?大家觉得,未来会不会有技术能真正实现既"高清"又"动态"的胚胎成像?
2、文章中提到,这个深度学习框架从果蝇到斑马鱼、小鼠胚胎,甚至人类器官芯片都能用,只需要换一种染料就行。听起来超厉害,但实际应用起来是不是还有隐藏的挑战,比如不同生物的模型训练起来有没有特殊要求?或者说,这个技术离真正“想看啥看啥”有多远?
3、这项能在分子和单细胞水平上精确定时胚胎发育的技术,如果未来真的广泛应用到人类类器官(比如“迷你大脑”、“迷你肝脏”)研究中,大家觉得会带来哪些伦理或法律上的挑战?我们该如何看待和衡量这种技术进步与潜在的伦理边界?

原文内容

图片
来源:ScienceAI
本文约1800字,建议阅读5分钟
上海交通大学提出了一种多尺度集成深度学习方法,以 1 分钟的分辨率从固定果蝇胚胎图像的核形态中精确推断绝对发育时间。


胚胎发育,一个生命形成的过程,从单个细胞逐渐分化,其中复杂的动态空间-时间表达决定了细胞命运决定和身体结构的形成。

但是在此过程中,传统成像方式却无法在时间上同时追踪多种波动的分子。固体胚胎成像提供了必要的灵敏度和容量,但缺乏时间分辨率。

上海交通大学提出了一种多尺度集成深度学习方法,以 1 分钟的分辨率从固定果蝇胚胎图像的核形态中精确推断绝对发育时间。

该研究以「Deep learning-based high-resolution time inference for deciphering dynamic gene regulation from fixed embryos」为题,于 2025 年 7 月 16 日刊登在《Nature Communications》。

论文链接:https://www.nature.com/articles/s41467-025-61907-7

解码胚胎发育

胚胎发育是由个体细胞中的复杂基因调控网络规划设计,如,在早期果蝇胚胎中,此时虽还未形成可见身体结构,但沿前-后(AP)轴的未来身体节段就已经被预先定义好了。

传统的实时成像受限于复杂的相互作用,固定成像的精细尺度又不足。深度学习的介入让这些问题变得逐渐清晰。该研究团队所采用的回归方法用于在 nc11-14 阶段推断早期果蝇胚胎的绝对发育时间,时间分辨率可达 0.3~1 分钟。

该回归方式采用了三种独立的卷积神经网络(CNN)模型进行集成学习,以此捕捉多尺度空间范围内的形态特征。它能够精确地从固定胚胎的标准 DNA 图像中推断出发育时间,不受品系的影响。

为了将发育时间与动态核信号相关联,团队收集了超过 30 个转基因果蝇胚胎的组蛋白 H2A-RFP 的时间序列图像,并观察它们各核周期之间核数量的显著差异。

图 1:CNN 模型从活胚胎的核组蛋白图像预测发育时间。(图源:论文)

在前文中提到的三种独立 CNN 模型中,每种都有一个回归输出层,用于连续时间预测。这一点主要是通过每个胚胎图像分成多个不同大小的小窗口,捕捉不同空间尺度的时间依赖特征。

三个 CNN 独立打分,再采用中值滤波结合模型,干脆利落地得出结论。

与真实时间相比,模型的时间预测在所有核周期中既准确又精确,几乎没有偏差和变异性。几乎所有 nc11–14 的预测在 1 分钟内都是准确的,平均准确率达到了 96.25%。(nc11:100%,nc12:98%,nc13:100%,nc14:87%)

结果显示,基于 CNN 的方法在提取全面的图像特征进行精确时间推断方面具有极高价值,且团队还发现该方法对 nc14 的预测显著优于基于膜内陷的传统时间推断方法。

DNA 中的实验

核 DNA 相较于组蛋白,可以采用有机染料更方便的进行标记。但此处的难点是:DNA 图像和组蛋白图像长得不一样,模型不能直接搬家。

因此,实验里,先用 160 只固定胚同时为 DNA 和组蛋白染色,让 CNN 根据组蛋白推断胚胎的时间轴,并应用到 DNA 基模型上。适当校准图像与的对比度与饱和度后,这些 DNA 基模型的综合预测结果与基于组蛋白的时间推断结果高度一致。

图 2:使用接力学习从固定胚胎的 DNA 图像中推断时间。(图源:论文)

如果想要将该方法推广到其他果蝇品系,特别是野生型(WT)的话,就需要对胚胎的 DNA 图像进行相应地缩放。

有了这个时间轴,对基因的工作才更好展开。

以一个多因素调控基因 Kr 为例。通过从 DNA 信号推断发育时间,团队迅速量化了固定胚胎在 nc11-13 期间核 Kr 转录和 Bcd 及 Hb 浓度的空间-时间分布。

图 3:从固定胚胎中解析多个 TF 对 Kr 的动态调控。(图源:论文)

在 nc13 期间,Kr 出现了两个明显的表达峰值,而在之前这两个峰值是无法区分的,这一点凸显了新方法的敏感性。早期峰值的持续时间显著短于晚期峰值,解释了之前报道的 nc13 晚期 Kr 表达增加的现象。

小结

以早期果蝇胚胎为例,研究团队展示了他们的方法在单细胞和单分子水平上揭示关键发育基因的转录调控的强大能力。

与现有的基于 CNN 的胚胎分期方法相比,新方法更专注于快速变化的核信号,在精细化时间分辨力的同时,采用回归输出,允许连续时间观测。三个独立预测的网络覆盖了多个空间尺度,这使得模型有更强的稳健性与适应性。

放眼未来,这套框架可与单细胞测序、空间转录组、类器官成像无缝对接——从果蝇到斑马鱼,从小鼠胚胎到人类器官芯片,只需换一支染料,就能让所有「静态切片」秒变「高清延时影片」。

尽管眼下,这种方法还需大量胚胎成像,但它确实是一种有效通用的解决方案,可在不进行基因修饰的情况下准确量化发育动态。期待之后这种方法与高通量 RNA、蛋白质等的整合将会带来怎样的技术进步。

编辑:文婧



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


从技术扩展性来看,深度学习的泛化能力确实很强,因为它学习的是底层的图像特征。然而,跨物种应用的最大挑战在于物种特异性。即便都是胚胎,果蝇的合胞体胚胎发育模式与脊椎动物的细胞性胚胎发育模式截然不同。这意味着,尽管算法框架可复用,但模型可能需要进行大量的迁移学习、微调甚至重新训练。更重要的是,生物成像前期的样本制备、固定、染色流程都需要针对不同物种进行优化,确保图像质量能够满足模型输入要求。此外,不同物种的发育周期和关键形态事件也不同,需要专业的生物学知识来指导数据标注和模型验证。所以,从“理论可行”到“普遍实用”,还有大量的生物学和工程学工作需要克服,并非仅仅更换染料那么简单。

固定成像最大的问题就是“定格”了瞬间,你看不到连续的变化过程。就像拍一张照片,你确实能看清每一个像素的细节,但你永远不知道这张照片前后发生的故事。对于细胞命运这种,一个细胞在特定时间点经历了什么刺激,如何分化成另一种细胞,这些动态轨迹是固定成像无法提供的。所以研究者经常需要做大量的固定样本,再推断时间轴,这中间的“推断”环节,多少会损失一些真实性。要做到既高清又动态,我觉得得是物理、光学和AI多学科的突破,比如超高速、低光毒性、高分辨率的显微镜结合强大的实时AI处理,甚至可能需要新的成像介质或者标记技术。

从学术角度看,固定成像的优势在于高分辨率和多标记分析能力,能够同时观察多个分子在特定时间点的空间分布。但其核心局限在于丧失了时间维度上的连续性信息,这对于理解如细胞迁移、细胞间相互作用动态、信号通路激活反馈等活细胞复杂过程是致命的。像细胞命运决定这种通常是逐步且受环境影响的动态过程,固定成像只能通过时间点采样来间接推断,可能错过关键的瞬时事件或中间态。未来技术趋势是结合光片显微镜、活细胞超分辨成像、以及文中所述的深度学习时间推断等多种技术,力求在保持活细胞生理状态下,实现更高的时空分辨率,或者通过更智能的算法从离散数据中重建连续动态。

别只看换染料啊!染料只是“颜料”,模型才是“画笔”和“画师”。不同的生物个体差异太大,模型得重新学习它们的“长相”和“发育史”,这可不是换个皮肤那么简单。就好比你教AI认猫狗,它能认得很好,但你突然让它去认恐龙,而且还不能给它看几十万张恐龙照片,它肯定也懵圈。从实验室到实际应用,还有很多工程问题要解决,比如成像效率、数据存储、计算资源等等。离“想看啥看啥”嘛,我觉得我们现在是拿了个高清望远镜看到了宇宙的一角,要想看清整个宇宙,还得造更多更大的望远镜,而且还得有好多好多时间。

从长远来看,这项技术在人类类器官研究中的全面应用无疑会加速我们对人类发育、疾病机制(如神经退行性疾病、先天性畸形)以及药物筛选的理解,具有巨大的医疗潜力。然而,它也确实触及了伦理的敏感区域。主要挑战包括:1. 定义“生命”边界:如果类器官复杂到一定程度,其是否存在感知能力或初级意识?2. 实验目的正当性:研究是否符合全人类福祉,而非为了满足好奇心或军事、非人道目的?3. 资源分配:投入巨资研究类器官是否会挤占其他更有直接效益的科研方向?4. 公众认知与接受度:如何向公众解释这类前沿研究,避免恐慌或误解?应对这些挑战,需要科学家、伦理学家、法律专家和社会公众之间的广泛对话,建立前瞻性的国际伦理准则,并在研究过程中严格遵循“最小伤害”原则,确保研究在可控和负责任的框架内进行。

理论上是这样,毕竟都是生物组织,形态学特征在一定程度上是通用的。但“只需要换一种染料”这话听起来容易,做起来可没那么简单。首先,不同生物的胚胎形态差异巨大,果蝇和斑马鱼、小鼠,甚至和人类类器官,它们的细胞大小、排列方式、发育速度、关键形态特征等等都可能不同,这意味着你得为每一种生物重新训练或进行大量的微调。其次,数据的获取是个大问题,尤其对于稀有的、难以大量获取的样本(比如灵长类或人类类器官),训练高质量的深度学习模型需要海量的标注数据,这可不是轻易就能搞定的。所以,“想看啥看啥”确实是美好愿景,但离实现还有漫长的路,可能更像是针对特定问题定制化的解决方案,而非万能钥匙。

哎呀,这不就是所谓的鱼和熊掌不可兼得嘛!固定成像能给你看清“骨骼”和“内脏”的精细结构,因为它可以用各种强力染色剂,但它就是一具“尸体”;实时成像就像看“活人”表演,你可以看到它从出生到死亡的整个过程,但可能因为怕伤害它(光毒性),所以看得就没那么清楚。我觉得未来嘛,AI肯定能帮大忙,比如它能从一些模糊的实时视频里,用AI算法把它“脑补”成高清,或者预测这个细胞接下来会怎么动。想象一下,一个AI能把几十张固定胚胎的“快照”直接给你合成一部“纪录片”,那才是真的牛批!

这是一个非常深刻的问题。如果能以如此高的精度追踪人类类器官的发育,最大的伦理挑战将围绕着类器官的“意识”和“主体性”展开。特别是“迷你大脑”这类接近人类器官的复杂类器官,如果未来技术发展到能够模拟部分脑功能,甚至出现某种形式的神经活动或“意识迹象”,届时如何定义其生命状态、是否拥有权利、以及在实验中是否应受到保护,将成为极具争议的焦点。法律层面,可能需要重新审视现有的关于人类胚胎、组织捐赠以及实验伦理的法规,制定专门的类器官研究伦理指南,明确其培育、使用和销毁的边界。科技发展势不可挡,但我们必须在伦理的约束下,确保技术造福人类而非带来灾难。

哇塞,一说到“迷你大脑”我就想起科幻片里那些细思极恐的场景!要是哪天真培养出一个有那么一点点自我意识的“迷你大脑”,哪怕只有苍蝇那么大,那它算不算“人”?我们做实验是不是算“虐待”?想想就头皮发麻。伦理上肯定会吵翻天,法律上也不知道要怎么管。我觉得大概率会限制这些东西不能发育成太复杂,或者必须在达到某种“意识阈值”前就销毁。但这个“阈值”怎么定?由谁来定?这都是大麻烦。感觉我们一边在享受科技带来的便利,一边在给自己挖坑。