UCL发布MindGlide模型:AI赋能多发性硬化症MRI数据分析,助力病灶量化

UCL团队发布MindGlide模型,利用AI从MS患者的MRI扫描中提取关键信息,实现病灶量化,为MS研究和临床决策提供支持。

原文标题:最大化挖掘临床MRI数据价值,UCL团队提出MindGlide模型,实现多发性硬化症病变量化

原文作者:数据派THU

冷月清谈:

伦敦大学学院(UCL)团队开发了名为MindGlide的人工智能方法,旨在从多发性硬化症(MS)患者的MRI扫描图像中提取关键信息,如大脑受损区域、脑萎缩和病灶变化。该研究亮点在于能够从单张MRI图中提取多个临床相关的MRI生物标志物,与现有技术相比,在多个关键领域表现更优异。MindGlide基于U-Net架构的3D卷积神经网络,通过大量真实和合成MRI图像进行训练,能够同时分割脑灰质、白质区域以及MS病变。实验结果表明,MindGlide在病灶分割、治疗效果监测等方面均优于现有技术,适用于多种临床场景,有望为MS研究和临床决策提供有力支持。此外,文章还介绍了人工智能在MS研究中的其他应用,例如通过人工智能虚拟筛选靶向AMPA受体的药物,以及用于MS患者MRI扫描中同时分割白质病变和神经解剖结构的开源工具。

怜星夜思:

1、MindGlide模型在处理不同类型的MRI图像时,例如不同切片厚度或者扫描仪型号的数据,效果会有差异吗?未来的研究方向应该如何优化以提高模型的泛化能力?
2、MindGlide模型主要用于病灶分割和体积测量,那么它在预测患者的疾病进展和预后方面有什么潜力?我们应该如何利用该模型来改善MS患者的长期管理?
3、文章提到MindGlide模型基于nnU-Net架构,这是一种自动自配置的3D CNN。相比其他深度学习架构,你认为nnU-Net有哪些优势和局限性?在未来的医学影像分析中,我们应该如何选择合适的深度学习架构?

原文内容

源:HyperAI超神经

本文共3800字,建议阅读10分钟

这些种种的科技成果和前沿发现,无一不透露着人工智能在 MS 研究中的价值,虽然路途尚远,但也让人们看到了希望。



英国伦敦大学学院团队开发了一款名为 MindGlide 的 AI 方法,可以从 MS 患者护理过程中获得的 MRI 扫描图像中提取关键信息,例如大脑受损区域、大脑萎缩和斑块等细微变化。

多发性硬化症 (Multiple sclerosis, MS) 是一种以中枢神经系统白质炎性脱髓鞘病变为主要特点的慢性致残疾病,多以青壮年人群为目标,故又被称为「年轻人的隐形杀手」。据相关数据统计,全球有超过 280 万人受其影响。在亚洲,每 10 万人中就约有 1-5 个人罹患 MS,且该病已成为中国青壮年致残原因中仅次于外伤的疾病。2018 年,中国将该病列入《第一批罕见病目录》。

大脑磁共振成像 (Magnetic resonance imaging, MRI) 标志物在 MS 临床治疗和研究中至关重要,比如通过多重对比 MRI 扫描,可以捕捉疾病演变。然而,多重对比需要不同类型的专业扫描设备,过程耗时费力且成本昂贵,很多医院更是不具备此条件。因此,如何简化 MRI 分析就成为解决问题的关键,尤其是通过单对比度脑容量计算,既可以减少多重对比采集的需求,又可以降低临床试验成本。

基于此,英国伦敦大学学院的研究团队开发了一款名为 MindGlide 的工具,可以从 MS 患者护理过程中获得的 MRI 扫描图像中提取关键信息,例如大脑受损区域、大脑萎缩和斑块等细微变化。MindGlide 证明了常规 MRI 扫描在缺乏理想成像对比时,依旧有发现新病变和细微脑组织损伤方面的潜力,同时也有望进一步帮助医护人员提升解释和评估 MS 患者的治疗效果的能力。

相关研究以「Enabling new insights from old scans by repurposing clinical MRI archives for multiple sclerosis research」为题,发表于 Nature Communications。

研究亮点:

*实现了从单个 MRI 对比中提取多个临床相关 MRI 生物标志,并且与最先进技术相比,MindGlide 能够在多个关键领域表现的更优异。

* 即使使用有限的 MRI 数据和通常不用于这些任务的单对比,也可以实现具有临床意义的组织分割和病变量化。

论文地址:https://www.nature.com/articles/s41467-025-58274-8

开源项目「awesome-ai4s」汇集了百余篇 AI4S 论文解读,还提供海量数据集与工具:
https://github.com/hyperai/awesome-ai4s

数据集:所有数据基于 MS 患者采集而来

为了验证模型的可靠性和有效性,研究采用了不同的训练数据集和外部验证数据集,且数据完全来自 MS 患者。该研究得到了蒙特利尔神经学研究所的国际进行性多发性硬化症联盟 (International Progressive MS Alliance) 数据库支持,并抽取了相关训练数据,主要来自 MS-stat 试验、ORATORIO 试验,以及英国 3 家医院获取的儿科复发缓解型 MS 患者的常规护理数据集和 2 个开源病变分割数据集(MS-30 和 ISBI)。

*MindGlide 通过医院档案中常用的 MRI 对比和相关组织强度(T1-weighted、TI-weighted、Proton Density (PD) 和 T2-Fluid Attenuated Inversion Recovery (FLAIR))处理 MRI,包括 2D 和 3D 扫描。

在模型训练阶段,研究人员使用了 8,550 张真实和合成图像的数据集对 MindGlide 进行训练。其中,真实的 MRI 扫描图像共计 4,247 张(包括 2,092 张 TI-weighted 和 2,155 张 FLAIR),来自 2,871 名患者(包括 1,082 名复发缓解型 MS 患者 (RRMS)、1,453 名继发进行型 MS 患者 (SPMS) 和 336 名原发进行型 MS 患者(PPMS))。这些扫描图像通过 592 台专业的 MRI 扫描仪器分别在 1.5 和 3 特斯拉磁场下获得。随后,研究人员又生成了 4,303 张合成扫描图像来扩展训练。


训练集的患者特征

在模型验证阶段,研究人员采用了一组外部验证集,测试了 MindGlide 在 14-64 岁年龄段的通用性,包括两项进展性 MS 临床试验和一组真实的儿科复发缓解型 MS 患者。外部验证数据集包含了 1,001 名患者(PPMS 试验 699 名,SPMS 试验 141 名,RRMS 试验 161 名),通过 186 台 MRI 扫描仪获得。

其中,PPMS 数据集包括 11,015 个 MRI 扫描(2,756 个 TI-weighted、2,754 个 T2-weighted、2,749 个 FLAIR、2,756 个 PD),所有切片厚度均为 3mm(1mm x 1mm x 3mm);SPMS 数据集包括 763 次扫描(378 次 TI-weighted、385 次 T2-weighted),具有不同的切片厚度(T1-weighted 为 1mm x 1mm x 1mm;T2-weighted 为 3mm x 1mm x 1mm);儿科 RRMS 数据集包括 1,478 次扫描(523 个 T1-weighted、475 个 T2-weighted、480 个 FLAIR),包含不同的切片厚度。

模型架构:一种高效 3D 卷积神经网络

MindGlide 的开发基于「nnU-Net」,这是一种基于 U-Net 架构的 3D 卷积神经网络 (CNN) ,它具有自动自配置的能力,从而可以绕过昂贵的超参数调谐过程。通过训练,MindGlide 可以同时分割脑灰质、白质区域以及 MS 病变,从而适应真实的 MRI 变化,解决传统图像处理软件中的伪影问题。整体架构及策略如下图所示。


MindGlide 训练及外部验证策略的相关步骤

针对模型训练的图像预处理,研究人员使用了一个最小的预处理管道,首先将图像分辨率标准化为 1 mm 各向同性体素,然后根据 nnU-Net 设计。然后研究人员使用滑动窗口技术提取 128 x 128 x 64 体素补丁,以优化训练期间的内存和计算效率。

数据增强主要是通过随机修改人为地扩大训练数据的多样性,增强模型的可泛化性,减轻过拟合。研究人员采用了两种技术用于扩大其适应性,一是扭曲真实扫描的几何形状和图像强度,二是生成合成扫描。如图中 a 所示,采用域随机化,产生强度变化,为不同的 MRI 对比准备模型。

合成数据的生成使用了 SynthSeg 2.0 版本,另外研究人员使用 MONAI 1.2.0 版本在训练期间进行增强,然后直接从训练数据集的标签生成不同对比度的合成扫描。如图中 a 演示了生成的合成数据示例,并在图 b 中展示了通过真实数据和增强数据训练 MindGlide。

在相关的报道中,媒体用直观的数据展示了这款模型的能力。其提到,以往神经放射科专家需要数周才能手动解读的复杂扫描,如今 MindGlide 每张图只需要 5 到 10 秒,这使得以前无法分析的图像和常规 MRI 扫描图像获得了新的价值,在临床试验和常规护理中检测不同治疗方法对疾病进展的影响有了更可靠的依据。

实验结果:多维度对比显示 MindGlide 的优越性

为了评估 MindGlide 的验证效果,研究人员将其与现有最先进的技术进行了对比,比对对象分别为 WMH-SynthSeg 和 SAMSEG,其中前者能够从不同分辨率和对比度的扫描中同时分割白质高信号和大脑解剖结构,后者能够在不同 MRI 对比度下稳健分割病变和大脑结构。

首先,实验比较了三者与人类专家标记病变分割与残疾的一致性情况,如下图所示。MindGlide 与人工标记的真实病变之间的一致程度更高,中位数 Dice 得分为 0.606,SAMSEG 为 0.504,WMH-Synthseg 为 0.385。


性能比较概况

另外,在 PPMS 数据集中,MindGlide 得出的病变负荷与扩展残疾状态量表 (Expanded Disability Status Scale,EDSS) 的数值相关性也比现有技术更高。

随后,研究人员进行了针对病变治疗效果的纵向验证,涉及多项实验,证明了 MindGlide 在治疗效果检测方面的有效性,如在 SPMS 和 PPMS 试验中,治疗组的病变体积累积量低于安慰剂组;在儿科队列中,MindGlide 成功检测了不同治疗组中病变体积的不同变化,如下图所示。


常规护理儿科数据集中脑区域和病变体积的纵向变化

在检测脑组织损失的治疗效果中,MindGlide 显示了治疗组皮质 GM 体积损失率明显低于安慰剂组。下图为各种对比的分割示例。

在此之后,研究人员继续在 PPMS 临床实验中比较了 MindGlide 与其他分割工具和真实病变的治疗效果。实验结果显示 MindGlide 与基础真值非常接近,相比之下, SAMSEG 高估了治疗效果,WHM-Synthseg 则低估了治疗效果,表明了 MindGlide 的病变体积估计精度更高。

下图显示了三者对区域脑容量的评估,结果显示,与纵向 SAMSEG 或 WHM-Synthseg 获得的测量结果相比,MindGlide 的测量结果显示治疗组之间的治疗效果更好。


MindGlide、SAMSEG、WHM-Synthseg 纵向脑区变化及病灶体积比较

另外在常规护理临床数据集中,研究人员目视检查了 WMH-Synthseg 和 MindGlide,结果显示,前者显示出显著的失败率,尤其是扫描厚度超过 5mm 时。在视觉评估的 433 个对比中,WMH-Synthseg 未能分割 65 个扫描,而 MindGlide 仅有 6 个。示例如下图。


MindGlide 和 WMH-Synthseg 分割示例

其中,图 (b) 显示了常规护理临床数据集 (RRMS) 中的一个厚度为 7mm 的切片,WMH-Synthseg 分割失败。这是因为大多数分割工具被设计为使用优劣采集方向,而 MindGlide 允许对任何方向获取的图像进行分割。

总而言之,MindGlide 在多方面都表现出优于现有方法的特征,并且可以从单一 MRI 对比中提取多种生物标志物,能够有效监测治疗效果,适用于多种临床场景,为 MS 研究和临床决策提供有力支持。

AI 已成为 MS 研究中的重要手段

近年来,人工智能的快速发展,使其在神经系统疾病方面的应用不断加快,并且由于其独特的工作机制和高效的方法,为医学界通过人工智能进行 MS 研究提供了新的思路。无独有偶,针对 MS 这一危害人类健康的重大难题,不少实验室都在利用人工智能进行攻克的尝试。

比如来自多伦多大学的刘芳教授课题组曾在 Science Advances 上发表过一篇题为「Small-molecule targeting AMPA-mediated excitotoxicity has therapeutic effects in mouse models for multiple sclerosis」的文章,该研究克服了传统理论的观点,突破性地开发了一种小分子化合物,通过靶向一个新的调控 AMPA 受体介导的兴奋毒性机制发挥作用。该研究采用了人工智能虚拟筛选靶向 AMPA 受体 GluA 2 亚基的小分子,不仅为国际上此类药物研发填补了空白,更难能可贵是为 MS 治疗提供了一种全新的思路。

论文地址:

https://www.science.org/doi/10.1126/sciadv.adj6187

除此之外,一篇发表于 NeuroImage 的研究也提出了一种用于 MS 患者 MRI 扫描中同时分割白质病变和 41 个神经解剖结构的新开源工具。这种方法正是基于上述提到的生成式模型 SAMSEG 进行扩展,能够适应不同的扫描和成像协议,无需预先分割病变即可评估萎缩,克服了现有工具的一些局限性。相关文章以「A contrast-adaptive method for simultaneous whole-brain and lesion segmentation in multiple sclerosis」为题发表。

论文地址:

https://www.sciencedirect.com/science/article/pii/S1053811920309563?via%3Dihub


而这些种种的科技成果和前沿发现,无一不透露着人工智能在 MS 研究中的价值,虽然路途尚远,但也让人们看到了希望。正如上述文章第一作者 Philipp Goebl 博士所希冀的,通过人工智能进行临床试验来解决患者病情, 或许未来 5 到 10 年可成为现实。

编辑:黄继彦‍‍




关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU

nnU-Net的优势在于其自动化程度高,能够根据数据集的特性自动配置网络结构和训练参数,减少了人工调参的工作量。此外,3D CNN能够充分利用MRI图像的空间信息,提高分割精度。但是,nnU-Net的局限性在于其计算复杂度高,需要大量的GPU资源和训练时间。此外,nnU-Net对于小样本数据集的泛化能力可能较弱。

在选择深度学习架构时,需要综合考虑以下几个因素:

1. 数据集大小:如果数据集较小,可以选择迁移学习或使用预训练模型。
2. 计算资源:如果计算资源有限,可以选择轻量级的网络结构,例如MobileNet或ShuffleNet。
3. 任务复杂度:如果任务比较复杂,可以选择更深的网络结构,例如ResNet或DenseNet。
4. 领域知识:结合医学影像的特点,选择合适的网络结构和损失函数。

与其纠结用哪个架构,不如关注数据质量。再牛逼的模型,喂进去一堆垃圾数据,也出不来好结果。所以,数据清洗和标注才是王道!

楼上分析得头头是道!我觉得除了技术层面,数据本身也很重要。现在的数据集主要来自欧美,如果能加入更多亚洲人群的数据,模型在中国乃至亚洲的适用性肯定会更好。毕竟人种、生活习惯啥的,都可能影响脑部结构和病变特征。

这个问题很有意义!病灶分割和体积测量只是第一步,预测疾病进展和预后才是最终目标。MindGlide模型可以与患者的临床数据相结合,构建一个综合的预测模型。具体来说,可以考虑以下几个方面:

1. 纵向研究:收集患者的长期MRI数据和临床信息,分析病灶变化与疾病进展之间的关系。
2. 风险分层:根据MindGlide的输出结果,将患者分为不同的风险等级,制定个性化的治疗方案。
3. 药物反应预测:利用MindGlide预测患者对不同药物的反应,选择最有效的治疗方案。
4. 早期诊断:在疾病早期,通过MindGlide检测到细微的病灶变化,实现早期诊断和干预。

我觉着吧,预测疾病进展这种事儿,光靠MRI数据可能不够。还得结合患者的生活方式、家族病史啥的。搞个app,让大家每天记录自己的感受,再用AI分析一下,说不定能更准!

楼上的想法挺有意思!不过也要注意保护患者隐私。现在数据安全问题这么敏感,收集个人信息要小心谨慎。

有没有考虑过患者的个体差异?MS的病程和表现千差万别,会不会影响模型的判断?感觉可以引入个体化的参数,比如病程长短、复发次数等等,让模型更智能。

这个问题提得很好!文章中提到MindGlide模型在不同数据集上进行了验证,包括不同切片厚度和扫描仪的数据。虽然模型表现出了不错的泛化能力,但实际应用中,数据质量和多样性仍然是关键。未来可以考虑以下几个方向来优化:

1. 数据增强:文中使用了合成数据来扩充训练集,可以进一步探索更高级的数据增强技术,例如GANs生成更逼真的MRI图像。
2. 领域自适应:研究不同扫描仪和成像协议对模型的影响,采用领域自适应学习方法,减少模型对特定设备的依赖。
3. 多模态融合:结合其他影像学数据(例如PET)或临床数据,提高模型的诊断精度和鲁棒性。
4. 模型结构优化:探索更先进的神经网络结构,例如Transformer,来捕捉MRI图像中的长程依赖关系。

nnU-Net这种“傻瓜式”操作确实方便,但有时候也让人感觉不够灵活。如果能根据具体任务定制网络结构,效果可能会更好。比如,对于病灶分割,可以考虑加入注意力机制,让网络更关注关键区域。