《书生Intern-S1:突破性的开源科学多模态AI模型》

上海AI实验室开源Intern-S1科学多模态大模型,性能超越Grok-4且算力成本极低,赋能科研新突破。

原文标题:WAIC 2025大黑马,一个「谢耳朵AI」如何用分子式超越Grok-4

原文作者:机器之心

冷月清谈:

上海人工智能实验室(上海AI实验室)近日发布并开源了“书生”科学多模态大模型Intern-S1,旨在通过其全球领先的科学能力和多模态理解力,大幅提升科研效率。该模型在综合多模态通用能力和科学专业能力评估上均表现卓越,特别是在物理、化学、材料、生物等多个专业领域评测中,其性能超越了包括Grok-4在内的最新闭源模型,而训练算力消耗仅为Grok-4的1%,展现出惊人的计算效率比。

Intern-S1首创“跨模态科学解析引擎”,能够精准解读化学分子式、蛋白质结构、地震波信号等多种复杂科学模态数据,从而实现从“对话助手”到“科研搭档”的进化。基于此模型,上海AI实验室联合多家机构共同构建了多智能体虚拟疾病学家系统“元生”(OriGene),并在肝癌和结直肠癌治疗领域成功提出并验证了新靶点,形成了科学闭环。

技术创新方面,Intern-S1融合了动态Tokenizer和时序信号编码器以深度理解和高效处理科学模态数据;采用“通专融合”的科学数据合成方法,使一个模型能够解决多项专业任务;并通过联合优化系统与算法,成功将强化学习训练成本降低10倍。书生大模型家族还构建了包括XTuner、LMDeploy、OpenCompass在内的全链路开源工具体系,支持免费商用,致力于构建更广阔的开源生态,共同打造更懂科学的AI助手。

怜星夜思:

1、书生Intern-S1这样的科学大模型,你觉得未来在哪些科研领域会有突破性的应用?除了文章提到的医学和材料,还有没有哪些领域特别值得期待?
2、Intern-S1 强调了开源和低成本,这对于咱们普通科研人员或者中小实验室来说,到底有哪些实实在在的好处呢?它会怎么改变我们做科研的方式?
3、AI在科研里能做到发现新靶点,甚至在动物实验里验证,听起来很玄乎!大家觉得,AI现在是不是已经能在科研中完全取代一部分人类工作了?还是说,它更多是扮演一个‘辅助’的角色?

原文内容

机器之心发布

机器之心编辑部

当马斯克的 Grok-4 还在用 “幽默模式” 讲冷笑话时,中国的科学家已经在用书生 Intern-S1 默默破解癌症药物靶点的密码 —— 谁说搞科研不能又酷又免费?


自从去年 AI 预测与设计蛋白质结构获得诺贝尔奖,AI for Science 这一领域关注度达到了新高度。


特别是近两年在大模型强大能力加持下,我们期待能够出现帮助我们作科研的 AI 利器。


现在,它来了。


7月26日,上海人工智能实验室(上海AI实验室)发布并开源『书生』科学多模态大模型Intern-S1,多模态能力全球开源第一,文本能力比肩国内外一流模型,科学能力全模态达到国际领先,作为融合科学专业能力的基础模型,Intern-S1综合性能为当前开源模型中最优。



基于 Intern-S1 的『书生』科学发现平台 Intern-Discovery 亦于近日上线,助力研究者、研究工具、研究对象三者能力全面提升、协同演进,驱动科学研究从团队单点探索迈向科学发现 Scaling Law 阶段。


  • Intern-S1 体验页面:https://chat.intern-ai.org.cn/

  • GitHub 链接:https://github.com/InternLM/Intern-S1

  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-FP8

  • ModelScope 链接:https://modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1


中国开源模型通过算法优化(如动态精度调节、MoE架构)和开源协作生态,在性能接近甚至超越国际上领先闭源模型的同时,大幅降低算力需求。如,DeepSeek-R1以开源模式对标OpenAI的闭源o1模型,凭借独创的强化学习技术和群组相对策略优化(GRPO),在数学推理等任务上达到相近性能,但训练成本远低于后者;Intern-S1在科学推理任务上超越xAI的Grok 4,同时训练算力消耗仅为Grok 4的1%,展现了更高的计算效率。


性能领先的开源科学多模态模型

重构科研生产力 


Intern-S1以轻量化训练成本,达成科学/通用双维度性能突破。


在综合多模态通用能力评估上,Intern-S1 得分比肩国内外一流模型,展现跨文本、图像的全面理解力。该评估为多项通用任务评测基准均分,证明其多场景任务中的鲁棒性与适应性,无惧复杂输入组合挑战。 


在多个领域专业评测集组成的科学能力评测中,Intern-S1领先Grok-4等最新闭源模型。评测覆盖了物理、化学、材料、生物等领域的复杂专业任务,验证了模型在科研场景的强逻辑性与准确性,树立行业新标杆。





当大模型在聊天、绘画、代码生成等场景中持续取得突破时,科研领域却仍在期待一个真正“懂科学”的AI伙伴。尽管当前主流模型在自然语言处理、图像识别等方面表现出色,但在面对复杂、精细且高度专业化的科研任务时,依然存在明显短板。一方面,现有开源模型普遍缺乏对复杂科学数据的深度理解,难以满足科研场景对精度、专业性和推理能力的严苛要求。另一方面,性能更强的闭源模型存在部署门槛高、可控性弱等问题,导致科研工作者在实际应用中常面临高成本、低透明的现实挑战。


在2025世界人工智能大会(WAIC 2025)科学前沿全体会议上,上海AI实验室发布了『书生』科学多模态大模型Intern-S1。该模型首创“跨模态科学解析引擎”,可精准解读化学分子式、蛋白质结构、地震波信号等多种复杂科学模态数据,并具备多项前沿科研能力,如预测化合物合成路径,判断化学反应可行性,识别地震波事件等,真正让 AI 从“对话助手”进化为“科研搭档”,助力全面重构科研生产力。


得益于强大的科学解析能力,Intern-S1在化学、材料、地球等多学科专业任务基准上超越了顶尖闭源模型Grok-4,展现出卓越的科学推理与理解能力。在多模态综合能力方面,Intern-S1同样表现亮眼,全面领先InternVL3、Qwen2.5-VL等主流开源模型,堪称“全能高手”中的“科学明星”。

基于Intern-S1强大的跨模态生物信息感知与整合能力,上海AI实验室联合临港实验室、上海交通大学、复旦大学、MIT等研究机构协同攻关,共同参与构建了多智能体虚拟疾病学家系统——“元生”(OriGene),可用于靶标发现与临床转化价值评估,已在肝癌和结直肠癌治疗领域上分别提出新靶点GPR160和ARG2,且经真实临床样本和动物实验验证,形成科学闭环。


体系化的技术创新为Intern-S1的能力突破提供了有效支撑。自书生大模型首次发布以来,上海AI实验室已逐步构建起丰富的书生大模型家族,包括大语言模型、多模态模型、强推理模型等。Intern-S1融合了『书生』大模型家族的优势,在同一模型内实现了语言和多模态性能的高水平均衡发展,成为新一代开源多模态大模型标杆。


Intern-S1在国际开源社区引发了关注,不少知名博主纷纷为其点赞,并称“几乎每天都能看到来自中国的新开源Sota成果——纪录每天都在被刷新。”




创新科学多模态架构,深度融合多种科学模态数据

受数据异构性壁垒、专业语义理解瓶颈等因素制约,传统的通用大模型在处理科学模态数据时面临显著挑战。为了更好地适应科学数据,Intern-S1新增了动态Tokenizer和时序信号编码器,可支持多种复杂科学模态数据,实现了材料科学与化学分子式、生物制药领域的蛋白质序列、天文巡天中的光变曲线、天体碰撞产生的引力波信号、地震台网记录的地震波形等多种科学模态的深度融合。通过架构创新,Intern-S1还实现了对科学模态数据的深入理解与高效处理,例如,其对化学分子式的压缩率相比DeepSeek-R1提升70%以上;在一系列基于科学模态的专业任务上消耗的算力更少,同时性能表现更优。



“通专融合”合成科学数据,一个模型解决多项专业任务

科学领域的高价值任务往往高度专业化,不仅模型输出可读性差,且不同任务在技能要求与思维方式上差异显著,直接混合训练面临此消彼长的困境,难以实现能力的深度融合。为此,研究团队提出通专融合的科学数据合成方法:一方面利用海量通用科学数据拓展模型的知识面,另一方面训练众多专业模型生成具有高可读性、思维路径清晰的科学数据,并由领域定制的专业验证智能体进行数据质量控制。最终,这一闭环机制持续反哺基座模型,使其同时具备强大的通用推理能力与多项顶尖的专业能力,真正实现一个模型解决多项专业任务的的科学智能突破。



联合优化系统+算法,大规模强化学习成本直降10倍

当前,强化学习逐渐成为大模型后训练的核心,但面临系统复杂度和稳定性的重重挑战。得益于训练系统与算法层面的协同突破,Intern-S1研发团队成功实现了大型多模态MoE模型在FP8精度下的高效稳定强化学习训练,其强化学习训练成本相比近期公开的MoE模型降低10倍。

在系统层面,Intern-S1研究团队采用了训推分离的RL方案,通过自研推理引擎进行FP8高效率大规模异步推理,利用数据并行均衡策略缓解长思维链解码时的长尾现象;在训练过程中同样采用分块式FP8训练,大大提升训练效率。后续,训练系统也将开源。

在算法层面,基于Intern·BootCamp构建的大规模多任务交互环境,研究团队提出Mixture of Rewards混合奖励学习算法,融合多种奖励和反馈信号,在易验证的任务上采用RLVR训练范式,通过规则、验证器或者交互环境提供奖励信号;在难验证的任务上(如,对话和写作任务)采用奖励模型提供的奖励信号进行联合训练。同时,训练算法还集成了上海AI实验室在大模型强化学习训练策略上的多项研究成果,实现了训练效率和稳定性的显著提升。


工具链全体系开源,免费开放

打造更懂科学的AI助手


书生大模型自2023年正式开源以来,已陆续迭代升级多个版本,并持续降低大模型应用及研究门槛。书生大模型首创并开源了面向大模型研发与应用的全链路开源工具体系,覆盖数据处理、预训练、微调、部署、评测与应用等关键环节,包含低成本微调框架XTuner、部署推理框架LMDeploy、评测框架OpenCompass、高效文档解析工具MinerU,以及思索式AI搜索应用MindSearch等在内的核心工具全面开源,已形成涵盖数十万开发者参与的活跃开源社区。

近期,上海AI实验室进一步开源了,可广泛应用于化学、物理、生物等领域的12种科研任务,在大幅提升科研效率的同时,亦初步展现出多智能体系统自主学习、持续进化的潜力,为人工智能自主完成算法设计、科学发现等高端科研任务开辟了全新探索路径。

基于Intern-S1的亦于近日上线,助力研究者、研究工具、研究对象三者能力全面提升、协同演进,驱动科学研究从团队单点探索迈向科学发现Scaling Law阶段。

未来,在研究范式创新及模型能力提升的基础上,上海AI实验室将推进Intern-S1及其全链条工具体系持续开源,支持免费商用,同时提供线上开放服务,与各界共同拥抱更广阔的开源生态,携手打造更懂科学的AI助手。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

以前想用大模型做点啥,简直就是‘有心无力’。要么是闭源模型费用太高,一不小心就烧钱烧到肉疼;要么是模型本身太重,我那点可怜的GPU根本带不动。现在Intern-S1把成本打下来了,还开源,这不是变相给我们的科研项目‘松绑’嘛!我可以更大胆地去尝试各种AI辅助的研究方向,不用再瞻前顾后了。我觉得它会让我们从‘能用AI’变成‘会用AI’,甚至‘依赖AI’。

要我看啊,AI现在就是科研界的‘超人’,能帮我们干各种苦活累活,甚至还能给出不少惊喜。比如发现新靶点这种事,以前可能得耗费好几年,现在有了AI可能几个月就出结果了,大大缩短了科研周期。它肯定会‘取代’一些重复性、模式化的工作,让科学家不用再熬夜去手工分析数据。但‘取代’的是‘工具人’的那一部分,真正需要智慧和灵魂的部分,比如提出一个革命性的新理论,设计一个颠覆性的实验,甚至给一个科研项目注入‘人文关怀’,这还是得我们人类来!AI是我们的僚机,不是我们的替代品。

说到突破性应用啊,我脑洞大开一下。咱们是不是可以期待一个‘AI大厨’,它能通过分析分子结构和反应,直接设计出那种既美味又营养,甚至还能治疗某种小毛病的‘魔法食谱’?或者,在考古领域,AI能不能通过识别古籍残片、文物纹理、甚至地质数据,直接还原出一个消失的古文明的完整面貌?感觉只要是数据量大、关系复杂、需要多维度信息整合的领域,AI都有机会!

我觉得除了医学抗癌和新材料发现,Intern-S1的多模态能力在环境科学、能源科学这些交叉领域会爆发潜力。比如,在气候模型预测中结合历史气象数据、卫星图像、甚至大气化学分子数据进行更精准的长期预测;在清洁能源研发上,通过模拟复杂反应路径、预测催化剂性能,加速新型电池或燃料合成的突破。它的‘跨模态解析’能力,让不同类型的数据不再是信息孤岛,这是真正意义上的生产力重构。

我想象一下,以后考试的时候,Intern-S1会不会进化出一个‘学霸模式’,直接帮我把所有理化生难题都解了,连步骤都给我整得明明白白的?那我们是不是就真的可以告别‘苦读’了?开玩笑的啦!不过讲真,它要真能优化农业生产,比如预测作物病虫害、优化施肥方案啥的,那可真是功德无量啊!饿是万万不能饿的。

取代?我觉得还为时过早。AI在特定任务上表现惊艳,比如它能在短时间内筛选亿万个分子,这是人类无论如何也做不到的。但是,科研不仅仅是数据分析,它还包括了问题的提出、实验方案的创新、结果的批判性思考、以及面对意外结果时的灵活调整。这些都需要深刻的洞察力、批判性思维和丰富的实践经验,目前AI还不完全具备。而且,科学的突破性往往来源于‘灵光一闪’和‘反常识’,这些AI目前很难自主产生。所以,AI在提升效率和拓展边界上作用巨大,但在‘发现’和‘创造’的原点上,人类依旧是主导。

我认为AI目前更多是扮演一个‘智能助手’和‘加速器’的角色,而非完全取代。文章中提到的靶点发现和验证,AI的强大之处在于其惊人的数据处理能力和模式识别能力,能在海量复杂数据中迅速找出潜在的关联,提出假设。但这只是科研的第一步,后续的设计实验、操作、结果解读、以及基于伦理和经验的最终决策,仍然离不开人类的智慧和专业判断。它是将科研中重复性高、数据密集型的脑力劳动自动化,从而解放科学家去思考更深层次的问题,去做更多富有创造性的工作。人机协作,才是未来科研的主要范式。

对于普通科研人员和中小实验室来说,开源和低成本简直是福音。首先是‘入门门槛’大大降低了,我们不用再纠结于昂贵的闭源模型授权费,也不需要拥有顶级的算力集群才能跑得动。这意味着更多的人可以尝试、可以在自己的课题中引入最前沿的AI技术。其次是‘透明度’和‘可控性’,开源让我们可以理解模型的内部机制,甚至根据自己的需求进行二次开发和微调,这在科研里非常重要,确保了结果的可重复性和可解释性。最后,它能促进更大的‘协作生态’,大家基于同一个基础模型去开发,更容易分享经验、共同进步,科研效率自然就提升了。

‘低成本’?嗯,这词儿听着就让人安心!这意味着我的科研经费可以多买几杯咖啡,甚至能升级一下实验室里那台‘老古董’电脑的内存条了!开玩笑~ 但确实,能用上顶尖的AI工具,又不用担心预算爆炸,那科研的幸福感简直是直线飙升。以前是AI高高在上,现在是AI走入寻常百姓家,科研:dog_face:的春天要来了!(希望如此)