AutoSOTA:清华大学发布AI科研自动化系统,一周刷新105个SOTA模型

清华发布AutoSOTA,一周内发现105个更优AI模型,推动AI科研从重复优化回归创新本质。

原文标题:清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质

原文作者:机器之心

冷月清谈:

清华大学联合发布AutoSOTA,一个旨在通过科研智能体加速AI研究的自动化系统。该系统通过多智能体协作,完成从实验准备到模型创新的端到端流程。AutoSOTA不仅能优化性能,还能在结构上进行创新,从而解放科研人员,让他们专注于更具原创性和长期价值的研究。实验表明,AutoSOTA在一周内发现了105个性能显著提升的模型,超过60%的模型具有新颖的结构设计,平均性能提升接近10%。AutoSOTA的意义在于推动人智协同,让人类科学家专注于提出问题和定义方向,而非无止境的重复实验和参数调整。

怜星夜思:

1、AutoSOTA这类AI科研自动化工具,会对未来的科研模式产生哪些深远影响?如果科研人员不再需要花费大量时间在调参优化上,他们会把精力放在哪些更有价值的方向?
2、文章提到AutoSOTA能够进行“结构创新”,这是否意味着AI已经具备了一定的“创造力”?你认为AI在科研创新中能够扮演什么样的角色?
3、AutoSOTA的出现,是否意味着未来AI领域的竞争会更加激烈?对于算力资源有限的小团队或个人研究者来说,他们应该如何应对这种挑战?

原文内容


在人工智能研究中,许多研究者将大量时间投入到为那 1% 的性能提升反复调参与实验迭代之中。


一个越来越值得重视的问题是:人类科学家最宝贵的直觉与创造力,是否正被困在无止境的「增量式优化」中?


SOTA(State-of-the-Art,当前最佳水平的 AI 模型)长期被视为衡量研究价值的「金标准」。


当一篇学术论文刷新 SOTA 时,人们看到的,往往只是结果的跃升。但在结果背后,真正支撑起一次次「当前最佳」的,往往不是某一个瞬间的灵感,而是此后持续数月甚至数年的高强度实验迭代、参数调整与工程优化。


Transformer 架构的发展为例。自 2017 年问世以来,全球科研人员围绕这一架构投入了大量人力与算力,不断提出新变体、设计新模块、优化训练策略,才最终将其在通用语言理解评测集 GLUE 上的性能从约 75% 提升到 90% 以上。


Transformer 架构在 GLUE 评测集上的性能爬升


问题在于,这些优化工作虽然重要,却并不总是最值得由人类科学家重点投入的那一部分。


如果最优秀的科研人才被长期绑定在重复性的性能优化中,那么那些更具原创性、更需要长期思考的问题,谁来持续投入?


AutoSOTA 让 AI 科研自动化走向端到端闭环


正是在这样的背景下,在近期召开的中关村论坛上,清华大学与北京中关村学院联合发布研究成果 ——AutoSOTA


目前,AutoSOTA项目已发布预印本论文



论文地址:https://arxiv.org/abs/2604.05550


AutoSOTA 面向端到端的 AI 科研自动化,致力于通过科研智能体加速高强度、重复性的实验迭代与优化过程,将研究者从持续的性能打磨中解放出来。


AutoSOTA 研究问题框架


不同于现有的代码优化框架,AutoSOTA 并不是对单一实验环节的局部加速。它将 AI 智能体的赋能边界进一步延伸到实验准备、实验执行等底层繁琐任务,以及研究思路生成等顶层构思环节,旨在实现从已有 SOTA 到新 SOTA、从现有代码仓库到新代码仓库的端到端 AI 科研自动化


AutoSOTA 端到端 AI 科研自动化系统


AutoSOTA 采用多智能体协作框架,借鉴人类算法研究中的分工流程与协作逻辑,使不同科研智能体能够围绕同一目标开展协同设计、实验执行、结果分析与方案迭代。


与此同时,AutoSOTA 配备了完善的工具库(Toolkit)与技能集(Skill Set),不仅能够处理实验运行中的复杂状况,还能够完成文献调研、思路生成、方案设计等高层次任务,从而在顶层规划与底层执行之间形成闭环。


这意味着,AutoSOTA 所追求的并不只是「把实验跑得更快」,而是真正推动 AI 科研自动化从单点辅助走向系统化、持续化、智能化的科研协作过程。


一周时间,发现 105 个性能显著提升的 SOTA 模型


在为期一周的实验中,AutoSOTA 以前一年 AI 顶会论文中的优秀成果为基础,自动发现了 105 个性能显著提升的模型方案。其中,超过 60% 的模型具有新颖的结构设计,平均性能提升接近 10%。


基于AutoSOTA的大规模SOTA AI模型发现

项目地址:https://tsinghua-fib-lab.github.io/AutoSOTA/


这组结果的意义在于,AutoSOTA 并非只是沿着既有路径进行简单搜索,也不局限于参数组合层面的穷举式优化。它在优化性能的同时,展现出一定程度的结构创新能力,能够在已有研究基础上继续挖掘新的设计空间,发现兼具性能提升与结构新颖性的模型方案。


AutoSOTA 的意义,不止于「再提几分」


AutoSOTA 的意义,不仅在于获得了一批新的 SOTA 结果,更在于它启发人类科学家重新审视科研创新的本质:SOTA 性能的刷新,是否等同于重要的科学突破?


AutoSOTA 启示我们进一步思考:如何将人类科学家最宝贵的注意力,从重复性的实验迭代中重新释放出来,回归到更具原创性、也更需要长期判断与创造力的研究问题上?


一种可能的人智协作模式是:由科研智能体系统承担大量重复性、密集型、长周期的优化过程,由人类科学家聚焦于提出问题、定义方向、识别机会与构想机制。在这一意义上,AutoSOTA 更像是一种面向科研流程的「创造力放大器」。


它并不是要替代科学家的原创性,而是要把原创性从低效、重复的实验劳动中解放出来。


AutoSOTA启发的人智协同科研范式


真正重要的,不是让研究者永远停留在「把已有模型再推高一点」的循环里,而是让他们有更多机会去面对那些尚未被定义、尚未被解释、也尚未被系统探索的问题。


AutoSOTA 正在朝这一方向迈出关键一步。它不仅展示了科研智能体在 AI 研究自动化中的巨大潜力,也让我们看到,当「性能优化」这项沉重工作逐步被智能体接管之后,科学研究有机会真正回到它最珍贵的起点 ——提出大胆的问题,探索未知的方向,追求不可替代的原创性突破


项目网站:https://tsinghua-fib-lab.github.io/AutoSOTA/



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com