无问芯穹WAIC首推「三大AI效能盒子」,全栈算力释放智能潜能

无问芯穹发布三大AI产品,覆盖云端到终端,旨在以有限资源实现无限智能,让算力无处不在。#WAIC2025 #AI算力

原文标题:这届WAIC,无问芯穹发布了三个「盒子」

原文作者:机器之心

冷月清谈:

在2025年世界人工智能大会上,无问芯穹联合创始人、CEO夏立雪发布了全规模AI效能跃升方案,通过三大核心产品——“大盒子”无穹AI云、“中盒子”无界智算平台、“小盒子”无垠终端智能——旨在解决AI发展中资源有限与需求无限的矛盾。

**无穹AI云(大盒子)**面向万卡至十万卡的超大规模算力网络,它将全国范围内的异构、异域、异属算力汇聚成一张智能感知网络,实现高效的算力流转与利用。其底层覆盖全国26省市,整合超15种主流芯片架构,总算力规模达25000P,成功激活“非理想状态”算力,并支持“平台+自营”运营模式,已在上海、杭州等地落地,服务多个智慧场景。

**无界智算平台(中盒子)**针对百卡至千卡级的大型智算集群,主要提升高校科研机构和区域智算中心的效能。它已成功支持百亿参数大模型稳定训练长达600小时,并为云南移动等客户实现了千亿参数模型的分布式部署与大规模推理,验证了国产智算不仅能高效计算,还能产生可持续的正向收益。文章提到,该平台将助力推动国产计算“勇攀智能高峰、长远可持续发展”的双重使命。

**无垠终端智能(小盒子)**聚焦单卡至十卡级的有限算力终端,通过“端模型+端引擎+端硬件”一体化解决方案,突破设备物理限制,实现极致算力优化。其中,无穹天权Infini-Megrez2.0是全球首款端侧本征模型,实现云级智能水平且内存占用极低,能让设备在“休眠”时段也能处理大模型任务。无穹开阳Infini-Mizar2.0推理引擎则进一步提升了端侧单任务异构计算能力,夏立雪形象地比喻为“让大象(大模型)在冰箱(小终端)里跳舞”。

此外,无问芯穹还启动了上海首个人工智能终端软硬适配优化中试平台,旨在协同产业链伙伴,探索智能终端的无限可能性。无问芯穹的愿景是“让算力像水和电一样自然流入千行百业与千家万户”。

怜星夜思:

1、文章中提到无穹AI云通过广域算力网整合了超15种主流芯片架构的异构算力。大家觉得在实际应用中,这种异构算力融合的最大挑战是什么?有没有可能因为不同芯片的生态差异太大而拖累整体效率?
2、“小盒子”无垠终端智能提出在设备“休眠”时也能持续运行大模型任务(比如合盖自动整理会议记录)。大家对此有什么看法?这种“AI不停”的体验,会给用户带来哪些便利,又可能引发哪些新的担忧,比如隐私、功耗或者用户体感方面的?
3、文章多次强调国产计算的“可持续正向收益”和赋能作用。大家认为,当前阶段,国产AI芯片和相关平台要真正实现全球竞争力和长期可持续发展,除了技术突破,还需要在哪些方面着重发力?

原文内容

机器之心发布

机器之心编辑部

算力是智能时代的土壤,其规模与效率决定着数字未来的疆界。


7 月 28 日,2025 年世界人工智能大会上,无问芯穹联合创始人、CEO 夏立雪发布了无问芯穹全规模 AI 效能跃升方案,并正式推出三大核心产品:无穹 AI 云、无界智算平台与无垠终端智能。该方案是一套面向未来智能基础设施的软硬协同系统,为跨地域智算网络、智算集群与多形态智能终端等全规模场景,统一适配多种异构算力,提供从模型调度、性能优化到应用部署的全链路支持。


发布会现场,夏立雪将这三个产品比作了三个盒子,他表示,无问芯穹希望通过提供打包式的产品服务能力,在单卡至十万卡算力的全规模软硬件场景中,让每一份算力,都能释放最大的智慧潜能。



1. 两条加速进路和一个价值空间,让有计算的地方就有智能


夏立雪指出,从传统算法,到 AI1.0、AI2.0 阶段,在 Scaling Law 的推动下,计算资源持续驱动着智能边界的拓展,逼近 AGI 的临界点。然而,有一条人类文明的终极边界始终横亘在 AGI 之路上 —— 资源的有限性。



人类文明,在迎来一个无所不能的智慧之前,或将首先触碰到资源总量的红线。


为了解决这个有限资源与无限需求之间的矛盾,无问芯穹提出加速抵达 AGI 临界点的两条进路 —— 提高智能效率、扩充计算资源。一方面突破从计算资源到智能性的转化效率,用更少的计算资源获取更强的智能;另一方面,不段挖掘和唤醒更多的可用计算资源,而这两条路径的交汇之处,即是新的 AGI 临界点所在。



两年前,我们惊艳于几千卡集群训练而成的 GPT3.5,但今天,一部手机也可以装下与它同等性能的小型 AI 了。夏立雪指出,资源的稀缺性约束驱动着智能效率的持续进化,而广泛的应用需求,也正牵引着顶尖模型不断从大规模计算中下放到中等算力、小算力场景中。



夏立雪绘制了一个 AI 应用落地的价值空间:人工智能应用落地价值空间 = 场景尺度 × 计算资源 × 智能效率。他表示:无问芯穹始终致力于以场景尺度、计算资源与智能效率的共振,以有限的资源实现无限的需求,抵达『智无边际、算无虚发』的终极愿景,让有计算的地方,就有『无穹』的智能涌现



随后,夏立雪正式揭晓了无问芯穹全规模 AI 效能跃升方案三大核心产品 —— 针对万卡至十万卡全局算力网络的无穹 AI 云、针对百卡至千卡级大型智算集群的 无界智算平台,以及针对单卡至十卡级有限算力终端的无垠终端智能解决方案。他将这一系列产品形象地称之为大盒子中盒子小盒子



2. 大盒子:云端算力不仅要连得起来、调得动,还要从资源高效向能力转化


在大盒子中,无穹 AI 云为超大规模算力集群的利用提供了一个系统性的解决方案,将全局的异构、异域、异属的算力汇聚成一张智能感知、实时发现、随需获取云端算力网络,不仅连得起来,还调得出来、调得过去、调得准。实现了更大规模的资源汇聚、融通,以及更高效的算力利用率,支持更广泛的供需匹配和更加开放的生态建设。



无穹 AI 云的底层是一张深度覆盖全国的广域算力网,基于无问芯穹一网三异调度架构,目前已成功覆盖东数西算国家战略布局的关键节点,汇聚了来自 26 个省市、53 个核心数据中心的庞大算力资源,整合超 15 种主流芯片架构的异构算力池,总算力规模超 25000P。基于强大的广域高性能专线内网互联互通,企业能够按需在不同地域、不同型号的算力资源之间进行实时切换与无缝迁移



夏立雪指出:无穹 AI 云不仅可以让宝贵的算力资源实现最高效的流转与利用,还能有效激活处于『非理想状态』的算力资源,将其转化为具备高稳定性、高吞吐量与超低延迟的优质 AI 服务能力。以普通资源释放一流效能,为普惠型 AI 的高质量发展提供坚实支撑。


无穹 AI 云为伙伴们提供高度标准化和开放化的接口,支持独特的平台 + 自营运营模式 —— 不仅向独立智算中心敞开大门,实现无缝集成;也支持企业构建自有运营平台站点,并融入底层算力供给网络。在过去半年里,无穹 AI 云在上海市、杭州市、北京市等地接连落地,以其强大的生态聚合能力、灵活的分布式部署能力以及坚实的供应保障能力,持续驱动着算力服务从单一的资源交易平台向驱动全产业链协同创新的生态引擎升级。


现场更披露了一个振奋人心的数据:无问芯穹服务的全球最大人工智能孵化器 —— 上海模速空间,日均 Token 调用量已成功突破 100 亿大关,累计服务 10 余个智慧场景、支撑 100 多个前沿 AI 创新应用,单应用月活高达数千万。



随后,夏立雪宣布,华为昇腾 910B 加速卡正式上线由无问芯穹与模速空间联合运营的全国首个算力生态超市—— 模速空间算力生态平台。


活动现场,上海西岸开发集团有限公司总经理张滋、华为昇腾计算产品线生态首席专家夏勤同夏立雪一起,在全场的见证下协力启动了模速空间算力生态平台 2.0 的发布仪式。这标志着模速空间、华为昇腾、无问芯穹三方共同开启百亿生态共建的合作新篇章,迈向 AI 孵化器 - 国产硬件 - 国产平台产业协同的新里程碑。



3. 中盒子:国产智算不仅能算优算,更能实现可持续的正向收益


无界智算平台在无穹 AI 云的能力基础之上,强化了满足面向高校科研机构、区域智算中心等 AI 集群的效能提升能力 —— 既助力高校与科研机构,在人工智能的前沿领域勇攀高峰、开拓创新;也赋能 AIDC 智算中心,构筑可持续运营的长远价值。


目前,无界智算平台已在超过 100 个大型研发场景中多次成功保障了大规模模型训练与推理任务的关键需求,并帮助国产计算集群实现了实实在在的正向收益。 夏立雪表示。



在无问芯穹与上海算法创新研究院的合作中,无界智算平台以全链路解决方案升级服务,帮助上海算创院实现大模型研发效率的飞跃。成功基于 3000 卡沐曦国产 GPU 集群,稳定支撑百亿参数大模型训练长达 600 小时不间断,创造了国产算力模型训练的记录。



如果说与算创院的协同是在科研应用上的共同求索,那么与云南移动的合作,则充分展现了无问芯穹深入地方算力中心,衔接盈利闭环的能力。无界智算平台凭借其全域异构兼容与智能调度能力,构建了弹性灵活的算力服务能力,精准匹配复杂业务需求。高效利用 2000 张华为昇腾 910B 智算加速卡,实现了千亿参数模型的分布式部署与大规模推理,为云南移动锻造了行业标杆级的大规模商业化服务核心竞争力。



总结无界智算平台在算创院和云南移动中的成功实践,夏立雪强调:我们相信,国产智算不仅能够以优秀的表现完成各种任务,更能为产业链创造收益,最终实现更恒远的价值。


面向未来,夏立雪重磅宣布了无问芯穹在大盒子中盒子协同的重要产品化进展 —— 全球首个跨地域全分布式联合强化学习服务,支持将各地 AIDC 中零散的算力资源,与一个中等体量的算力集群结合起来,完成跨地域的联合强化学习。最小支持单张消费级显卡接入,让每一张闲置 GPU 都能出发更大能量,让中小企业也能训练自己的领域推理模型。



基于这一重要突破,无问芯穹现场正式启动了AIDC 联合运营创新生态计划,与三大运营商及 20 余家 AIDC 伙伴一道,以开放联合生态,拓展整合可用的资源,全力以赴国产计算勇攀智能高峰、长远可持续发展的双重使命


4. 小盒子:我们不仅要将大象放进冰箱,还要让大象在冰箱中跳舞


智能终端是将 AI 技术突破与我国制造业优势、市场规模优势结合的最佳反应界面。在小盒子里,无垠终端智能致力于以软硬协同核心技术优势,打造端模型 + 端引擎 + 端硬件智能终端一体化解决方案,突破终端设备的物理资源限制,实现极致的算力优化和利用。



在终端模型方面,无问芯穹宣布携手上海创智院共同打造了全球首款端侧本征模型无穹天权 Infini-Megrez2.0,在实现云级 21B 参数智能水平的同时,将内存占用控制在 7B 规模、实际计算量控制在 3B 规模。可以完美地适配当下的各类终端设备,成功打破了终端能效 - 空间 - 智能不可能三角,突破了终端设备的资源局限。



此外,Infini-Megrez2.0 通过巧妙的工程设计,赋予了终端设备更强的能动性 —— 即使在用户无感知的休眠时段里,也能持续运行大模型。发布会现场,Infini-Megrez2.0 的研发团队为大家带来了一个令人激动的演示 —— 用户在电脑合盖之前给出语音指令整理今日会议记录。电脑合盖后,系统自动调度闲置 CPU 周期执行后台任务,等任务完成后,则自动释放内存并转入待机。唤醒设备时,整理好的会议纪要已完整呈现在电脑上,算力亦能瞬时恢复满血状态,并且全程无联网、无发热。


这意味着,即使 AI PC 操作者合盖休眠电脑,进入离线的移动办公环境,大模型依然可以接力稳定完成任务。算下来,单台设备年均可释放 1000 多小时的生产力,真正实现了手停脑停,AI 不停




无穹天权 Infini-Megrez2.0 推理速度突破,依托于无问芯穹端模型 + 端引擎 + 端硬件三位一体协同优化体系。继上半年,无问芯穹与联想合作发布联想智能终端推理加速引擎后,今天,无问芯穹发布了更强大的继任者 —— 无穹开阳 Infini-Mizar 2.0,如果说 1.0 是挖掘硬件更多潜能,2.0 就是将更大的智能装进了小盒子之中。不仅以潜能驱动进化,更让端侧智能超越想象。



Infini-Mizar2.0 突破性地实现了端侧单任务异构计算,AIPC 场景下将本地模型尺寸上限从 7B 提升到 30B


而当我们将 Mizar2.0 和 Megrez2.0 强强联合,则能更进一步地实现推理速度的飙升和显存、功耗的极致压缩,在相同资源占用情况下,实现智能水平提升 18%、推理性能提升超 100%。夏立雪说:如果说 Mizar2.0 推理引擎是成功实现了把大象放进冰箱,那么再叠加上我们的端模型 Megrez2.0,则是实现了让大象在冰箱里跳舞。进一步地,能装下更大模型,就意味着能为解锁多样的终端智能应用 出更多的想象空间,推动端侧 Agentic AI 的自主进化。


基于 Mizar2.0 的重大升级,无问芯穹重磅发布了与新华三合作的大模型一体机,以极致的性价比为用户提供开机即用的一体化软硬件整合方案,实现一次付费,无限次智能的便捷体验。同时,夏立雪宣布,无问芯穹与苏州异格技术深度合作,以 FPGA 硬件为核心,内嵌无穹开阳推理引擎,推出 FPGA 大模型推理一体机,单机即可驱动百亿参数大模型,且在能效翻倍的基础上,进一步大幅降低大模型推理成本。



无问芯穹正携手上海创智学院、联想、新华三、异格以及爱芯元智等优秀的智能终端上下游机构,未来还将联合更多伙伴,凝力打造下一代现象级新终端。通过更通用、更强大的终端软硬件设备,服务更广泛的场景,最终让 AGI 走进千家万户,惠及每一个人。


One More Thing:上海首个人工智能终端软硬适配优化中试平台现场启动


AI 2.0 浪潮下,端侧智能在中国新质生产力和国际科技竞争力建设中占据重要的战略地位。同时,终端也是人机交互的接口,可以充分释放各类设备里所蕴含的智能潜力,实现数字智能和生命智能的自由交互。


智能终端的未来,拥有无限的可能性,需要人工智能终端产业链的上下游共同探索。因此,在上海市经信委的指导下,无问芯穹将依托上海这一全球科创中心、国际金融枢纽和长三角一体化龙头的独特优势,携手行业生态伙伴,共同建设上海首个人工智能终端软硬适配优化中试平台。


该平台将聚焦人工智能终端产业发展,协同各环节参与者,共同建立跨领域协同创新机制,重点解决共性技术难题,并形成覆盖计算效能、功能实现和交互体验的完整评价体系和自我造血的长期产业化能力,最终打造为可持续盈利的投资收益型中试平台。



随后,在上海市经信委的见证下,无问芯穹与上海创智学院、理想汽车、联想集团、江城实验室、信通院、智元机器人、上海英和、中兴通讯、爱芯元智、上海仪电、中科睿芯、岩芯数智、兆芯集成十余家终端行业伙伴代表共同登台,启动人工智能终端中试平台的首期建设。



有限的是晶体管和带宽,无限的是人类向智能边疆拓荒的勇气。夏立雪在发布会的尾声中提到,无问芯穹的愿景,始终是让算力像水和电一样自然流入千行百业与千家万户。



无问芯穹全规模 AI 效能跃升方案及其三大核心产品的全球首发,标志着无问芯穹在构建 AI 能力服务化基石、打通算力与应用鸿沟的征程上迈出了坚实一步。未来,无问芯穹将继续携手行业上下游优秀生态伙伴,推动全规模 AI 效能的持续跃升,撬动智能时代阿基米德杠杆的崭新支点,以无穹算力,共赴智能未来。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

从用户体验的角度来看,无疑是提升了设备的“主动性”和“智能感”,让AI不再是简单的工具,而是能持续提供服务的“伙伴”。这种无感化的体验,是未来智能终端发展的重要方向。但担忧也并存,特别是关于隐私和数据安全。虽然声称“无联网”,但大模型在本地处理敏感信息,其安全性、是否会有数据泄露的风险,以及用户对数据处理过程的感知度和控制权,都需要有非常透明且严格的保障机制。功耗方面,即便是低功耗模式,持续的计算也可能加速电池老化,或者在某些场景下仍然会产生不可忽视的噪音和热量,影响用户对设备的静音和散热预期。

emmm…我觉得吧,最大的挑战就是成本和运维复杂性。你想啊,兼容这么多不同架构,得投入多少人力物力去开发和维护适配层?而且一旦出问题,排查起来简直是噩梦。除非效益特别巨大,否则一般公司谁敢这么玩?至于拖累效率…那不是肯定的吗?好比你组织一支足球队,非要让每个队员都用不同的规则踢球,就算能踢起来,协调性和流畅度也肯定大打折扣。

除了技术,生态建设是重中之重!你光芯片性能好没用啊,得有海量的开发者愿意用你的芯片,有丰富的软件工具链支撑,有各个行业的大模型优化适配。现在国际巨头像英伟达,不光是芯片强,更关键的是它的CUDA生态已经根深蒂固,开发者都习惯了。国产芯片得加大对开发者社区的投入,提供更友好的开发环境和更完善的技术支持,形成良性循环,不然大家还是会用习惯的那个。再就是市场化运作,不能只盯着政策性项目,得真正走向市场,靠竞争力说话。

我觉得这简直是懒人福音啊!对我这种经常开会又懒得整理笔记的人来说,合盖就能自动搞定,简直不要太爽!便利性是显而易见的,大幅提升办公效率和碎片时间的利用率。但隐私方面确实是个大问号。AI在后台运行,它到底处理了什么数据?这些数据会不会被上传?虽然文章说“全程无联网”,可万一有bug或者被黑客利用呢?功耗倒是其次,反正休眠状态嘛,但万一我电脑放包里,它一直在忙活,会不会发热?会不会突然把我吵醒?这些都得考虑。

从技术角度看,关键在于调度器的智能化和弹性适配能力。异构算力最大的挑战不是数据交互本身,而是如何智能识别不同任务对算力的需求,并将其分配给最适合、效率最高的芯片类型。同时,要建立一套完善的性能评估和反馈机制,动态调整资源配比,避免“木桶效应”。当然,像OpenCL、OneAPI这类跨平台编程框架的成熟度也会直接影响到融合效率,生态差异确实是痛点,需要平台方有深厚的技术积累去抹平这些差异。

问得好!我理解异构算力融合最大的挑战在于“软件栈的统一和兼容性”。你看,每种芯片架构都有自己独特的指令集、优化库和编程模型。要把它们整合起来,不仅要解决底层驱动的适配问题,更要保证上层应用能够无缝、高效地在各种硬件上运行。如果软件层面没办法做到很好的抽象和统一调度,那异构融合很可能变成“貌合神离”,拖累整体效率是必然的。就像你给方言区的人配了个普通话翻译,但翻译本身效率不高或者理解不准确,那沟通还是不顺畅。

太棒了!这简直是把AI从“工具”变成了“智能管家”。以后我出门前把任务交代给电脑,路上就能收到结果,时间管理大师就是我!至于担忧嘛,功耗我觉得还好,既然敢这么推,肯定在节能方面下了功夫。隐私嘛,本地处理听起来是相对安全的,但关键在于“本地”的范围和模型对数据的学习方式。最重要的是,要给用户一个明确的“开关”或者“黑名单”,不是所有任务我都希望它在后台处理,比如一些特别私密的文档。如果能做到这些,那就完美了。

哎呀,说白了,除了硬实力(技术),还得有“软实力”啊!比如,品牌建设和国际合作。你想想,现在国外的客户对我们的AI芯片了解有多少?信任度高不高?得走出去,多参加国际展会,多跟国际伙伴建立合作关系,把我们的产品推向全球市场。光在家里玩得转不行,得让全世界都认识你、认可你。当然,最最最关键的还是,东西得真香啊!性能价格比得有优势,服务得跟得上,这样才有持续的生命力。

我觉得,国内目前芯片制造工艺和先进封装还需要持续追赶。你光设计得好,造不出来或者良品率不高,成本就下不来。另外,供应链的韧性也很重要,在全球地缘政治复杂的情况下,保证关键材料和设备的稳定供应是前提。最后,还是要看实际应用场景的落地。很多宣传都很宏大,但真正能在各个行业大规模铺开,创造实际价值的,才是检验其竞争力的标准。毕竟,科技最终还是服务于生产力的提升和生活的改善。