老牌通讯巨头中兴通讯入局AI,SuperCLUE推理榜夺冠,实力不容小觑

中兴通讯AI实力爆发,星云大模型SuperCLUE推理榜夺冠!这家老牌ICT巨头,正以AI为核心引擎加速转型,未来可期!

原文标题:SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

原文作者:机器之心

冷月清谈:

中兴通讯作为一家拥有40年ICT技术积累的老牌科技公司,正式进军AI赛道,并在SuperCLUE推理榜单上表现亮眼,其星云大模型 NebulaCoder-V6 在推理总分上与 Doubao-1.5-thinking-pro-250415 并列第一,综合总榜中与 DeepSeek-R1 并列第二。文章深入探讨了中兴通讯进军AI的原因、技术优势以及未来的发展方向。中兴通讯看到了AI在通信领域,尤其是在6G时代的重要性,并早已在AI方向进行前瞻性布局,包括成立AI团队、研发星云大模型等。星云大模型在SuperCLUE推理榜单夺冠,离不开技术团队设计的大模型高效训练优化方案,利用领域共享属性和自校验的图谱知识注入框架、批判学习和数据飞轮等技术,不断提升模型的推理能力和准确性。中兴通讯在AI领域具备独特的优势,拥有全栈的技术积累、工程实践和系统优化能力,更容易拉起整个产业链,并在硬件开发、软件平台、大模型和行业应用等方面都有所涉及。随着中兴通讯全力拥抱AI,有望为行业带来新的化学反应。

怜星夜思:

1、中兴通讯从传统ICT厂商转型AI,你觉得他们的核心优势是什么?除了文章中提到的,还有哪些潜在的优势或挑战?
2、文章中提到的“批判学习”和“双阶段强化学习”听起来很专业,你觉得这些技术对提升大模型的推理能力有哪些具体帮助?在实际应用中会遇到哪些问题?
3、中兴通讯All in AI,你认为这种转型对整个ICT行业会产生什么影响?其他传统ICT厂商应该如何应对这种趋势?

原文内容

机器之心原创

作者:张倩

中兴通讯,这家数万人的科技大厂,凭借40年 ICT 技术积累正式进军 AI 赛道。


一家信息通信公司,居然拿到了 AI 推理竞赛的冠军,这事儿有点意思。


前段时间,中文大模型测评基准 SuperCLUE 发布了 2025 年 5 月报告。这份报告评估了来自 OpenAI、谷歌、DeepSeek、字节跳动等多家国内外 AI 公司的大模型,并发布了多个榜单。报告显示,虽然海外模型在综合能力上占优,但国内模型在推理任务中表现亮眼,Doubao-1.5-thinking-pro-250415 与星云大模型 NebulaCoder-V6 以推理总分 67.4 并列第一


SuperCLUE 推理榜单深度聚焦模型的逻辑思维与问题解决能力,涵盖数学推理、科学推理、代码生成三大硬核维度。


作为专业赛道的选手,Doubao 的表现并不让人意外。但是,星云大模型 NebulaCoder-V6 着实算得上一匹黑马,因为它来自一家老牌信息通信公司 —— 中兴通讯。而且,除了拿下推理榜单第一,它在综合总榜中也表现不俗 —— 与 DeepSeek-R1 并列第二,拿到了银牌。



这样的成绩让外界对中兴这家公司产生了好奇 —— 毕竟在大多数人的认知里,大模型竞赛是互联网公司和 AI 实验室、创业公司的主场(上榜的模型也大多出自这类机构)。一个常年和基站、交换机打交道的 ICT 厂商,突然在需要抽象思维和逻辑链条的 AI 推理任务中拔得头筹,确实带来了意料之外的「跨界」惊喜。


那么,中兴为什么要这么做?为什么可以做那么好?为了弄清楚这些问题,机器之心和中兴通讯的首席战略与生态专家屠嘉顺、星云大模型总工程师韩炳涛、研究员吴琦聊了聊,了解到了通讯与 AI 行业的紧密联系以及星云大模型背后的核心技术,也对中兴这家成立 40 年的科技公司的下一站有了新的认识。


中兴通讯,为何重仓押注 AI?   


在今年 3 月份的 GTC 大会上,英伟达 CEO 黄仁勋曾预言说,「AI 可以彻底改变通信」。


屠嘉顺告诉我们,其实这种改变现在就在发生。以基站为例,现在的 4G、5G 基站相比前几年增加了很多,但运维人员数量的增幅却没有那么大。这背后的核心原因是,现在的通信网络大量采用自动化技术,形成了所谓的「自治网络」,大大减少了对运维人员的需求。


在即将到来的 6G 时代,这种变革会更加明显。英伟达高级副总裁 Ronnie Vasishta 在一次简报会上提到,「6G 的倒计时已经开始。基础研究已经将注意力转向下一代无线通信。下一代网络将是 AI 原生的 ——AI 将嵌入硬件和软件中…… 下一代无线网络需要连接数千亿台智能设备,这将需要 AI 的支持」。


屠嘉顺同意这种「6G 将是 AI 原生」的说法。他认为,6G 网络会从设计之初就将 AI 作为其核心组成部分,AI 将贯穿于网络的架构、协议、功能等各个方面。


正是因为看到了这一颠覆性趋势的可能性,中兴很早就在 AI 方向做前瞻性布局。在内部,他们成立了多个 AI 相关团队以及星云大语言模型、电信行业大模型这样的大型基础研究团队,并把智算等 AI 相关的方向作为重要的战略方向,涵盖 AI 基础设施、AI 数据中心、上层行业应用智能体等多个方面。前段时间,他们开发的 Co-Sight 智能体还登上了 GAIA 基准测试的榜首。


其实,除了为未来做准备,当前的中兴也已经与 AI 深度绑定。无论是网络侧、算力侧还是终端侧,中兴都有相关的业务布局。这些业务都需要进行 AI 技术迭代。


而且作为一家科技公司,中兴内部也有用 AI 提高研发效率的需求,比如代码自动化。他们研发的星云大模型在其中发挥了重要作用。目前,在内部应用中,星云大模型每天产生 15 亿 token,合成的代码量已经达到几千万行,公司的 AI 代码占比已经达到了 30%


从这些维度来看,中兴早已突破大众对 ICT 厂商的固有认知,实质上是以 AI 为核心引擎的科技企业,其发展轨迹正朝着 AI 领域加速演进。


星云大模型,何以夺冠?    


此次星云大模型在 SuperCLUE 推理榜单夺冠,离不开技术团队设计的大模型高效训练优化方案。从预训练到监督微调再到强化学习,他们试图在每一步都激发出模型极致的推理能力。


预训练:高效构建知识图谱,帮大模型打好基础


预训练阶段的核心目标是提升模型的平均表现,类似于人类学生时代的通识教育。


在这一阶段,数据非常重要。但是原始的预训练数据存在的知识缺失和知识错误的问题,是模型产生知识类幻觉的重要原因。


针对这些问题,研究人员设计出了一套高效的知识图谱构建方法,帮助大模型迅速形成准确度极高的知识结构


具体来说,他们提出了一个名叫领域共享属性和自校验的图谱知识注入框架 「DASER」(Domain-Aware Self-validating Entity Representation),该框架能够准确识别预训练文本中的缺失知识和错误知识,再利用搜索引擎从互联网在线检索,补全缺失和更正错误知识,提升模型的知识性能力,让模型「看得多」,又「学得准」,更「懂得深」。



什么叫「领域共享属性」?研究人员举了个例子,假如在现成的预训练语料中,火星的知识非常丰富,但木星的数据残缺不全,用传统的预训练数据直接训练必然会缺失大量的木星知识,从而导致模型幻觉。DASER 的创新之处在于使用了同一领域内知识的共享规律 —— 比如行星都具有公转周期、自转周期等共同属性。因此在构建木星知识图谱时,它会根据之前所识别到的行星公共属性去自动填充可复用的属性,并通过网络检索进行缺失数据填充。


借助这一方法,星云大模型团队构建了覆盖国家基础学科分类体系的全学科知识图谱。模型训练效率、推理准确性均显著提升,在中兴构建的高难度私域知识类 QA Bench 上,准确率指标由 61.93% 增长至 66.48%



监督微调:批判学习 + 数据飞轮,让模型理解复杂指令


监督微调(SFT)阶段的目的是将预训练模型拥有的通用潜力转化为特定领域的专业能力,让模型理解并执行复杂指令,这个过程类似于人类的高等教育或职业培训。


研究人员介绍说,这一阶段的数据通常有两类:第一类是标准的 QA「问题 - 正确答案」对,用于直接训练模型模仿正确响应;第二类是思维链数据,即在答案中显式包含推理步骤,引导模型分步解决问题。


更进一步,还可以使用批判学习(Critique Learning, CL)基于难样本生成特定形式的思维链数据,让模型对错误答案进行批判并验证,从而构建一个持续优化模型推理与批判能力的「批判 - 推理」数据飞轮。


在训练模型的过程中,他们发现批判学习数据效果更为显著。其原理在于:模型如同人脑,对「异常」(如错误答案)高度敏感。发现错误并提出批判的过程,比单纯接受标准答案更能深化模型的理解。


因此,研究人员在 SFT 中引入了批判学习(CL)及成对批判学习(PCL)算法。PCL 的关键流程是:


  1. 针对困难样本,模型给出初始(错误)回答。

  2. 模型对错误回答进行批判。

  3. 基于批判信息,模型生成修正后的回答。

  4. 利用规则方法验证最终答案的正确性。


上述流程将产生 {任务描述,错误回答,批判信息,正确回答} 的四元组训练样本。进一步的,他们发现在模型训练中使用从四元组中抽取 {任务描述,错误回答,批判信息} 三元组,而非直接使用四元组,训练效果会更好。


相较于使用纯思维链类数据的 SFT,引入额外 CL/PCL 数据的批判 CFT(Critique Fine-Turing)方法在数学、代码等多项推理中准确率明显上升。





除此之外,为了让模型在遇到用户复杂指令时也能准确理解并执行。需要让模型看到更多高质量指令数据。为了得到这些数据,他们构造了一个数据飞轮。如下图所示,整个飞轮分为四个模块,其中很多工作可以借助模型来自动完成,比如场景挖掘、候选答案生成。在其中一个关键模块 —— 模型校验中,他们也用到了批判学习。他们借助这种方式获得的数据反哺训练集,迭代地帮模型提高意图理解能力。



强化学习:双阶段强化学习,提升回答精度与严谨度


强化学习阶段的目的是通过环境反馈(奖励信号)进一步优化模型的行为策略,使其能够解决更复杂的现实世界问题,类似于人类的职场实战。


在这一阶段,星云大模型团队主要关心两个问题:如何提高大模型解决复杂问题的准确率和逻辑严谨性。


为此,他们提出了双阶段强化学习,即「先整体纠错→再局部精修」。


在纠错阶段,他们引入了「批判性强化学习(CRL)」,选取 STEM 领域的高难度问题进行专项训练,迭代提升模型回答高难度问题的准确度。



在精修阶段,研究人员发现使用强化学习会导致回答多样性下降。拿代码生成举例,模型可能有多种正确的实现方式, 如果某一种方式因为细微的错误被视为负样本,模型可能会「误以为」这种方法本身是错误的,从而在未来避免使用。这会导致模型生成的答案多样性下降,甚至在海量强化数据优化后无法提供解决方案,从能力「涌现」到能力「崩塌」。


为了解决这个问题,他们首先在数据层面,将模型回答错误的样本,通过一个离线的拒绝采样过程,获取「最小修改」纠错样本。再改进传统强化学习算法,单独计算每个 Token 的回报值。这种「更细粒度」的强化学习算法,使模型无论是模型回答还是思维链条都更合理,幻觉明显下降,人类偏好打分提升 13%。


从 ICT 到 AI 的无缝切换


当 40 年的 ICT 巨头闯入 AI 战场,等待他们的是「跨界」阵痛,还是无缝切换?答案可能是后者。


这是因为,AI 和 ICT 看似「跨界」,实际有很多相似之处,比如它们的核心都在于数据的处理、交换和存储;都是复杂超大系统的高效协同。


具体来说,ICT 涉及多个网元组成的庞大网络,AI 需要芯片、服务器、存储、交换和数据中心组成高效绿色的基座。这些系统不仅需要达到局部最优,还要放在一起进行全局优化。这要求具备全栈的技术积累、工程实践和系统优化能力,而这恰恰是中兴所擅长的,也是他们在未来重要的战略方向 ——「智算」中所要强化的。


除此之外,在 AI 这个方向上,中兴也有自己独特的优势。


我们知道,AI 的发展是一个跨多学科的复杂工程科学,它的创新进程离不开大量工程实践经验,比如参数调优、算子融合、算法优化…… 其涉及领域之广,技术门槛之高已经让一些早期入局的企业感觉吃力。


而从中兴身上,我们能够看到一些走 AI 长期路线的潜质。具体来说,和芯片厂家相比,他们有整体的系统工程能力;和做通算的纯 IT 类厂家相比,他们的组网能力更强;和纯做大模型的厂家相比,他们的硬件能力又更强。所以综合来看,中兴其实更容易拉起整个产业链,无论是硬件开发、软件平台、大模型还是行业应用,他们在原来的领域都已经有所涉及。


而且,中兴也有巨大的产品生态支撑,这些产品目前正在「AI 化」。如果未来全部 AI 化,市场空间巨大,也能让技术在丰富的场景中快速迭代,形成数据反哺。


当传统 ICT 巨头全力拥抱 AI,这场转型会给行业带来怎样的化学反应?答案或许就在中兴接下来的每一步里。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]


别忘了还有华为啊!中兴All in AI,华为肯定也不会落后。这两个巨头竞争,对整个AI产业链都是好事,会加速技术创新和应用落地。不过,也要警惕重复建设和资源浪费,希望他们能在差异化竞争中找到自己的定位。

中兴的优势在于“懂行”,他们对通信行业的Know-How不是一般互联网公司能比的。而且别忘了,ICT设备对稳定性和可靠性要求极高,这要求他们在工程和系统优化上有很强的实力,这些都可以在AI落地中发挥作用。挑战嘛,可能在于思维模式的转变,需要从过去的“硬件思维”转向“软件+服务”的模式。

我觉得是“鲶鱼效应”,以前大家都在舒适区里,现在有中兴这样的搅局者,其他厂商肯定会有压力。应对方法嘛,要么自己做AI,要么和AI公司合作,总之不能再抱着老一套了。另外,我觉得安全问题会越来越重要,毕竟ICT基础设施的安全直接关系到国家安全。

感觉这些技术都是在“喂”数据啊!批判学习不就是让模型看错题集吗?强化学习不就是让模型不断刷题吗?关键还是数据质量要高,否则只会越学越偏。而且,这些技术都是针对特定任务的,换个任务可能就没用了。所以,通用性还是个大问题。

我觉得中兴的核心优势在于他们深厚的行业积累和对通信需求的深刻理解。他们不仅懂AI技术,更懂如何将AI与通信业务相结合,解决实际问题。潜在优势是他们庞大的客户群体和合作伙伴网络,可以快速推广AI应用。挑战在于如何吸引和留住顶尖的AI人才,以及如何适应快速变化的AI技术格局。

中兴的转型无疑会给整个ICT行业带来示范效应,加速AI与ICT的融合。其他传统ICT厂商应该积极拥抱AI,加大研发投入,寻找自身优势与AI的结合点,比如在特定行业或场景中开发AI解决方案。同时,要加强与AI企业和研究机构的合作,共同推动AI技术在ICT领域的应用。

批判学习就像是让模型自己当老师,批改自己的作业。通过批判错误答案,模型能更深刻地理解问题本质,避免重蹈覆辙。双阶段强化学习则像是先纠正大方向的错误,再精雕细琢细节,保证模型既准确又严谨。实际应用中,批判学习需要大量高质量的错误答案和批判信息,这需要人工标注或者复杂的算法生成。强化学习则容易导致模型“过拟合”,只擅长解决特定问题,泛化能力下降。

别忘了中兴也是做芯片的啊!AI算力需求这么大,自己能搞定一部分芯片,成本和供应链上都有优势。而且人家是国企,政策支持力度也可能更大。不过,互联网公司在用户体验和快速试错上更灵活,这方面中兴可能要多学习。

批判学习(CL)我觉得是模仿了人类学习的过程,从错误中学习比单纯学习正确答案印象更深刻。双阶段强化学习(RL)则考虑了平衡的问题,先保证正确率,再提升严谨性。不过,这些方法都需要大量的数据和算力支持,对中小团队来说成本太高。另外,如何评估批判信息的质量和强化学习的效果,也是个难题。