微软发布自研 MAI 模型家族,主打零蒸馏、合规数据与企业级 AI 智能体布局。
原文标题:拒绝蒸馏!微软发布自研MAI-Thinking-1追平Claude Opus 4.6:完全从零训练,不沾任何第三方模型输出
原文作者:AI前线
冷月清谈:
文章重点强调,MAI-Thinking-1 从零训练,不使用第三方模型输出、概率分布或蒸馏数据,预训练阶段排除 AI 生成内容,数据来源强调企业级、合规授权与知识产权清洁。这一策略可能成为微软面向金融、医疗、国防等高合规行业的重要卖点。
除推理模型外,微软还发布了覆盖代码、图像、语音转写和语音合成的 MAI 系列模型,并计划接入 Azure AI Foundry 与 MAI Playground,开放给开发者使用和调优。文章还介绍了基于 OpenClaw 框架的 Microsoft 365 智能体 Scout,主打跨 Teams、Outlook、OneDrive 等应用的自主办公任务执行,但其安全性、定价和企业采用效果仍有待观察。
怜星夜思:
2、MAI-Thinking-1 在部分基准上追平 Claude Opus 4.6,这是否说明微软已经具备独立挑战 OpenAI、Anthropic 的能力?
3、Scout 这类能在后台自主处理邮件、日历、文档的办公智能体,你会放心让它代表你执行操作吗?
4、微软同时做模型、云平台、开发工具和办公应用,这种全栈 AI 路线会增强创新,还是加剧生态锁定?
原文内容
“我们现在已经基本追平了几个月前的最先进水平。”在 Build 大会前夕,微软 AI 执行副总裁兼 CEO Mustafa Suleyman 在采访中表示。
昨日,微软在 Build 大会上发布了一系列自研的 AI 模型。这标志着微软在模型研发上的一次重要推进,去年该公司才推出了首批自研模型,在此之前微软还主要依赖 OpenAI 的模型。甚至有一些观察人士,将本次大会称为微软的“AI 独立日”。
同时,Suleyman 也登台说明了公司在 AI 发展上的思考。他强调,微软的 AI 工作始终致力于支持人类员工和用户,而非取代他们,微软希望打造的是一种被称为“人本主义超级智能(humanist superintelligence)”的体系。
整体来看,这次 Build 大会的核心信号非常明确:微软正在从“AI 应用整合者”,转向“全栈 AI 基础设施与模型提供者”。
微软新模型家族的核心是 MAI-Thinking-1,这是微软首个高级推理模型。
据介绍,MAI-Thinking-1 是一款“中等规模模型”,拥有 350 亿活跃参数和 128K 上下文窗口,总参数规模约 1 万亿,在效率与性能之间取得平衡,同时强调低 token 成本。微软开发者市场负责人兼 GitHub 首席运营官 Kyle Daigle 在主题演讲前的媒体沟通会上表示,“MAI-Thinking-1 的设计目标,是擅长处理复杂的多步骤指令、长上下文推理以及代码生成。”
在过去一年中,推理模型这一类别主要由 OpenAI 的 o 系列、Google 的 Gemini 推理版本,以及 Anthropic 的 Claude 扩展思考模式所主导,另有开源权重阵营的 DeepSeek R1 在 2025 年初一度撼动了这一格局。
MAI-Thinking-1 是微软在这一赛道的新入局产品。在关键的软件工程基准测试中,它可以对标行业领先模型;在 SWE Bench Pro 编程基准上,其表现与 Claude Opus 4.6 持平。同时,该模型展现出先进的数学推理能力;MAI-Thinking-1 在 AIME 2025 中达到 97.0%,在 AIME 2026 中达到 94.5%。在微软进行的盲测人工对比评估中,用户对它的偏好甚至超过了 Anthropic 的 Claude Sonnet 4.6。
目前,微软尚未披露具体的训练方法,例如是否采用了“可验证奖励强化学习”(类似 OpenAI o1 的技术路径)、过程奖励建模或其他方案。但他们明确了一点“否定信息”:模型的训练数据中不包含任何其他已训练 AI 系统的概率分布或输出序列。
微软强调,MAI-Thinking-1 完全从零开始训练,使用的是企业级、干净且具备合规商业授权的数据,并且在预训练阶段排除了 AI 生成内容,也没有使用来自第三方模型的蒸馏数据,这迫使“模型真正学会任务本身”。
而这一“独立训练”的主张,或成为 MAI-Thinking-1 面向企业客户的差异化卖点。对于那些需要“干净知识产权来源”的企业来说,这一点甚至比模型能力本身更关键。对初创公司或非监管场景的开发者而言,这种差异可能显得抽象。但对部署在医疗、金融、国防或任何需要合规采购与数据治理的场景中的 AI 来说,这很可能会变成采购流程中的一个“必选勾选项”。
微软还发布了另外六款 MAI 系列模型,覆盖图像生成、语音转写、语音合成和编程等方向。
其中,MAI-Code-1-Flash 是一款推理效率极高的智能体编程模型,专为并深度集成于 GitHub Copilot、Visual Studio Code 以及微软整体技术栈而打造。其参数规模为 50 亿(5B),性能可对标 Haiku,但成本更低。
MAI-Image-2.5(包括其超高效的 Flash 版本)同时支持世界级的文生图与图像编辑能力,其 Arena 评分已超过 Nano Banana Pro。MAI Transcribe-1.5 是当前全球最强的语音转录模型之一,达到 SOTA(最先进水平)准确率。它的速度是同类模型的 5 倍,并内置支持 43 种语言的领域专有术语。MAI-Voice-2 提供覆盖 15 种语言的高质量、自然语音生成能力,并支持通过短语音样本进行声音适配,同时具备完善的滥用防护机制。其更高性价比版本 MAI-Voice-2-Flash 也即将推出。
未来,这些模型都将统一接入 Foundry 以及一个新的专用环境 MAI Playground。除了在 Azure AI Foundry 上分发并针对微软一方产品(1P)优化之外,这些模型还将面向开发者广泛开放,并支持在更多平台上使用。首次,开发者将可以对模型权重进行自定义调优。
值得一提的是,所有这些模型都建立在同一个基础之上:从零开始“向上爬升”(hill-climbing),不依赖任何蒸馏方法,共享一致的数据规范、训练基础设施和评估体系。
2026 年初,OpenClaw 席卷 AI 圈。现在,微软推出了 Scout,这是一款基于 OpenClaw 框架构建的 AI 智能体,可以全天候自主运行,在 Microsoft 365 应用之间独立完成任务。据介绍,Scout 可以连接 Teams、Outlook、OneDrive 和 SharePoint 等应用,并访问聊天、邮件、日历和联系人数据。用户可通过 Teams 调用它,它还可以与用户的浏览器交互,并通过模型上下文协议(MCP)连接外部应用。该工具可在云端、桌面端和网页端运行。
“该智能体会在后台持续运行,理解你的各类应用和系统中工作的运作方式,并在不需要每次提示的情况下主动采取行动。”微软企业副总裁 Omar Shahine 在一篇博客中表示,这类智能体会以用户的身份执行操作,并拥有受治理的 Entra 身份。作为微软资深员工,Shahine 近期还宣布将领导一个新团队,把基于 OpenClaw 的个人助手引入 Microsoft 365 应用。
Shahine 表示,Scout 可以减少办公人员面对的重复性任务,例如与同事协调和安排会议时间,或根据即将到来的工作安排自动在日历中预留时间。“它还可以发现风险,例如决策停滞,从而让你在问题演变成阻碍之前及时处理。”
值得注意的是,由于明显存在安全漏洞,OpenClaw 一度受到审查,但微软承诺 Scout 具备“企业级安全与控制能力,从第一天起就可以在组织中被信任使用”。微软还表示,将向开源 OpenClaw 项目进行上游贡献。
目前,Scout 以“实验性版本”的形式向其 Frontier 项目客户开放,并需要通过 Intune 策略配置以及“主动选择确认(opt-in attestation)”。定价方面,微软暂未公布更多细节,尚不清楚 Scout 是否会包含在 Microsoft 365 Copilot 订阅中,还是作为单独产品收费。
尽管微软大力推进 AI,其仍在努力说服企业客户相信 Microsoft 365 Copilot 的附加费用是值得的。该产品面向大型企业定价为每位用户每月 30 美元。今年 1 月,微软表示约有 3% 的 Microsoft 365 客户为该附加订阅付费,总计约 1500 万付费用户。上月,微软宣布该数字已增长至 2000 万。Scout 是微软在 Microsoft 365 中推出的一系列智能体工具中的最新一项,这些工具还包括 Agent Mode(用户可在 Word、Excel 等应用中与 Microsoft 365 Copilot 交互生成内容)以及 Copilot Cowork(微软版的 Anthropic Claude Cowork 智能体,可独立完成任务)。
参考链接:
https://microsoft.ai/news/microsoft-build-2026-mai-keynote-transcript/
https://www.semafor.com/article/06/02/2026/microsofts-ai-chief-on-the-greatest-game-of-catchup-ever-played
声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。



