微软自研AI大模型MAI,减少对OpenAI依赖

微软加码AI,自研MAI模型挑战OpenAI,并计划推出API,预示AI领域竞争加剧。

原文标题:微软甩开OpenAI自研大模型,还计划用DeepSeek

原文作者:机器之心

冷月清谈:

微软正积极开发内部AI模型MAI,旨在与OpenAI的GPT系列竞争,并已在Copilot智能助手中进行测试。此举源于双方在技术合作上的分歧,尤其是在OpenAI拒绝分享其最新模型o1的“思维链”推理过程后,矛盾进一步激化。微软AI部门负责人Mustafa Suleyman正在推动AI业务的独立发展,其团队在模型性能上已取得显著进展,并通过思维链技术与OpenAI形成差异化。此外,微软还在测试xAI、Meta、Anthropic和DeepSeek的模型,并计划推出MAI的API,直接与OpenAI等公司展开竞争。

怜星夜思:

1、微软自研MAI模型,并测试多家公司的模型,这是否意味着AI模型领域的“百家争鸣”时代即将到来?对于开发者和用户来说,这会带来哪些机遇和挑战?
2、文章提到微软不满OpenAI拒绝分享“思维链”技术细节。你认为在AI技术合作中,技术保密和开放共享之间应该如何平衡?
3、文章中提到“思维链”技术可以提升大模型处理复杂问题的能力。你认为除了“思维链”之外,还有哪些技术或方法可以有效提升大模型的推理能力和问题解决能力?

原文内容

机器之心报道

机器之心编辑部

思维链引发的战争。


众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。

但随着近期 AI 技术的突破、双方的分歧加剧,微软正开始在 AI 赛道上加码。据知情人士透露,微软已经开发内部人工智能模型以与 OpenAI 竞争,这一战略性举措的目标是直接替代 OpenAI 的 o1、o3-mini 等核心模型,更标志着这对曾经的「黄金搭档」正在走向技术竞争的新阶段。


据外媒 the Information 报道,目前微软正在测试 MAI(Microsoft Artificial Intelligence) 模型在各种任务中执行的效果,包括 Copilot AI 智能助手。Copilot 旨在作为通用助理处理广泛的用户问题,并为处理文档或进行电话会议的人员提供具体建议。


除了加大力气推动自研模型之外,据说微软还在测试来自 xAI、Meta、Anthropic 和 DeepSeek 的替代 AI 模型,进而为 Copilot 中的技术赋能。由于近期的技术突破,业内很多大模型已拥有了强大的语言建模与推理能力,可以处理更复杂的查询并展示出类似人类的问题解决能力,可应用于更广泛的商业级应用场景。


微软已向 OpenAI 投资超过 130 亿美元,并提供了大量算力支持,与之相对的是可获得 OpenAI 的部分收入分成,以及技术的使用权。尽管微软与 OpenAI 的长期合作使其在前景巨大的人工智能竞赛中占据了先发优势,但该公司一直致力于降低对 OpenAI 的技术依赖。

据知情人士称,去年秋季两家公司的一次视频会议上,Mustafa Suleyman 要求 OpenAI 提供关于其最新 AI 模型 o1 的详细技术文档,尤其是模型在回答用户问题前的「思维链」推理过程。

然而 OpenAI 拒绝透露这些核心机密,这让 Suleyman 十分不满,甚至在会议中直接提高嗓门,指责 OpenAI 未履行合作协议,最终愤怒地提前结束通话。

微软 AI 部门负责人 Mustafa Suleyman。

合作中的摩擦暴露了微软与 OpenAI 之间的矛盾。微软的 AI 工具依赖于 OpenAI 提供的先进技术,但该公司不愿长期受制于人。因此,Suleyman 需要在维持合作的同时让微软 AI 业务实现独立发展。

为此,Suleyman 加码了微软自身的 AI 研究团队,由他的副手 Karén Simonyan 领导,专注于开发 MAI 模型。

行业观察指出,由 Mustafa Suleyman 领衔的微软 AI 部门已取得关键突破:MAI 系列模型在通用基准测试中达到了与 OpenAI、Anthropic 顶尖模型相当的性能水平。

值得关注的是,该研究团队正通过思维链技术(Chain-of-Thought)提升大模型对复杂问题的处理能力,通过这种显式生成中间思维步骤来提升推理能力的方法,使得 MAI 在技术路线上与 OpenAI 形成差异化竞争。


目前微软已启动 MAI 模型在 Copilot 产品中的替代测试,相较于此前轻量级的 Phi 模型,新一代 MAI 在参数量级与场景适应性方面实现显著跃升。

微软还计划在今年晚些时候推出 MAI 的 API,让外部开发者能够将微软 AI 模型集成到自己的应用程序中。一旦新的服务上线,微软与 OpenAI、Anthropic、DeepSeek,可能将会成为直接竞争对手。

参考内容:
https://www.theinformation.com/articles/microsofts-ai-guru-wants-independence-from-openai-thats-easier-said-than-done
https://www.bloomberg.com/news/articles/2025-03-07/microsoft-creates-in-house-ai-models-it-believes-rival-openai-s

© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

除了思维链(Chain of Thought),我觉得Prompt工程也很关键。好的Prompt可以引导模型更好地理解问题,从而给出更准确的答案。现在Prompt的玩法越来越多,比如Few-shot learning、Self-consistency等等,都是很有意思的方向。

另外,知识图谱(Knowledge Graph)也是一个值得关注的方向。将知识图谱融入大模型,可以让模型具备更强的知识推理能力,避免胡编乱造。

从认知科学的角度来看,人类的推理能力不仅仅依赖于逻辑推理,还依赖于直觉、经验和常识。因此,提升大模型的推理能力,需要让模型更好地模拟人类的认知过程。

除了思维链之外,还可以考虑以下方法:
1. 引入记忆机制:让模型能够记住之前的推理过程和结果,避免重复计算。
2. 利用外部知识库:让模型能够查询外部知识库,获取更多的信息。
3. 模拟人类的情感:让模型能够理解人类的情感,从而更好地理解人类的需求。

你们说的都太学术了,我来个接地气的。

我觉得搞个类似搜索引擎的东西加入大模型很有用。思考半天想不出来,不如直接搜一下!很多时候我们人类解决问题也是这样啊,先百度一下再说。这样既提升了推理能力,又能避免模型瞎编,一举两得!

技术保密和开放共享的平衡,这绝对是合作中的老大难问题。我的看法是,核心技术,比如“思维链”这种能决定模型上限的东西,肯定要牢牢掌握在自己手里。但是,一些通用的、非核心的技术,可以考虑开放共享,共同构建生态。

这就像造车,发动机是核心技术,肯定不能随便告诉别人。但是车身设计、内饰风格,就可以搞开放合作,甚至众筹设计,这样才能做出更符合市场需求的产品。

从博弈论的角度来看,技术保密和开放共享是一种典型的囚徒困境。如果双方都选择保密,可能短期内各自受益,但长期来看会阻碍整个行业的发展。如果双方都选择开放共享,虽然短期内收益降低,但长期来看可以扩大市场规模,实现共赢。

因此,理想的模式是建立一种基于信任和互惠的合作机制,在保护核心技术的同时,积极参与开源社区,贡献自己的力量。

这个问题很有意思!AI 模型“百家争鸣”绝对是好事,给了我们开发者更多选择,也逼着各家公司卷技术、卷服务。机遇嘛,肯定是可以根据不同场景选最合适的模型,省钱提效。但挑战也不小,模型多了,学习成本就高了,还得关注各个模型的特点和适用范围,避免选错翻车。

另一方面,对于用户来说,选择更多了,但可能也会更迷茫。以后可能需要专业的 AI 模型顾问来帮忙挑选和集成不同的模型。

我觉得“百家争鸣”用在这里可能还不太准确,更像是AI模型领域的“春秋战国”时代。大家都在跑马圈地,抢占算力、数据和人才。机遇在于,新的模型架构和算法会不断涌现,推动AI技术快速发展。挑战在于,标准不统一,生态割裂,开发者需要在不同平台之间切换,增加了开发和维护成本。

从学术角度来看,多样化的模型可以促进跨领域的知识融合和创新,但也需要警惕模型同质化以及潜在的安全风险。

有没有一种可能,微软只是想用这些“备胎”来压价OpenAI?毕竟鸡蛋不能放在一个篮子里,万一OpenAI哪天飘了呢?这也算是商业上的常规操作吧?

当然,对我们普通用户来说,肯定是希望看到更多竞争的,这样才能享受到更便宜、更好用的AI服务。

我觉得这事儿得分情况看。如果微软和OpenAI纯粹是商业合作,那OpenAI当然有权拒绝分享核心技术。但如果双方有更深层次的战略合作,比如共同研发、技术授权等等,那OpenAI就应该拿出更多的诚意。

说白了,就是看双方的利益绑定程度。利益越高,信任度就应该越高,技术开放程度也应该越高。