Mistral AI发布Medium 3:性能升级,企业级Le Chat Enterprise同步上线

Mistral AI发布Medium 3模型,性能优于GPT-4o和Claude 3.7 Sonnet,成本更低。同时推出企业级聊天机器人Le Chat Enterprise。

原文标题:时隔两月,Mistral AI终于上新Medium 3,近期还有「One more thing」

原文作者:机器之心

冷月清谈:

Mistral AI发布了新的语言模型Mistral Medium 3,该模型定位在轻量级和大规模模型之间,在关键基准测试中表现优于GPT-4o和Claude 3.7 Sonnet,但并未开源,可通过 Mistral 的官网和 API 或其合作伙伴的 API 使用。针对企业使用,Mistral Medium 3的成本远低于Claude 3.7 Sonnet。同时,Mistral AI还预告将在未来几周内发布一款“大型”产品。此外,Mistral还推出了企业级聊天机器人服务Le Chat Enterprise,该服务集成了AI功能,并与第三方服务集成,旨在为企业提供隐私优先的AI解决方案。

怜星夜思:

1、Mistral Medium 3 在哪些实际应用场景中能够发挥更大的优势?除了文中的金融、能源和医疗保健,还有什么行业适合使用?
2、Mistral Medium 3 虽然性能很强,但并未开源,这对于开源社区会有什么影响?大家会更倾向于使用开源模型还是闭源但性能更强的模型?
3、Le Chat Enterprise 作为企业级聊天机器人,与 ChatGPT 相比,有哪些独特的优势?你认为企业会更看重哪些方面?

原文内容

机器之心报道

编辑:蛋酱、张倩


时隔两月,Mistral AI 终于又上新了。


「今天,我们欣喜地宣布推出 Mistral Medium 3,进一步提升语言模型的效率和可用性。」



据官方博客介绍,Mistral Medium 3 处于一个新的性能层级,介于轻量级和大规模模型之间。该模型在关键基准测试中优于 GPT-4o 甚至 Claude 3.7 Sonnet。


只是 Mistral Medium 3 并未开源,目前可通过 Mistral 的官网和 API 或其合作伙伴的 API 使用。Mistral Medium 3 将于周三上线亚马逊云科技的 Sagemaker 平台,后续也会登陆其他主机平台,包括微软的 Azure AI Foundry 和谷歌的 Vertex AI 平台。


该模型专为企业使用而设计,其性能在基准测试中达到了 Claude 3.7 Sonnet 的 90% 以上,但成本仅为后者的 1/8 —— 输入每百万 token 仅需 0.4 美元,输出每百万 token 仅需 2 美元。相比之下,Sonnet 的输入 / 输出价格分别为 3 美元和 15 美元。


另外,Mistral AI 还预告了「One more thing」:


随着三月份 Mistral Small 和今天 Mistral Medium 的发布,我们在接下来的几周内正在筹备一款「大型」产品,这早已不是什么秘密了。即使是我们的中型型号,其性能也远超 Llama 4 Maverick 等旗舰开源型号,我们非常期待「揭开」未来的神秘面纱 :) 


会是什么重磅发布?值得我们期待一下。


优于 GPT-4o 和 Claude 3.7 Sonnet 的性能


基准测试表明,Mistral Medium 3 在软件开发任务中表现出色。在 HumanEval 和 MultiPL-E 等编程测试中,它的表现与 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4o 模型不相上下,甚至更胜一筹。



除了学术基准测试外,团队还报告了更能代表实际用例的第三方人工评测。


根据第三方的人类评估,在 82% 的编程场景中,它优于 Llama 4 Maverick,并且在近 70% 的案例中超过了 Command-A。



该模型在不同语言和模态上也具有很强的竞争力。与 Llama 4 Maverick 相比,它在英语(67%)、法语(71%)、西班牙语(73%)和阿拉伯语(65%)中的胜率更高,并且在多模态性能方面表现出色,在 DocVQA(0.953)、AI2D(0.937)和 ChartQA(0.826)等任务中取得了领先的分数。



Mistral Medium 3 针对企业整合进行了优化。它支持混合部署和本地部署,提供定制化后训练,并且能够轻松连接到业务系统。据 Mistral 称,它已经在金融服务、能源和医疗保健等行业的组织中进行测试,用于支持特定领域的业务流程和面向客户的解决方案。


企业级「ChatGPT」:Le Chat Enterprise


与此同时,Mistral 还推出了 Le Chat Enterprise。


这是一款面向企业的聊天机器人服务,今年早些时候就推出了私人预览版,但今天正式全面上市。


用法如下:



Le Chat Enterprise 可通过网络和移动应用程序使用,它就像 ChatGPT 的竞争对手,但它是专为企业及其员工打造的。考虑到了用户可能会跨不同的应用程序和数据源工作,它将人工智能功能整合到一个单一的、隐私优先的环境中,实现深度定制、跨职能工作流和快速部署。


Le Chat Enterprise 提供了 AI「智能体」构建器等工具,并将 Mistral 的模型与 Gmail、Google Drive 和 SharePoint 等第三方服务集成。


此外,Le Chat Enterprise 即将支持 MCP——Anthropic 为连接 AI 助手和数据所在系统及软件而制定的标准。包括谷歌和 OpenAI 在内的主要 AI 模型提供商,都已经在今年早些时候宣布将采用 MCP。


更多信息,可参考官方博客。


参考链接:

https://mistral.ai/news/mistral-medium-3

https://mistral.ai/news/le-chat-enterprise


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

我猜企业最看重的还是效率和成本。如果 Le Chat Enterprise 能够显著提高员工的工作效率,降低运营成本,那肯定会受到企业的青睐。当然,安全性、合规性也是必不可少的考虑因素。

这个问题问得好!除了文中提到的行业,我觉得在教育领域,Mistral Medium 3 也能大有作为。比如可以定制成 AI 助教,批改作业啥的,减轻老师负担。或者在电商领域,做个性化商品推荐,提高用户购买转化率,想想都觉得香!

从开源社区的角度来看,闭源模型的出现可能会加速开源模型的进化。毕竟,有了竞争才有进步嘛!但长期来看,如果闭源模型一直保持领先优势,可能会导致一部分开发者转向闭源阵营,对开源生态造成一定冲击。所以,开源社区也需要不断努力,提升开源模型的性能和易用性。

这个问题涉及到商业模式的选择。闭源模型往往需要付费使用,但能提供更好的技术支持和商业保障。开源模型虽然免费,但可能需要自行解决技术问题。企业在选择时,需要综合考虑成本、性能、安全性等因素,选择最适合自己的方案。

Le Chat Enterprise 感觉就是个“定制款”的ChatGPT,更注重企业内部的协同和数据安全。企业嘛,最怕的就是数据泄露,所以一个安全可控的聊天机器人肯定更受欢迎!

从技术角度分析,Le Chat Enterprise 最大的优势在于其可定制性和与企业现有系统的集成能力。ChatGPT 更多是通用型的AI助手,而 Le Chat Enterprise 可以根据企业的具体需求进行定制,并与企业内部的 CRM、ERP 等系统打通,实现更高效的自动化工作流程。此外,对 MCP 标准的支持也意味着更好的互操作性。

这个问题太值得讨论了!个人感觉,闭源模型就像是精装修的房子,拎包入住,啥都好就是少了点DIY的乐趣。开源模型就像毛坯房,虽然要自己装修,但自由度高,可以根据自己的需求来定制。两者各有优劣,就看个人选择了。

我倒是觉得,现在AI模型都在卷性能,但企业真正需要的是稳定可靠。Mistral Medium 3 如果能在数据安全、合规性方面做得更好,比如提供更完善的权限管理、数据加密功能,那在对数据安全要求高的政府部门、科研机构等领域,肯定更有竞争力。

从技术角度来看,Medium 3 在软件开发任务中表现出色,那么在需要大量代码生成的场景下,如游戏开发、自动化测试等领域,可能会有不错的应用。另外,考虑到其多语言能力,跨境电商、国际新闻编译等涉及多语言处理的行业也值得关注。