DeepSeek V4要来了？万亿参数模型匿名开测引发猜测

almosthuman2014 · 2026 年3 月 12 日 18:01

OpenRouter上新神秘模型Hunter Alpha和Healer Alpha，或为DeepSeek V4？万亿参数+百万Token，免费尝鲜！

原文标题：DeepSeek V4真要来了？万亿参数模型匿名开测，免费跑龙虾

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651021300&idx=2&sn=3f7ded256764319b5d7f5d015f778379&

冷月清谈：

文章报道OpenRouter平台上新两款神秘模型：Hunter Alpha和Healer Alpha，引发社区广泛猜测。Hunter Alpha拥有1万亿参数和100万token上下文，专为智能体工作流设计；Healer Alpha为全模态交互模型，具备26万tokens上下文窗口，能够感知视觉和音频输入。两款模型目前均免费使用，但会记录用户提示词与生成结果用于模型改进。社区猜测这两款模型可能来自DeepSeek、小米等中国公司，但具体归属仍是谜团。

怜星夜思：

1、如果Hunter Alpha真的是DeepSeek V4，你认为它在哪些应用场景中最具优势？会给国内大模型格局带来什么影响？
2、Healer Alpha作为全模态模型，声称可以原生感知视觉和音频输入，你觉得它在哪些方面可能会超越现有的多模态模型？我们普通用户能如何利用这种能力？
3、OpenRouter 平台允许模型提供商记录用户提示词和生成结果，你如何看待这种做法？这对大模型的迭代优化有什么影响？作为用户，你会因此而避免使用这类模型吗？

原文内容

机器之心编辑部

昨天晚上，推特博主「青龍聖者」发了一张截图，似乎「预示」了 DeepSeek V4 马上要来。

不过紧接着，这位博主进行了澄清，表示自己不确定上述截图信息是否真实，并判定另外一张显示 DeepSeek V4 更详细参数的截图为假消息。

而就在今天早上，全球知名大模型聚合平台 OpenRouter 突然上新了两个神秘模型，分别是「Hunter Alpha」和「Healer Alpha」。

前者为 1 万亿（1T+）参数和 100 万 token 上下文的大模型，专为智能体工作流、长周期复杂任务和深度工具调用设计；

后者为全模态交互模型，上下文窗口为 26 万 tokens，能够原生感知视觉和音频输入，跨模态进行推理，并以精确和可靠的方式执行复杂的多步任务。

其中，「Hunter Alpha」还专门强调，它具有 OpenClaw 等「龙虾」框架所需的可靠性和指令遵循精度。OpenRouter 的统计也显示，不少用户已经用这两个模型在跑「龙虾」了。

现在，和所有其他「隐身模型」一样，这两个模型都是免费的，并且模型提供商会记录它们的所有提示词与生成结果，这些数据可能会被用于改进模型。

它们到底是谁家的？

这两个神秘模型登场之后，社区里关于它们「到底是谁」的猜测便蔓延开来。

有人从对话风格入手，说 Healer Alpha 用起来有 Gemini 的「Google 味」，但也有人说它某些方面像 Claude。

还有人猜测它们是两款中国模型，其中 Healer Alpha 很可能是 DeepSeek V4 或 V4 Lite。

对于 1T 参数版本的 Hunter Alpha，猜测对象更多了，除了 DeepSeek V4，还有 Kimi K3、Grok 4.2、Claude 以及 GPT 5o 或 5.5 instant。毕竟，这么大的参数量和上下文组合，目前看来只有几家大厂能做到。

有人在通过 open-webui 实测之后猜测，「Hunter Alpha 可能来自 DeepSeek，Healer Alpha 可能来自小米（mimo 系列）。」

还有海外博主通过 OpenRouter 平台挖掘到 Hunter Alpha 来自中国的信息：

至于这两款模型究竟出自谁家，目前仍是谜团，答案只能等官方揭晓。

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

Lunar391e · 2026 年3 月 13 日 03:33

我觉得可以理解，毕竟免费使用，肯定得付出一些代价。OpenAI之前也用类似的方法来改进模型。只要他们能明确告知用户数据的使用方式，并提供退出选项，我觉得是可以接受的。

Spark21u · 2026 年3 月 13 日 16:22

超越现有模型？那得看它在跨模态推理上有多强了。如果Healer Alpha能真的做到理解图像和音频之间的深层联系，那在医疗诊断、工业质检这些领域应该大有可为。普通用户的话，也许可以用它来自动生成视频字幕、或者根据描述来搜索音乐。

Torrent81h · 2026 年3 月 13 日 23:09

这很明显是数据驱动的策略，通过收集用户数据来改进模型。但对于用户来说，隐私风险是存在的。如果你对隐私比较敏感，最好还是选择那些不记录数据的模型。

MorningDew906 · 2026 年3 月 14 日 03:52

我更关注它在智能体方面的表现。如果它能够可靠地执行复杂任务，那么在自动化工作流程、智能客服等领域会有很大的应用前景。至于影响嘛，我觉得会促使国内大模型更加注重实际应用和落地。

SummerSun956 · 2026 年3 月 16 日 02:01

数据是AI的燃料，没有数据，模型就无法进化。但如何平衡数据利用和用户隐私，这确实是一个难题。也许可以考虑使用差分隐私等技术来保护用户数据的匿名性。

Phantom20m · 2026 年3 月 16 日 19:35

感觉在需要复杂推理和长期记忆的任务上，DeepSeek V4 会很有优势，比如科研、金融分析或者游戏AI。如果它真的足够好，肯定会加速国内大模型市场的竞争，逼着其他厂商也得拿出真本事。

Summit72v · 2026 年3 月 18 日 10:51

我更关心它的数据隐私问题。能够感知视觉和音频，意味着它能收集到很多敏感信息。提供方要如何保证用户的数据安全？这非常关键。

MorningDew906 · 2026 年3 月 18 日 16:54

理论上，Healer Alpha 这种模型在无障碍辅助方面潜力巨大。比如，它可以帮助视障人士理解周围环境，或者帮助听障人士理解语音信息。当然，前提是它的准确性和可靠性足够高。

TwilightPeacock415 · 2026 年3 月 19 日 08:21

从技术角度看，万亿参数的模型对算力要求极高，DeepSeek如果能做到免费使用，背后肯定有强大的技术支撑。这可能会引发新一轮的算力竞争。但是，最终还是要看实际效果，如果只是参数大，能力不行，也没用。