神秘模型Cypher Alpha现身,百万Token上下文引爆猜测:OpenAI又要开源了?

OpenRouter 上线神秘模型 Cypher Alpha,百万Token上下文引发OpenAI开源猜测。模型性能有待提高,但已引发广泛关注。

原文标题:刚刚,神秘模型火了!网友:是OpenAI要开源?

原文作者:机器之心

冷月清谈:

OpenRouter 上出现了一款名为“Cypher Alpha”的神秘模型,它拥有 100 万 token 上下文,并具备推理能力,而且可以免费使用。由于此前 OpenAI 模型也曾以Alpha结尾命名,并且风格相似、工具调用 ID 格式一致,引发了网友关于 OpenAI 即将开源新模型的猜测。目前,该模型主要用于收集用户反馈,支持长上下文任务和代码生成,但具体出自哪家机构尚未可知,网友猜测包括 OpenAI、Grok 等。尽管有网友测试认为其推理能力和编程能力有待提高,但也有人对其在编码、语言等方面的表现表示乐观,认为适合开发者、作家和学生使用。目前该模型性能还有待提高

怜星夜思:

1、Cypher Alpha号称支持100万token上下文,这么长的上下文对于实际应用来说,会带来哪些新的可能性?或者说,有哪些场景会特别需要这么长的上下文?
2、文章里提到有人用Grok测试草莓的拼写,这个测试的意义是什么?为什么一个AI模型需要能够正确拼写草莓?
3、Cypher Alpha现在是免费使用,但如果未来开始收费,你觉得什么样的定价策略会比较合理?或者说,什么样的功能或服务是值得付费的?

原文内容

机器之心报道

机器之心编辑部

OpenRouter 又上新神秘模型了,支持 100 万 token 上下文,猜猜是谁家的。


刚刚,OpenRouter 上出现了一个神秘模型,该模型被命名为「Cypher Alpha」。其可以免费使用,100 万 token 上下文,还具有推理能力。


注:OpenRouter 是一个大模型 API 路由器,旨在将各种 AI 模型和服务集成到一个统一的接口中。



模型地址:https://openrouter.ai/openrouter/cypher-alpha:free


大家看到这个消息时的反应是这样的:


图片


毕竟,以 Alpha 为结尾的命名方式不止一次传出是来自 OpenAI 的模型。比如此前 OpenRouter 上线的两款神秘模型 Optimus Alpha、Optimus Alpha 都被怀疑出自 OpenAI。因为它们的风格与 OpenAI 顶级模型非常相似,并且工具调用 ID 格式与 OpenAI 格式一致。


所以这次相同的命名方式,很难不让大家联想到 OpenAI 又要发新模型了。


虽然没有官方认领,但许多人怀疑这是 OpenAI 对未来开源版本的一次悄无声息的测试。虽然被贴上隐身的标签,但很难被忽视。



该模型主要用于收集用户反馈,并且是一个通用模型,支持长上下文任务,包括代码生成。


由于没有公开大模型出自哪家机构,好奇的网友已经开始猜测了。猜测来自 OpenAI 的人居多。



X 知名博主 Rohan Paul 认为可能是 GPT-5 或者是一个开源模型。



也有人猜测这是马斯克家的 Grok,毕竟有消息称 Grok 4 马上就要来了。



但这一猜测立马被否定了,因为这个模型连「strawberry」中几个 r 都回答错误,毕竟我们用 Grok 3 测试了一下,回答正确。Grok 4 性能应该更强才对。



还有人认为模型效果不佳,推理能力不是很强,主打的编程能力表现也不理想。



网友开始祈祷不要是 OpenAI 家的。



不过,也有网友很看好这款模型,ta 进行了 20 项全面测试,涵盖 5 个类别:编码、推理、语言、压力测试和一致性。结果是编码测试全部通过,推理测试 4/5 通过,语言测试全部通过…… 该网友认为这款模型适合开发者、作家和学生使用,但复杂数学、逻辑输出需要验证,毕竟是免费的,效果还是可以的。 


地址:https://x.com/Distractosphere/status/1940132000087560197


最后,我们也上手测试了一下,由于第一次提示语没有写明白,模型表示没有看懂,完善提示词后,才回答正确。



但在接下来的两个问题中,模型都回答错误,要知道这些问题已经被很多模型有针对性的优化了。看来,该模型的性能还有待提高。



你认为这是哪家的模型,欢迎评论区留言。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]


我比较关注的是模型的可解释性。现在很多AI模型都是黑盒,用户不知道模型是如何做出决策的。如果Cypher Alpha能提供模型的可解释性分析,帮助用户理解模型的决策过程,并且提供相应的解释报告,我会愿意为此付费。毕竟,知其然,还要知其所以然,才能更好地信任和使用AI模型。

哈哈哈,我来抖个机灵!也许是因为草莓是程序员最喜欢的水果?毕竟,加班写代码的时候,来一颗草莓补充维生素C,感觉能多写两行代码!认真说,测试草莓拼写,其实是一种快速评估模型基本能力的手段。如果模型连草莓都搞不定,那还是早点放弃吧,省的浪费时间。

别的不说,百万token如果能保证效果,我第一个用来写小说!再也不用担心人物关系和情节忘掉了。以前用AI续写,总是出现各种bug,人物性格错乱、情节矛盾,有了长上下文,AI就能更好地记住之前的内容,写出更连贯的故事。希望以后能有更多这种长上下文模型,解放生产力啊!

100万token,那感觉可以直接把一本书或者一个大型项目的代码直接扔进去了,想想就激动!这对于需要处理大量信息的场景简直是福音。比如,法律文本分析,医疗记录处理,复杂的代码库理解,甚至可以用来做超个性化的内容推荐。不过,这么长的上下文,成本和速度也是个问题,希望Cypher Alpha能解决好。

这个问题很有意思!测试草莓拼写,看似简单,其实考察的是模型的基础语言能力和常识。如果模型连常见词汇都拼写错误,说明它的语言理解和生成能力可能存在问题。这就像考试中的基础题,如果基础题都做不对,就很难指望它能解决复杂问题。

从企业的角度来看,更关注的是模型的稳定性和安全性。如果Cypher Alpha能提供企业级的部署方案,保证数据的安全性和隐私性,并且提供SLA保障,那么企业愿意为此付费。另外,针对特定行业或场景的定制化服务,也是一个不错的方向。例如,针对金融行业的风险评估模型,针对医疗行业的病历分析模型等。

个人觉得,定价策略应该根据token的使用量来定,类似于OpenAI那样。免费提供一定量的token,让用户体验;超过一定量后,按照token数量收费。另外,可以推出一些增值服务,比如更快的推理速度、更高的并发量、更专业的技术支持等,这些都可以作为付费点。

楼上正解!补充一点,这种看似trivial的测试,在AI领域很常见。它被称为“红队测试”,目的是通过各种刁钻古怪的问题,找出模型的薄弱环节。草莓拼写只是一个例子,还可以测试模型对于日期、人名、地名等信息的处理能力。通过这些测试,可以更全面地评估模型的性能和可靠性。

谢邀,利益相关,AI算法工程师。百万token上下文对于AI在专业领域的应用是质的飞跃。以前做知识图谱,很多信息因为上下文长度限制无法有效融入。现在可以把整个领域的知识库作为上下文输入,AI就可以在更完善的知识体系下进行推理和决策,想想在金融风控、药物研发这些领域,潜力无限!当然,长上下文也对模型的架构和训练提出了更高的要求。