DeepSeek GitHub 星数超越 OpenAI,开源大模型新里程碑
|
|
9
|
0
|
2025 年2 月 14 日
|
法国巨额投资AI,欲与美中争锋
|
|
3
|
0
|
2025 年2 月 14 日
|
SelfDefend:让大语言模型具备自卫能力,有效抵御越狱攻击
|
|
3
|
0
|
2025 年2 月 14 日
|
DeepSeek-R1-Zero 的“顿悟时刻”或许是误解?
|
|
8
|
0
|
2025 年2 月 14 日
|
CoMCTS:让多模态大语言模型像OpenAI o1一样推理和反思
|
|
9
|
1
|
2025 年2 月 14 日
|
ChatGPT 更新:公开思维链,但并非完整版
|
|
9
|
3
|
2025 年2 月 14 日
|
OpenAI Sora或将推出图像生成功能,代号"papaya"
|
|
8
|
0
|
2025 年2 月 14 日
|
奥特曼:AGI 即将到来,三大经济学观察
|
|
3
|
0
|
2025 年2 月 14 日
|
增强大型语言模型可信度:隐私与安全视角探讨
|
|
9
|
0
|
2025 年2 月 14 日
|
清华提出GFT算法:无需引导采样,高效训练视觉模型
|
|
8
|
0
|
2025 年2 月 14 日
|
时间序列数据因果推断方法综述
|
|
5
|
1
|
2025 年2 月 14 日
|
GPT文本分类器构建指南
|
|
7
|
1
|
2025 年2 月 13 日
|
美国参议员提案:下载中国AI模型或面临20年监禁及百万美元罚款
|
|
9
|
0
|
2025 年2 月 13 日
|
SAAI:一种利用异常同步性确定多变量时间序列异常类别数量的新方法
|
|
9
|
0
|
2025 年2 月 13 日
|
AlphaGeometry2:超越IMO金牌得主,攻克奥赛几何难题
|
|
4
|
1
|
2025 年2 月 13 日
|
马斯克974亿美元收购OpenAI遭拒,奥特曼反建议收购Twitter
|
|
2
|
1
|
2025 年2 月 13 日
|
小红书开源FireRedASR语音识别模型,中文效果达新SOTA
|
|
5
|
1
|
2025 年2 月 13 日
|
北航开源轻量级视频理解模型TinyLLaVA-Video,性能超越部分7B模型
|
|
6
|
1
|
2025 年2 月 13 日
|
飞书集成DeepSeek-R1,高效办公新体验
|
|
4
|
0
|
2025 年2 月 13 日
|
上交大研究颠覆RL Scaling范式:817条样本激发大模型7倍推理性能
|
|
9
|
0
|
2025 年2 月 13 日
|
DeepSeek R1 的真相:关于 DeepSeek 谣言的澄清与分析
|
|
9
|
9
|
2025 年2 月 13 日
|
HugWBC: 让机器人拥有更灵活的运动能力
|
|
8
|
0
|
2025 年2 月 13 日
|
比亚迪发布全民智驾战略,7万级车型即享高阶智能驾驶
|
|
3
|
0
|
2025 年2 月 13 日
|
七位巨擘荣膺伊丽莎白女王工程奖,表彰其对现代机器学习的贡献
|
|
9
|
0
|
2025 年2 月 13 日
|
斯坦福大学提出s1:用1000样本训练,推理性能超越o1
|
|
9
|
5
|
2025 年2 月 13 日
|
有限GPU资源下如何用GRPO训练大型语言模型?
|
|
9
|
1
|
2025 年2 月 13 日
|
ICLR2025:应对噪声视频,实现鲁棒三维重建的新基准和方法
|
|
9
|
0
|
2025 年2 月 13 日
|
LLaVA-Mini:单视觉Token高效多模态大模型,显著提升图像视频理解效率
|
|
9
|
0
|
2025 年2 月 13 日
|
日本AI公司Sakana AI发布Transformer²:自适应大模型,动态调整权重以完成各种任务
|
|
9
|
0
|
2025 年2 月 13 日
|
希尔伯特第十问题扩展版得到证明:数学真理的边界再次被拓展
|
|
9
|
1
|
2025 年2 月 13 日
|