抖音开源ContentV:256块NPU训成8B视频模型,效果超越Sora等
|
|
3
|
0
|
2025 年6 月 15 日
|
强化学习大佬质疑:大模型是“洞穴”中的大脑扫描仪?
|
|
4
|
0
|
2025 年6 月 15 日
|
深入理解CNN:显著图、原型层解释与反事实解释
|
|
1
|
0
|
2025 年6 月 15 日
|
面壁智能MiniCPM 4.0:端侧长文本推理迎来突破,速度提升高达220倍
|
|
8
|
0
|
2025 年6 月 15 日
|
ICML2025:图像标记连续性对ViT跨领域少样本学习的影响研究
|
|
6
|
0
|
2025 年6 月 15 日
|
模型链:一种新型语言模型扩展范式,兼具Transformer性能与更优异的扩展性
|
|
4
|
0
|
2025 年6 月 15 日
|
AdaCM2:面向超长视频理解的跨模态自适应记忆压缩框架
|
|
7
|
0
|
2025 年6 月 15 日
|
扩散语言模型并非总是更优:北大&蚂蚁最新研究揭示效率权衡
|
|
6
|
0
|
2025 年6 月 15 日
|
ViSA-Flow:仅用10%数据,机器人技能学习超越100%数据表现
|
|
4
|
0
|
2025 年6 月 14 日
|
奖励用错也能提分?研究揭示语言模型强化学习的关键:思维模式而非新知识
|
|
8
|
0
|
2025 年6 月 14 日
|
Meta发布V-JEPA 2世界模型:LeCun亲自介绍,提升AI环境理解与预测能力
|
|
5
|
0
|
2025 年6 月 14 日
|
银河通用&清华发布OpenWBT:开源人形机器人全身遥操系统,快速部署,灵活操作
|
|
3
|
0
|
2025 年6 月 14 日
|
逆强化学习:部分可识别性与模型设定错误的数学分析
|
|
1
|
0
|
2025 年6 月 14 日
|
基于相似性的类比比例:一种新视角
|
|
6
|
0
|
2025 年6 月 14 日
|
SGLang:高性能开源推理引擎的技术解析与应用实践
|
|
1
|
0
|
2025 年6 月 14 日
|
时序大模型瘦身新思路:上海交大、阿里提出剪枝后再微调的后训练范式
|
|
2
|
0
|
2025 年6 月 14 日
|
苹果论文质疑:大模型推理能力是假象?DeepSeek-R1、Claude Thinking或仅擅长记忆模式
|
|
8
|
0
|
2025 年6 月 14 日
|
LADA:面向持续学习的高效标签特定型CLIP适配器
|
|
9
|
0
|
2025 年6 月 14 日
|
高考数学大模型摸底考:谁是学霸,谁又惨遭滑铁卢?
|
|
12
|
0
|
2025 年6 月 14 日
|
CVPR 2025:多模态统一学习新范式,开源数据、模型与代码
|
|
3
|
1
|
2025 年6 月 14 日
|
Claude “打假” 苹果论文《思考的错觉》:模型并非不能推理,而是评估方式有问题
|
|
1
|
0
|
2025 年6 月 14 日
|
多模态RAG实战:Python代码实现AI对图片、表格和文本的综合理解
|
|
6
|
2
|
2025 年6 月 14 日
|
Diffusion LLM:挑战 Next Token Prediction 的新范式?
|
|
9
|
1
|
2025 年6 月 14 日
|
LLaDA 1.5:利用方差缩减偏好优化提升扩散语言模型能力
|
|
9
|
4
|
2025 年6 月 14 日
|
OpenAI发布o3-pro,推理能力大幅提升,奥特曼称其为“温和的奇点”
|
|
7
|
0
|
2025 年6 月 14 日
|
全球云服务大面积宕机:谷歌云、AWS、Azure及相关AI服务受影响
|
|
3
|
0
|
2025 年6 月 14 日
|
硅基流动完成数亿元融资,打造开发者友好的生成式 AI 开发平台
|
|
2
|
0
|
2025 年6 月 14 日
|
DeepMath-103K:突破大模型数学推理瓶颈的硬核数据集
|
|
5
|
1
|
2025 年6 月 14 日
|
FUDOKI:首个纯Discrete Flow Matching多模态巨兽,兼顾灵活与通用
|
|
7
|
0
|
2025 年6 月 14 日
|
YC 创业公司 AI Agent 开发新趋势:TypeScript 占比超 Python
|
|
6
|
1
|
2025 年6 月 14 日
|