关于“AI资讯”类别
|
|
0
|
53
|
2024 年3 月 22 日
|
CVPR 2025:多模态统一学习新范式,开源数据、模型与代码
|
|
3
|
1
|
2025 年6 月 14 日
|
LADA:面向持续学习的高效标签特定型CLIP适配器
|
|
8
|
0
|
2025 年6 月 14 日
|
Claude “打假” 苹果论文《思考的错觉》:模型并非不能推理,而是评估方式有问题
|
|
1
|
0
|
2025 年6 月 14 日
|
AdaCM2:面向超长视频理解的跨模态自适应记忆压缩框架
|
|
6
|
0
|
2025 年6 月 14 日
|
火山引擎发布豆包大模型1.6及多项AI产品,全面拥抱“AI 云原生”
|
|
2
|
0
|
2025 年6 月 14 日
|
多模态RAG实战:Python代码实现AI对图片、表格和文本的综合理解
|
|
6
|
0
|
2025 年6 月 14 日
|
Diffusion LLM:挑战 Next Token Prediction 的新范式?
|
|
9
|
0
|
2025 年6 月 14 日
|
LLaDA 1.5:利用方差缩减偏好优化提升扩散语言模型能力
|
|
9
|
3
|
2025 年6 月 14 日
|
OpenAI发布o3-pro,推理能力大幅提升,奥特曼称其为“温和的奇点”
|
|
7
|
0
|
2025 年6 月 14 日
|
全球云服务大面积宕机:谷歌云、AWS、Azure及相关AI服务受影响
|
|
3
|
0
|
2025 年6 月 14 日
|
微软提出强化预训练(RPT):用强化学习提升大语言模型预训练效果
|
|
3
|
0
|
2025 年6 月 14 日
|
硅基流动完成数亿元融资,打造开发者友好的生成式 AI 开发平台
|
|
2
|
0
|
2025 年6 月 14 日
|
DeepMath-103K:突破大模型数学推理瓶颈的硬核数据集
|
|
5
|
1
|
2025 年6 月 14 日
|
ICML 2025:CCA-Attention突破LLM长文本建模瓶颈,全局池化与局部保留并行
|
|
8
|
1
|
2025 年6 月 14 日
|
FUDOKI:首个纯Discrete Flow Matching多模态巨兽,兼顾灵活与通用
|
|
7
|
0
|
2025 年6 月 14 日
|
YC 创业公司 AI Agent 开发新趋势:TypeScript 占比超 Python
|
|
6
|
0
|
2025 年6 月 14 日
|
MemoryOS:首个大模型记忆操作系统开源框架,告别AI“失忆”
|
|
7
|
0
|
2025 年6 月 14 日
|
3D场景生成技术综述:四大范式解析与未来发展趋势
|
|
3
|
0
|
2025 年6 月 14 日
|
Ultra-FineWeb:高效数据筛选与验证,助力高质量LLM训练
|
|
5
|
0
|
2025 年6 月 14 日
|
基于相似性的类比比例:一种新视角
|
|
5
|
0
|
2025 年6 月 14 日
|
银河通用&清华发布OpenWBT:开源人形机器人全身遥操系统,快速部署,灵活操作
|
|
2
|
0
|
2025 年6 月 14 日
|
Meta发布V-JEPA 2世界模型:LeCun亲自介绍,提升AI环境理解与预测能力
|
|
4
|
0
|
2025 年6 月 14 日
|
OpenAI发布o3-pro模型:更可靠但暂不能聊天
|
|
6
|
1
|
2025 年6 月 14 日
|
强化学习大佬质疑:大模型是“洞穴”中的大脑扫描仪?
|
|
3
|
0
|
2025 年6 月 14 日
|
CUDA重大更新:原生Python支持高性能GPU编程
|
|
9
|
1
|
2025 年6 月 14 日
|
ABKD:基于广义α-β散度的知识蒸馏框架,实现概率质量的帕累托最优
|
|
5
|
0
|
2025 年6 月 14 日
|
时序大模型瘦身新思路:上海交大、阿里提出剪枝后再微调的后训练范式
|
|
1
|
0
|
2025 年6 月 14 日
|
AI推理成本暴跌背后:「互联网女皇」Mary Meeker 报告解读与趋势洞察
|
|
9
|
0
|
2025 年6 月 14 日
|
字节跳动AI新战略:豆包大模型“上下文定价”,Trae覆盖80%内部工程师
|
|
5
|
0
|
2025 年6 月 14 日
|