揭秘大模型智能:Transformer架构、涌现智能与DeepSeek的逆袭之路
|
|
9
|
3
|
2025 年3 月 19 日
|
零跑B10:12万级标配激光雷达,高阶智驾平民化
|
|
9
|
2
|
2025 年3 月 19 日
|
MOIRAI-MOE:混合专家系统在时间序列预测中的应用与突破
|
|
9
|
9
|
2025 年3 月 19 日
|
法律大模型并非推理高手:揭示其“张冠李戴”的决策逻辑
|
|
9
|
8
|
2025 年3 月 19 日
|
AppAgentX:让手机智能体自主进化,兼顾智能与效率
|
|
9
|
7
|
2025 年3 月 19 日
|
DeepSeek服务交付联盟:AI交付不再难?
|
|
9
|
0
|
2025 年3 月 19 日
|
揭秘思维链(CoT)训练:如何增强大模型的推理泛化能力
|
|
9
|
55
|
2025 年3 月 19 日
|
牛津博士论文揭示:可扩展持续深度学习需考虑计算成本
|
|
9
|
2
|
2025 年3 月 18 日
|
受限条件下的表示学习:斯坦福博士论文解读
|
|
9
|
0
|
2025 年3 月 18 日
|
AI 性能新试金石:超级马里奥兄弟能否有效评估大模型?
|
|
9
|
0
|
2025 年3 月 18 日
|
Sim2Real 技术:从争议到高效具身智能路径
|
|
9
|
27
|
2025 年3 月 18 日
|
清华大学大数据能力提升项目2025春季学期证书办理通知
|
|
9
|
1
|
2025 年3 月 18 日
|
MIT哈佛等提出COAT「行动思维链」:LLM自回归搜索,推理能力显著提升
|
|
9
|
4
|
2025 年3 月 18 日
|
OpenAI发布智能体API:支持网络、文件搜索及计算机使用
|
|
9
|
11
|
2025 年3 月 18 日
|
Open-Sora 2.0:低成本商业级开源视频生成模型
|
|
9
|
3
|
2025 年3 月 18 日
|
Ilya Sutskever 新公司 SSI 曝光:低调运营,专注超级智能
|
|
9
|
0
|
2025 年3 月 18 日
|
何恺明团队新作:去噪哈密顿网络(DHN)实现更高级物理推理
|
|
9
|
17
|
2025 年3 月 18 日
|
世界一致性视频扩散(WVD):显式3D监督实现逼真视频生成
|
|
9
|
2
|
2025 年3 月 18 日
|
清华提出APB框架:长文本推理速度提升10倍,兼顾性能与效率
|
|
5
|
9
|
2025 年3 月 18 日
|
Meta提出ExFM框架:助力万亿参数大模型在工业级广告推荐系统落地
|
|
9
|
7
|
2025 年3 月 18 日
|
STAR:时空注意力与动态频率损失驱动的视频超分辨率增强新框架
|
|
9
|
14
|
2025 年3 月 18 日
|
北大、MIT、阿里提出LongPPL新指标:更精准评估大模型长文本能力
|
|
9
|
10
|
2025 年3 月 17 日
|
字节公开Seedream 2.0文生图技术细节:数据处理到RLHF全流程解析
|
|
9
|
15
|
2025 年3 月 17 日
|
前DeepMind科学家创业Reflection AI,豪掷1.3亿美元逐梦超级智能
|
|
9
|
0
|
2025 年3 月 15 日
|
Data+AI时代Lakehouse架构演进之路:实时分析与智能决策
|
|
9
|
3
|
2025 年3 月 15 日
|
AI 发展新趋势:模型即产品,警惕应用层同质化
|
|
9
|
2
|
2025 年3 月 15 日
|
DeepSeek-R1 模型图解:大规模强化学习与推理能力的炼成
|
|
9
|
10
|
2025 年3 月 15 日
|
ICLR 2025 Spotlight:多模态信息赋能3D小样本分割,无需额外标注成本
|
|
9
|
2
|
2025 年3 月 15 日
|
字节跳动Trae实测:一款懂中文的AI IDE,免费开放
|
|
9
|
18
|
2025 年3 月 14 日
|
微软自研AI大模型MAI,减少对OpenAI依赖
|
|
9
|
0
|
2025 年3 月 14 日
|