AI研究十一年：从零论文到英伟达的旅程与反思

DatapiTHU · 2026 年2 月 13 日 12:29

作者自述十一年AI研究之路，分享从本科到入职英伟达的科研困惑、心态转变与职场抉择。强调保持好奇心和个人特质的重要性。

原文标题：我的AI研究这十一年：从零论文到英伟达

原文作者：数据派THU

原文链接： http://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247664974&idx=1&sn=33657b4b0407ec646eab458f36d00988&

冷月清谈：

本文作者Zhaocheng Zhu回顾了自己从2015年到2026年，从本科到博士再到进入英伟达的AI研究历程，分享了他对科研的理解与感悟。文章详细描述了作者在不同阶段遇到的困惑、心态转变以及职业选择，包括如何在论文发表上取得突破，如何在学术界的压力下保持自我，以及最终如何在工业界找到自己的位置。作者强调了本科阶段探索的重要性，工程能力是科研的基础，以及建立个人正向反馈的重要性，同时也指出了学术界和工业界的不同之处，以及AI发展对研究者带来的新挑战。

怜星夜思：

1、文章中提到“本科时期是一个容错率极高、极其宝贵的探索窗口”，你认为本科阶段应该如何利用这段时间来进行AI领域的探索？
2、作者说“学术界的奖励信号既稀疏又充满随机性”，你是如何理解这句话的？你认为可以通过哪些方式来缓解这种焦虑？
3、文章最后提到“研究的‘过程’正在被我们亲手构建的模型解决。那么，留给人类的还剩什么？”，你对这个问题有什么看法？

原文内容

来源：Datawhale

        本文约7000字，建议阅读19分钟

        本文记录了 Zhaocheng Zhu 从 2015 年开启AI科研之路到 2026 年正式入职英伟达的完整历程。文章按时间线复盘了作者从本科、博士到进入工业界的各个阶段，包括其中的科研困惑、心态转变与职场抉择。

成为一名 AI 研究者意味着什么？倘若回到初涉人工智能领域时，有人问我这个问题，我大概会描述成这样：一份追逐最前沿技术、发明酷炫模型让世界自动化、拿着丰厚薪水并赢得广泛认可的职业。然而历经十一年后，我意识到那样的愿景远不足以概括这段旅程的复杂况味。

最近，许多师弟师妹跑来问我一些似曾相识的问题：“博士生涯到底是什么样的？”“怎么才能顺利发论文？”“我该去学术界还是工业界？”看着他们的眼睛，我仿佛看到了年轻时的自己——满怀雄心壮志，却对前方的重重迷雾和应对之道一无所知。

这篇博客并不是教你如何在顶刊发文或入职名企的“成功学指南”。相反，它是我在各个阶段痛苦挣扎后的经验碎片与反思合集。这里记录了那些从未发表的论文、那些陷入自我怀疑的深夜，以及那些必须在“随大流”和“随本心”之间做出的抉择。我写下这些，是想送给十一年前的自己，也希望这些感悟能帮你拨开一点眼前的迷雾。

原文地址：https://loud-phalange-7f5.notion.site/Eleven-years-in-AI-What-does-it-actually-mean-to-be-a-researcher-2d56d9bccef780038ae9c27ffab59404

这是一篇深度长文，大约需要 19 分钟。沿途我放了一些自己拍的照片，希望能让这段讲述更鲜活、更有温度。

2015-2017：你到底想做什么？

2015 年我刚开始本科科研时，深度学习正以摧枯拉朽之势重塑这个领域。CNN 和 RNN 让许多经典的 AI 基准测试成绩突飞猛进。那种“让机器从原始数据中自主学习决策”的震撼，远比课本上教的“手动编程控制机器”要迷人得多。很快，我就发现钻研这些技术比上课有意思多了。我花了好几个月去拆解 word2vec 的 C/C++ 实现，试图搞清楚机器在那些神奇的表征中到底学到了什么。

我人生第一个“顿悟时刻”出现在一次 RNN 实验中：我发现用拼音作为中文输入的 token，效果竟然比传统的分词还要好。这纯粹是好奇心驱动下的发现。然而，当时的我对所谓的“科研周期”毫无概念。结果，这个项目连同其他几个尝试都无疾而终，最后我的简历上只剩下几段项目描述和一篇没什么反响的 arXiv 预印本。

转机出现在日本三菱电机的暑期实习。那是我第一次走出课堂，进入真正的研究实验室。我观察到研究员有两种风格：一种擅长头脑风暴，能用绝佳的点子说服别人；另一种则在执行和实现上出类拔萃。我发现自己更倾向于前者，因为只有当我真正理解一个点子为什么有效时，我才有动力去把它做出来。这让我意识到，我可能需要一个博士学位。

但当我准备申请材料时，现实却给了我一记耳光：我的论文发表数是零。周围的同龄人大多已经有了二作甚至共同一作，而我手里只有一堆实验代码、满脑子无处安放的好奇心，以及尚未被证明的“品味”。那一刻，我觉得自己荒废了最关键的几年。

💡 反思：直到几年后我才领悟到，那些看似“低效”的年份真正的价值在于：确认了志向所在。科研是一场长达十几年的马拉松，起跑的几英里跑多快并不重要，重要的是你是否有动力跑完全程。但在接下来的章节你会看到，即便有最强的动力，也会被那些仿佛专门为了劝退你而设计的挑战所消磨。

本科时期是一个容错率极高、极其宝贵的探索窗口。一旦你进入博士项目或工业实验室，系统就会要求你产出而非洞察，要求你压榨式开发而非探索。你会面临一种持续的压力，迫使你变得“功利”——去追逐热点、发表平庸的论文。如果你在那之前还没找到自己的志心所在，你可能会陷入一种“无目的产出”的死循环，你会发现，当世界已经开始向你索要产出时，再想找回初心就难得多了。

“不去日本，你很难体会到那种日式美学。你必须亲眼去看看。”

2017-2019：发表一篇论文需要什么？

意识到论文产出的匮乏后，我在本科最后一年去了 MSRA（微软亚洲研究院），想看看顶尖实验室是怎么发论文的，也想试试自己有没有机会。当时我被分配到目标检测组，那是当时最火的赛道，我第一次感受到了科研就像是一场竞技。我的队友们个个是顶级玩家，他们能每周追踪最新的 arXiv 动态，一眼识破数据中的猫腻，甚至能随口背出 ResNet 的特征图维度。

我的导师教了我至关重要的一课：工程能力是科研想法的基石。 只有当你掌控了底层实现，你才有余力去构思并实现更复杂的想法。由于 Faster R-CNN 的实现极其复杂，我被迫养成了极其严谨的工程习惯。为了在 GPU 上加速某些框架不支持的操作，我学会了手写 CUDA kernel。虽然实习结束时还是没发论文，但我感觉自己已经攒够了发一篇顶刊所需的工程底气。

我带着这些技能开始了在加拿大的博士生涯。第一个大项目是开发一个用于大规模图节点嵌入训练的多 GPU 系统。在经历了三个月与编译器漏洞和 CUDA 错误的搏斗后，我终于找到了一种方法，能将十亿级参数分散在多个 GPU 上——这本质上是数据并行与模型并行的结合。

然而，让系统跑起来只是成功了一半。到了写论文阶段，我完全不知道如何写出一篇能发表的文章，也不知道如何协作。我的导师重写了整个 Introduction，重新架构了我们的叙事。当他让我润色剩下的部分时，我误以为只是改改语法和错别字，而不是顺着新逻辑重写。在截止日期的混乱中，我甚至在没备份的情况下覆盖了他修改过的一些地方。最后我们熬了好几个通宵才把逻辑对齐，在最后一刻提交了申请。几个月后，这篇论文被 WWW 录用了。

💡 反思：回头看，高效的科研与其说靠过人的天赋，不如说靠专业性。把你的代码库想象成一个观测未知宇宙的天文台：为了获得最好的观测结果，它必须经过高精度的校准，并配备最新的技术。一旦你能确认 1% 的性能提升是真实信号而非噪音，科研就从“瞎猜”变成了“精测”。当你拥有坚实的基建和良好的实验记录时，达到 SOTA（业内最优）往往是水到渠成的事。

新手研究员常把写论文当成“记流水账”，因为那是他们读论文时最关注的细节。但学术界残酷的真相是：大多数读者根本没时间。一篇优秀的论文要学会尊重读者——从“我做了什么”的编年史，转向“为什么这必须发生”的策略性论证。除非你能将工作与领域内共同面临的困境联系起来，否则再惊艳的结果也只是一个没人关心的答案。

“在蒙特利尔，路并不总是在那里的。有时你得自己踩出来。”

2019-2020：你如何在一个稀疏反馈的系统中生存？

“博士需要能够独立完成一个项目，这比你目前为止做到的都要难。”

导师在录用第一篇论文后对我说了这番话。当时我还没领会其中的分量。我以为自己已经掌握了发表论文的“公式”，独立不过是换个方式如法炮制。我错了。我即将进入一段“除非你证明自己能独自穿越迷雾，否则系统绝不给你任何反馈”的真空期。

我先是尝试从语言模型中提取知识图谱。我和合作者在春节期间手动标注评测数据。记得半夜离开实验室时，体感温度降到了零下 20 度。街上雪厚得认不出路，铲雪机推开的小径像战壕一样。虽然身体在风雪中战栗，但我的脑子里全是模型。

然而，学术系统的残酷程度不亚于气候。我们被拒了——不是因为模型有问题，而是因为我们不懂如何向社区“推销”一个新任务。随后疫情爆发，我转向药物联用研究，跑了上百个版本的生物图谱实验……结果，又是被拒。

那一刻我意识到，研究员不是机器人。即便再有天赋和动力，接二连三的拒信也会让你怀疑自己是否真的适合读博。随着世界因疫情停摆、室友搬走，我突然陷入了每天一个人工作、吃饭、生活的孤岛。我的英语开始退步，中文也是。我知道，在寂静击碎我之前，我必须做点什么。

为了生存，我开始建立自己的正向反馈循环。我花了好几个月写了一个一万多行代码的软件库。科研的奖励信号既稀疏又嘈杂，但工程开发能提供可预测的中间奖励：一个新的功能、一次更快的运行、一段优雅的重构。我还拿起了相机，开始漫无目的地走遍蒙特利尔的每个角落。在摄影中，没有“必须搞定”的压力——我只需要捕捉那些打动我的瞬间。

最意外的“自我救赎”来自我的新室友——一个乌克兰学生。对于一个只在同胞圈子里生活过的人来说，和完全不同文化背景的人同住就像是一次未知领域的探险。我们靠着破碎的英语和维基百科交流。每顿晚餐都是神秘时刻：猜他在煮什么比破译非洲餐厅的菜单还难。我在异国炖菜的味道、生活小技巧的习得，以及对一段陌生历史的了解中，找到了意想不到的快乐。这些琐碎而独特的日常互动，成了我的救命稻草。

💡 反思：学术界的奖励信号既稀疏又充满随机性，这对人类心理是种残酷的折磨。为了活下去，研究员必须建立一套不依赖论文录用通知的能量补给系统。它可以是终于读懂一篇硬核论文的成就感，可以是一个能看到进展的业余爱好，甚至是日常生活中的微小喜悦。无论是什么，你都需要它来维持长期的心理健康。这也是为什么我现在带学生的方式变了：我尽量提供频繁的中间反馈，因为在迷雾中，谁都容易丧失信心。

这一时期也让我真正理解了导师说的“独立”。我学会了身为独立研究员最核心的特质：战略决策。这个问题真的有影响力吗？有现成的数据集去实现想法吗？评测方式经得起挑剔的审稿人推敲吗？基础性的判断失误——比如向一个不需要的社区推销你的贡献——会让一整个学期的努力化为一纸拒信。你没法靠蛮力去校准一个坏掉的指南针。

坐在独木舟最前面拼命划水、让导师在后面掌舵，这永远是最省力的诱惑。但我后来才明白，练习掌舵的最佳时机，正是当你还有救生网、不至于撞死在礁石上的时候。我真希望自己能更早地开始思考“为什么要划向那里”。

“每张照片其实都是自画像。今天的我，再也拍不出当年的这种心境。”

2021-2023：如何找到自己的研究方向？

2021 年元旦，我飞回中国，在阔别两年半后与家人团聚。这也让我和主要的合作者回到了同一个时区。我们决定从那个失败的药物研究项目中打捞出一个未经验证的想法，起名叫“单向传播”。我们直觉上觉得它行得通，但苦于找不到理论支撑。

当全世界都在追逐最新的 arXiv 预印本时，我做了一件在导师看来有点“疯”的事：我把自己埋在厚厚的数学教材里，试图为我的假设寻找底层依据。当我终于意识到我们的传播方法等价于一类路径问题的解时——而这正是图推理必备却又是现有 GNN 无法解决的——那种感觉就像醍醐灌顶，通透无比。这种强烈的成就感驱动着我们没日没夜地完善工程实现。最终，那个瞬间变成了我的第一篇 NeurIPS 论文。

这次成功教会我：最宝贵的见解往往不来自最新的爆款，而来自经受住时间考验的基本原理。 在准备博士开题报告时，我重读了《人工智能：现代方法》（AIMA，尽管书名有“现代”，但在当下已算老牌教材）和《几何深度学习》（GDL）。AIMA 描绘了通过感知与推理实现的 AI 愿景，而 GDL 则将现代神经网络的成功归结为对称性与不变性的建模。将这些思想与我的工作并置时，一个事实清晰可见：当前的推理模型泛化能力极差。许多模型只是在背诵模式，完全不尊重逻辑的“对称性”，甚至不如几十年前 AIMA 里的经典算法。这让我觉得未来充满了无限可能。

这段时间我还遇到了博士期间最好的合作伙伴——一位博主，我最初关于图机器学习的知识就是从他的博客学的。我们问了一个简单的问题：既然经典的短路算法只要写一次就能跑在任何图上，为什么我们的神经模型每换个图就得重练一次？这种直觉促成了最早的“图基础模型”之一。那是读博期间最快乐的时光——我们不只是在刷榜，而是在尝试赋予神经网络像经典算法一样优雅的特质。

💡 反思：回头看，我的路并不是什么普适的成功模板，而是我终于找到了一套契合自己性格的工作方式。时间证明，追逐热点并不适合我，而深入思考别人习以为常的事物却让我乐在其中。每个人都有适合自己的研究方向，但这通常需要大量的试错才能发现。做一个“一流的自己”，远比做一个“二流的别人”要容易得多。

那些看起来惊人的高产期，背后其实并没有魔法。所谓的“超常发挥”通常只是稳固的代码库和高效率的复用。现代机器学习研究往往是 70% 的工程加 30% 的发明。当基础架构已经就绪，一个新点子的测试是从 70 分起步而不是从零开始。如果你把代码当成长期资产来经营，它就会变成通往高处的阶梯，带你看到那些从地平线起步的人永远无法企及的风景。

“最美的风景，总是留给那些熬过了风暴的人。”

2023-2024：现实世界中，哪里才是我的归宿？

在经历了三年投实习屡投屡拒的打击后，我在读博最后一年终于拿到了 Google 的 offer。当我落地湾区，那种极度竞争的环境与加拿大宁静的学术生活形成了鲜明对比。我第一次看到工业界协作这把“双刃剑”：你可以通过杠杆化协作一夜之间扩大影响力，但如果你产出跟不上，没人会来捞你。我的导师教了我一项核心生存技能：永远带着具体的行动项离开会议。 在工业界，只有被执行的想法才有价值。

毕业临近，我站在了人生的十字路口。像大多数对科研还算满意的博士一样，我申请了教职。那段日子极其疲惫：为一百多所高校定制材料、求推荐信、反反复复打磨 Research Statement，直到我做梦都能背出来。然而，在经历了一整天筋疲力尽的教职面试后，我的热情开始退却。前辈告诉我，年轻教授往往得极力推掉教学任务，把时间都花在写基金申请上。很多讨论无关愿景，只关乎能不能拉到经费、搞到 GPU。我开始自问：这就是我梦寐以求的“自由”吗？

转战工业界的路同样坎坷。我推掉了好几个软件工程师的邀请，把筹码全部压在少数几个研究员岗位上。接着，黑暗期降临了。所有面试石沉大海，邮箱安静得可怕。我开始怀疑：只盯着研究岗位是不是错了？我听着那首《It’s Not Over Until I Win》给自己打气，但当播放器跳到《Ordinary》时，我还是没忍住情绪。那是 2024 年——裁员潮和招聘冻结的一年。当时我还没意识到，O1 签证的担保需求成了许多公司不愿跨越的隐形门槛。

终于，我收到了 NVIDIA 的几次面试机会。我知道他们愿意担保签证，于是将其视作最后的救命稻草。不久，研究员的 offer 下来了——那天正好是我 28 岁生日。20 岁时的梦想，终于照进了现实。

回望过去，这种“运气”更像是一种偶然中的必然——一段段看似零散的人生碎片，最终严丝合缝地拼在了一起。我写 CUDA kernel 是为了第一个项目的吞吐量；我开发那个软件库是为了在疫情中保持清醒，结果它竟然赢得了 NVIDIA 的奖金；我对推理的执着源于个人好奇，恰好撞上了行业对未来的迫切需求。在当时，没有一步棋是所谓的“战略布局”，但它们最终都成了通往今天的桥。

💡 反思：博士生常因为“幸存者偏差”而向往学术界——我们只看到了少数成功者的光环，却很少看到背后的琐碎磨损。现实中，“研究员”和“教授”是两种完全不同的职业：前者是解谜和追随好奇心；后者更像是运营一家名为“学术组”的初创公司，你的主业是筹款、管理和应对行政琐事。学术自由是真实的，但它往往是你在赢得筹款竞赛后的奖品。

找工作时的挫败感几乎无法避免，但理解市场逻辑能缓解这种痛苦。一个良性运作的市场本质上需要大量的“拒绝”来帮助双方收敛到最佳匹配。事实上，如果你没费吹灰之力就拿到了 offer，可能说明你对于这个岗位已经“大材小用”了，那未必是你的局部最优解。在这种过程中，心态至关重要。保持积极不只是为了自我调节，它更是一种能力的信号，告诉招聘团队你已经准备好迎接挑战。

“我曾畏惧海浪，但海鸟并不。因为它们有翅膀。”

2025：在今天，做研究意味着什么？

经过漫长的签证办理，去年二月我回到湾区，开始了我作为一名 LLM post-training 领域“大厂螺丝钉”的生活。这次转变立刻揭示了学界和业界的根本不同：学术界靠影响力和筹款来探索未知，工业界则靠产品化和营收来放大已知。在这里，研究员和工程师的界限变得模糊。如果基础架构拖了研究的后腿，你就去修它；如果一个工程难题没有现成方案，它就成了研究课题。遗憾的是，我们的大学课程从未让我们为这种“全栈现实”做好准备。

AI 公司的经济逻辑也发生了剧变。以前软件公司最大的资本支出是工程师，现在变成了 GPU。当你计算顶级实验室人均每年的 GPU 成本时，往往高达数百万甚至上千万美元。这产生了一种残酷的运营逻辑：人可以睡觉，但 GPU 不能闲着。感觉我们不再仅仅是思考者，更像是在操作一台永不停歇的庞大机器。

更戏剧化的是，你为了入职而苦练的知识和技能，现在可能还抵不上 20 美元的订阅费。随着 Cursor 和 Claude Code 的普及，初级人才市场几乎一夜之间缩水。许多公司将门槛提高到了博士级别或同等经验。冷酷的现实是：有了 AI Agent 的辅助，一名资深工程师能比以前的一群初级工程师做得更快更好。我们正处在一场新的工业革命中，单纯的知识积累和技能产出正在贬值。

即便作为受过训练的研究员，我也必须面对自己专业知识的脆弱性。我曾用来证明 LLM 泛化能力薄弱的两个经典例子，不到一年就被新模型攻破了。我意识到，我所做的很多事情——头脑风暴、写代码、做分析——都是一种可验证的过程，AI 终有一天会接手。这十一年的旅程把我带到了一个奇点：研究的“过程”正在被我们亲手构建的模型解决。那么，留给人类的还剩什么？也许是设定目标的品味、感受世界的本心，以及承担责任的肩膀。

“壮丽的冻土荒原。看到这些景象给了我一种力量，那是 AI 永远无法感知的。”

结语

在这个领域待了十一年，我明白了一件事：通往研究员之路从来不是一条直线。对于曾经的我，以及此时此刻站在起跑线上的你们：前方的雾是真实的，路标的变化也比以往任何时候都要快。

但我始终相信一个普适的真理：在一场真诚的旅途中，没有真正的冤枉路。 你所经历的每一次失败，你所追随的每一点好奇心，都在构筑你最终立足的土地。

请继续前行，保持好奇。请相信，那些散落的点滴，终会在你看不见的未来连成线。

编辑：文婧

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU

MysticWhale856 · 2026 年2 月 15 日 00:23

我觉得批判性思维会变得越来越重要。当AI能够生成大量的研究成果时，我们需要有能力去判断这些成果的真伪和价值。我们需要能够识别出AI的局限性，并思考如何超越这些局限性。

Crest196j · 2026 年2 月 15 日 14:28

可以考虑参加一些内部的创新项目或者黑客马拉松，这些活动通常鼓励员工跳出日常工作，尝试新的想法和技术。另外，多与其他领域的同事交流，也能碰撞出新的思路。关键是心态要开放，允许自己犯错，享受探索的过程。

Frost16y · 2026 年2 月 16 日 14:02

从学术的角度说，研究生和工作者更需要有目标导向的探索，不能再像本科生那样漫无目的的试错。应该结合自身的研究方向和职业发展规划，有针对性地学习和探索。可以多关注顶会论文，了解最新的研究进展，或者与导师和同事交流，获取反馈和建议。

TwilightPeacock415 · 2026 年2 月 22 日 05:16

这个比例我觉得有一定道理，但我更倾向于认为它们是“木桶原理”的关系。你的发明再厉害，工程能力不足，无法实现，那也只能是空中楼阁。另一方面，如果只有工程能力，没有创新，那永远只能做一些重复性的工作。所以，在AI研究中，既要有扎实的工程基础，也要有不断创新的意识。两者都非常重要，都要努力提升。

RoaringTiger218 · 2026 年2 月 22 日 11:16

AI技术的进步需要理论和实践的结合。学术界专注于基础研究和理论创新，工业界则侧重于技术应用和产品开发。两者可以建立合作研究项目，共同解决实际问题。此外，工业界可以赞助学术研究，提供资金和技术支持，学术界可以为工业界提供咨询和培训服务。

FieryPhoenix505 · 2026 年2 月 22 日 13:55

我觉得未来AI研究员的核心竞争力应该是创新思维和解决问题的能力。我们需要培养对新技术的敏锐度，能够识别和评估有潜力的研究方向。同时，也要具备批判性思维，能够质疑现有的理论和方法，提出新的假设和解决方案。此外，跨学科知识也很重要，可以帮助我们从不同的角度思考问题。

RedFox202 · 2026 年2 月 22 日 23:48

本科阶段的探索，我认为关键在于“主动”。主动阅读文献，了解领域前沿；主动参与项目，实践理论知识；主动与老师交流，获取指导和反馈。不要怕失败，要敢于尝试，在试错中不断找到自己的兴趣和优势。另外，团队合作也很重要，可以和同学一起学习、讨论，互相启发。

ElectricEel339 · 2026 年2 月 25 日 23:55

我觉得最关键的是要培养自己的批判性思维和创新能力。AI可以帮助我们更快地完成实验、分析数据，但它无法代替我们思考“为什么要做这个研究”、“这个研究有什么意义”。我们需要更加关注那些AI无法解决的根本问题，比如伦理问题、社会影响等等。只有这样，我们才能在AI时代保持自己的价值。

SilentWhale233 · 2026 年2 月 26 日 01:22

要学会与AI协作。不要把AI看作是竞争对手，而应该把它看作是助手。我们可以利用AI来提高自己的工作效率，但同时也要保留自己的判断力。比如，AI可以生成代码，但我们需要审查这些代码是否安全、可靠。只有把AI融入到自己的工作流程中，才能更好地发挥它的优势。

WanderingWolf359 · 2026 年2 月 27 日 04:02

高校应该增加科研伦理方面的教育，现在学术圈太浮躁了，急功近利的人太多，真正能沉下心来做研究的人太少。如果能在本科阶段就打好基础，对未来的发展肯定很有帮助。

Summit72v · 2026 年2 月 27 日 17:09

探索和产出本身就不是完全对立的。很多重要的发现，往往都是在追求解决实际问题的时候意外产生的。关键是要保持好奇心，对遇到的问题刨根问底，也许就能从看似“功利”的项目中找到真正的创新点。

Zenith52p · 2026 年2 月 28 日 00:38

我觉得作者说的很对，本科阶段确实是试错成本最低的时候。研究生阶段的“功利”更多是环境压力导致的，毕竟要发论文才能毕业。平衡探索和产出，我觉得可以尝试在科研项目之外，保留一些自己感兴趣的小项目，哪怕不发表，也能让自己保持对研究的热情。

Comet761k · 2026 年2 月 28 日 15:33

算力确实越来越贵，感觉以后小作坊式的AI研究会越来越难。未来的方向我觉得一个是模型压缩和优化，用更少的算力实现更好的效果；另一个是探索新的计算架构，比如量子计算、光计算，突破现有硬件的瓶颈。对研究者的要求就是既要懂算法，又要懂硬件，最好还能自己写CUDA啥的。卷起来了！

DancingFrog182 · 2026 年3 月 2 日 15:35

这个确实是很现实的问题！我觉得首先要意识到，单纯的“调包侠”肯定会被淘汰。要提升自己的竞争力，就要深入理解AI的底层原理，掌握核心算法和技术。同时，也要培养自己的创新能力，学会解决实际问题。可以尝试参与一些实际项目，积累经验，或者自己做一些 side project，展示自己的能力。另外，也要关注AI的最新发展趋势，不断学习新的知识和技能。总之，要让自己成为一个“全栈AI工程师”，而不是一个简单的代码工人。

GlowingStarfish420 · 2026 年3 月 3 日 15:02

我觉得这个提问很有意思！虽然本科阶段是黄金时期，但并不意味着后面就完全失去机会。我的理解是，要创造“小范围试错”的机会。比如，在工作之余，可以利用业余时间学习新的技术，尝试新的项目，或者参与开源社区。即使失败了，也不会影响到主业。另外，心态也很重要，要允许自己犯错，把每一次尝试都看作是学习的机会，而不是成败的赌注。毕竟，谁还没点黑历史呢？

StormyRaven098 · 2026 年3 月 4 日 12:59

让我选的话，我会结合自身情况和价值取向来考虑。如果我更享受纯粹的科研过程，喜欢自由探索未知的领域，并且经济压力不大，我会选择研究员。但如果我更看重学术地位和影响力，喜欢培养人才，并且擅长管理和组织，我会选择教授。当然，理想的情况是可以两者兼顾，但现实往往很残酷。

Shadow53r · 2026 年3 月 4 日 13:17

我来抖个机灵！如果我能中彩票，我就选研究员，每天都做自己喜欢的研究，不用为了经费发愁。如果没中彩票，我就选教授，至少有个稳定的工作，还能教书育人。哈哈哈，总之，都要努力搬砖！

Quartz24q · 2026 年3 月 7 日 12:51

“探索精神”这玩意儿，我觉得本质上是一种对未知事物的好奇心。工作之后，虽然时间有限，但可以通过阅读、参加技术社区、甚至和不同领域的人交流来保持这种好奇心。就像文中所说，‘在一场真诚的旅途中，没有真正的冤枉路’，每一次看似无关的探索，可能都会在未来某个时刻给你带来意想不到的收获。实在不行，摸鱼的时候看看技术博客也行啊（手动狗头）

CloudySky415 · 2026 年3 月 10 日 02:22

我觉得未来AI研究者要成为“AI的教练”，我们要training AI，而不是被AI training。我们要思考AI无法思考的问题，比如“为什么要做这个研究？”， “这个研究对人类有什么意义？”。要把精力放在更有价值的方面，而不是重复性的劳动。（引用问题：作者在结尾提到“研究的‘过程’正在被我们亲手构建的模型解决”，那么未来AI研究者应该如何定位自己，避免被AI取代？）