DeepWiki:AI驱动的GitHub代码库百科全书,Cognition AI团队出品并开源

DeepWiki,Cognition AI开源的AI驱动GitHub代码库百科全书,自动生成文档、图表,提供AI助手,帮你快速理解项目。

原文标题:Devin开发团队开源DeepWiki,助你快速读懂所有GitHub代码库

原文作者:机器之心

冷月清谈:

Cognition AI团队开源的DeepWiki项目,旨在为GitHub公共代码仓库生成AI驱动的交互式文档。该工具通过分析代码、README和配置文件,自动生成结构化的技术文档、交互式图表,并提供对话式AI助手,帮助开发者快速理解项目结构和逻辑。DeepWiki具有自动生成文档、对话式交互、交互式图表和深度研究模式等核心功能。目前已经索引了3万个仓库,处理了超40亿行代码。尽管存在一些局限性,但DeepWiki的出现无疑为开发者提供了一种全新的代码理解和学习方式。

怜星夜思:

1、DeepWiki声称可以帮助理解任何GitHub代码库,你觉得它在处理大型、复杂的项目时,可能会遇到哪些挑战?
2、DeepWiki 提供了“深度研究”模式,声称可以检测潜在漏洞和建议优化方向。你认为这种AI驱动的代码分析,在多大程度上可以替代人工代码审查?
3、Cognition AI 团队以华人为核心,且拥有 10 块 IOI 金牌。你认为这种背景对 DeepWiki 的发展有什么影响?

原文内容

机器之心报道

机器之心编辑部


最近,独角兽 AI 公司 Cognition AI(Cognition Labs)推出了一个开源项目——DeepWiki,旨在为 GitHub 上的公共代码仓库生成 AI 驱动的交互式文档,堪称「GitHub 仓库的免费百科全书」。



用户可以通过官网直接访问,也可以将 GitHub 链接中的「github.com」替换为「deepwiki.com」。


  • 体验地址:http://deepwiki.com


它通过分析代码、README 和配置文件,自动生成结构化的技术文档、交互式图表,并提供一个对话式 AI 助手,帮助开发者快速理解项目结构和逻辑——无需反复查阅稀少的 README 文件或晦涩的注释信息!



DeepWiki 自发布以来,热度持续走高,吸引了众多用户,并获得了积极的反馈。



DeepWiki 主要有以下核心功能:


  • 自动生成文档:

DeepWiki 可以将任意 GitHub 公共仓库转化为类似维基百科的文档页面,包含项目目标、核心模块、依赖关系图等。通过分析代码逻辑(如 if-else 结构、跨文件引用),生成通俗易懂的说明,适合新手和资深开发者。


  • 对话式交互:

用户可以通过自然语言向 DeepWiki 提问,例如「如何实现用户鉴权?」或「解释 MVC 架构」,AI 会基于代码分析给出精准解答。基于 Devin 技术提供支持,支持中文等语言对话,增强全球开发者的使用体验。


  • 交互式图表:

自动生成可点击的交互式图示,包括类层次结构(class hierarchies)、依赖关系图(dependency graphs)和工作流程图(workflow charts),用户可以放大缩小,自由探索各模块之间的关联。


  • 深度研究(Deep Research)模式:

面向高阶用户,DeepWiki 支持运行高级分析任务,如检测潜在漏洞、建议优化方向,或将当前仓库与其他仓库进行对比分析。体验拥有一位资深工程师随时待命的感觉!


Deep Research 模式。


已索引的仓库可直接访问,如果目标公共仓库尚未被索引,用户可请求 DeepWiki 进行索引。


索引演示。


据团队成员介绍,DeepWiki 已索引 3 万个仓库,处理超 40 亿行代码,约 1000 亿个 Token,投入逾 30 万美元计算成本。但它是完全开源免费的,公共仓库无需登录即可访问(如果你想提交你的私有 GitHub 仓库到 DeepWiki,需要使用 Devin 账号登录)。



据猜测,DeepWiki 可能整合了 Cognition AI 的 Devin AI 技术(2024 年发布的 AI 软件工程师),结合大规模语言模型(LLM)、代码分析和云计算基础设施。


但 DeepWiki 目前存在索引数据未获第三方验证、暂不支持 GitHub Issues/PR 检索、复杂项目文档准确性需验证、私有仓库需注册且功能可能受限等局限,建议结合人工验证使用。


Cognition AI


Cognition AI(也称 Cognition Labs)是一家成立于 2023 年的人工智能公司,专注于开发人工智能驱动的软件工程工具,旨在加速科学发现和提升开发者生产力。其核心使命是「构建能够像人类一样推理和协作的 AI,助力人类解决复杂问题」。


他们在 2024 年 3 月发布了全球首个人工智能软件工程师 Devin,能够自主完成复杂编码任务,引起了不小的关注。



  • 体验链接:https://devin.ai/


团队成员多为顶尖程序员,共获得 10 块 IOI 金牌,凸显其在算法和编程领域的实力,包括前 OpenAI、Google DeepMind 等公司的高级研究员和工程师,具备从模型训练到产品部署的端到端经验。



值得一提的是,团队以华人为核心,首席执行官 Scott Wu、首席技术官 Steven Hao、首席产品官 Walden Yan 均为华人。


参考链接:
https://www.xugj520.cn/en/archives/ai-github-documentation-deepwiki.html
https://apidog.com/blog/deepwiki/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

我觉得这种背景肯定是有积极影响的。IOI 金牌代表他们在算法和编程方面有着很强的实力,这对于开发 DeepWiki 这种复杂的 AI 工具来说非常重要。而且,华人团队可能更了解中国开发者的需求,从而更好地推广 DeepWiki。当然,团队的 diversity 也很重要,希望他们能吸纳更多不同背景的人才。

我觉得现阶段AI还很难完全替代人工代码审查。毕竟代码审查不仅仅是找bug,还得考虑可读性、可维护性、扩展性等等。这些都需要人的经验和判断力。AI 也许能发现一些明显的漏洞,但在理解代码意图和发现潜在风险方面,还是不如人。

我同意楼上的观点!复杂度确实是 DeepWiki 需要面对的一大难关。除了信息过载,还有代码的演进速度。大型项目通常迭代很快,如果 DeepWiki 的索引更新速度跟不上,那生成的文档很快就会过时。这可能会误导开发者,还不如直接看代码呢!

我感觉这更像是一种 marketing 手段。虽然 IOI 金牌很厉害,但并不代表他们一定能做出好的产品。关键还是看 DeepWiki 的实际效果。如果 DeepWiki 真的能帮助开发者提高效率,那它的成功就是必然的。如果只是靠炒作团队背景,那可能不会走太远。

从学术角度来看,DeepWiki 的挑战在于知识表示和推理。它需要将代码转换成一种机器可理解的知识表示,然后进行推理,才能生成文档和回答问题。大型项目的代码往往涉及多种编程范式和设计模式,如何有效地表示这些知识,并进行准确的推理,是一个很大的难题。此外,如何评估 DeepWiki 生成文档的质量,也是一个值得研究的问题。

嗯,我觉得大型项目最大的挑战肯定是信息过载。DeepWiki 要处理的代码量和依赖关系会呈指数级增长,AI 可能会难以提取关键信息,导致文档不够简洁明了。另外,对于一些高度定制化的框架或者内部逻辑,如果缺乏足够的训练数据,DeepWiki 可能会出现理解偏差,甚至生成错误的文档。

从历史发展来看,技术团队的文化背景确实会对产品产生影响。华人团队可能更注重效率和实用性,但也可能缺乏一些创新性。DeepWiki 的发展需要平衡这些因素。另外,团队的国际化也很重要,希望他们能吸引更多来自不同国家和地区的开发者,共同打造这个项目。

从我的角度来说,AI 在代码审查方面还是很有潜力的。它可以快速扫描大量代码,发现一些人容易忽略的漏洞。比如,它可以检测出一些常见的安全漏洞,如 SQL 注入、跨站脚本攻击等等。当然,AI 的分析结果需要人工验证,毕竟 AI 可能会出现误报。但总的来说,AI 可以提高代码审查的效率和质量。

同意楼上的观点!另外,代码审查还涉及到团队协作和知识共享。通过人工代码审查,开发者可以互相学习,提高代码质量。AI 虽然可以提供一些建议,但很难替代这种互动和学习的过程。我觉得“深度研究”模式更像是一个辅助工具,可以帮助人工审查员提高效率。