人工智能助力基因编辑:开源基因编辑器 OpenCRISPR-1 揭开序幕

原文标题:谷歌、OpenAI 都搞起了AI “造人”?创始团队:开源AI基因编辑器只是冰山一角

原文作者:AI前线

冷月清谈:

**摘要**

近期,美国初创公司Profluent宣布推出AI驱动的开源基因组编辑器OpenCRISPR-1。该编辑器由AI算法建模生成,基于CRISPR-Cas技术,可大幅提升基因编辑效率和特异性。

OpenCRISPR-1的技术要点:

  • 由LLM(大型语言模型)开发,从头开始设计分子结构。
  • 扩大了CRISPR相关蛋白质家族的多样性,显著提高基因编辑效率。
  • 与脱氨酶配对时,编辑精准性和活性与SpCas9相当。
  • 生成的sgRNA提高了五种核酸酶的活性。

应用潜力:

  • 加速CRISPR基因疗法开发,为多种疾病提供治疗方案。
  • 构建更灵活、更强大的基因编辑器,突破进化限制,实现更精确的基因编辑。

讨论要点:

  • AI在基因编辑领域的应用前景如何,是否会取代传统方法?
  • OpenCRISPR-1的开源是否会加速基因编辑技术的研究和突破?
  • 该技术对基因疗法的临床应用有哪些影响和挑战?



怜星夜思:


1、AI在基因编辑领域的应用前景如何,是否会取代传统方法?
2、OpenCRISPR-1的开源是否会加速基因编辑技术的研究和突破?
3、该技术对基因疗法的临床应用有哪些影响和挑战?

原文内容

译者 | 王强、华卫
策划 | 华卫

“AI 能编辑 DNA 了,还是开源版!”

OpenCRISPR-1 开源链接:

https://github.com/Profluent-AI/OpenCRISPR

今天,人工智能系统不止可以设计出创作诗歌、代码和视频的模型,还开发出了精确编辑人类 DNA 的开源工具。这不仅是 AI 的巨大进步,还预示着,将来科学家可以比现在更精确、快速地对抗各种疾病。

近日,美国一家名为 Profluent 的初创公司公开介绍了这项技术,并预计于下个月在美国基因和细胞治疗学会年会上发表相关论文。“使用人工智能技术创建基因编辑机制史无前例,”美国加州大学旧金山分校生物工程和治疗科学系教授兼系主任 James Fraser 表示。

据悉,Profluent 是在分析了大量生物数据后,通过对 CRISPR-Cas 序列进行人工智能算法建模来设计出高功能基因组编辑器,并将其命名为 OpenCRISPR-1。通过 OpenCRISPR-1,该公司的人工智能系统从大规模序列和生物学背景中学习,产生了数百万种自然界中不存在的 CRISPR 样蛋白,从而成倍扩大了几乎所有已知的 CRISPR 家族。

并且,OpenCRISPR-1 基因编辑器正在被开源。这意味着,其允许个人、学术实验室和公司免费试用该工具。很多研究人员都会把开发的人工智能底层驱动软件开源出来,让其他人可以在他们的成果基础上继续开发工作,以加速新技术的开发步伐,但像 OpenCRISPR-1 这类生物实验室和制药公司开源技术发明的情况并不常见。不过,Profluent 并没有开源该编辑器本身的技术内容。

Profluent 还透露,OpenCRISPR-1 只是冰山一角,他们的平台能够随意生成更多的基因编辑系统。然而,尽管目前 OpenCRISPR-1 还没有投入临床,但已经招致不少除应用效果以外的担忧。

完全由 LLM 驱动
将蛋白质多样性扩大 4.8 倍

在这项研究中,Profluent 展示了世界上第一个使用人工智能从头开始设计的分子的精确基因编辑。基因编辑器是复杂的系统,需要多结构域蛋白质、DNA 和 RNA 之间复杂的空间和时间相互作用。使用人工智能设计功能差异化的基因编辑器,代表了人工智能驱动生物设计蓬勃发展领域的重大飞跃。

OpenCRISPR-1 的技术是由人工智能驱动、Cas9 样蛋白和指导 RNA 组成,完全使用  Profluent 的大型语言模型(LLM)开发。该模型学习的是氨基酸和核酸序列,这些化合物定义了科学家用来编辑基因的微观生物机制。也就是说,它分析了从自然界中提取的 CRISPR 基因编辑器的行为,并学习该如何生成全新的基因编辑器。

“这些人工智能模型从序列中学习,无论这些序列是字符、单词、计算机代码还是氨基酸序列。”Profluent 首席执行官 Ali Madani 表示。

据介绍,生成蛋白质语言模型通常在跨越广泛功能的大型、多样化的天然蛋白质序列数据集上进行预训练,可以生成反映天然蛋白质特性的真实蛋白质序列。然而,对于特定的应用,如产生新的基因编辑器,就需要将模型引导到特定的目标蛋白质家族。

为此,Profluent 进行了详尽的数据挖掘,以构建迄今为止最广泛的 CRISPR 系统数据集,被称为 CRISPR-Cas 图谱。为生成新的 CRISPR-Cas 蛋白,他们又在 CRISPR-Cas 图谱上训练了一个蛋白质语言模型。

图:生成的序列极大地扩展了 CRISPR 相关蛋白质家族的多样性,以蛋白质簇的数量来衡量,图中显示了每个蛋白质家族在不同类型的 CRISPR-Cas 系统中被发现的频率。

从该模型中生成了 400 万个序列,并使用生物信息学技术来去除简并序列,确定每个生成的蛋白质属于哪个 CRISPR-Cas 家族后,他们发现,这些模型产生的蛋白质将几乎所有天然存在的 CRISPR-Cas 家族的多样性扩大了 4.8 倍,并且之后可以生成更多的序列进一步扩大这种多样性。

鉴于 SpCas9 的广泛采用和临床成功,其使用模型生成了可与 SpCas9 互操作的 Cas9 样蛋白,并选择了其中 48 个生成的序列,用于在人类细胞中进行严格的功能表征。他们发现,当与脱氨酶配对时,OpenCRISPR-1 和 SpCas9  在精确编辑靶基因组中的单个碱基时具有相似的活性和特异性。此外,他们还能够保持碱基编辑活性,同时使用由另一种 Profluent 训练的蛋白质语言模型生成的脱氨酶来提高特异性。

图:对于测试的 5 种生成的核酸酶中的 4 种,使用模型生成的 sgRNA 提高了编辑效率。

最后,为了进一步优化生成的核酸酶活性, Profluent 还训练了一个模型来为任何给定的 Cas9 样蛋白生成相容的 sgRNA。与 SpCas9 的 sgRNA 相比,这些生成的 sgRNA 可以提高所测试的五种蛋白质中四种产生的核酸酶的活性。

CRISPR 基因疗法的“升级版”

“我们与 OpenCRISPR 的意图是与尖端研究机构和药物开发人员合作,以一种强大而实用的方式安全地加速 CRISPR 基因疗法的开发。”Profluent 首席商务官 HilaryEaton 表示。

目前,基于 CRISPR 的技术已经改变了科学家研究和对抗疾病的方式,并提供了能够改变镰状细胞性贫血和失明等遗传疾病患者的治疗方法,但仍需加速发展以治疗数千种其他还无治愈之法的疾病。据介绍,OpenCRISPR-1 正是基于 CRISPR 的生物机制所构建。

源自微生物的基于 CRISPR 的基因编辑器虽然功能强大,但当移植到非天然环境(如人类细胞)中时,通常会显示出显着的功能权衡,人们希望能够生产出比经过数十亿年进化而来的天然基因编辑器更灵活、强大的基因编辑器。人工智能系统的设计恰恰能提供一种强大的替代方案,有可能绕过进化约束生成具有最佳属性的编辑器。

“我梦想着这样一个世界,我们可以在几周内按需提供 CRISPR。”美国加州大学伯克利分校创新基因组学研究所的基因编辑先驱兼科学主任 Fyodor Urnov 说。

事实上,OpenCRISPR-1 是整个业界努力构建可以改善医疗保健的人工智能技术的一个缩影。例如,华盛顿大学的科学家正在利用 ChatGPT 和 Midjourney 等图像生成器背后所采用的人工智能技术方法来组装全新的蛋白质,并致力于加速新疫苗和药物的开发。

“从长远来看,这可以通向一个快速为个人定制药物和治疗方法的时代,定制速度甚至比我们现在的还快。”Urnov 认为,生成式人工智能系统具有巨大的潜力,它们往往会通过从越来越多数据中学习的过程来快速改进自身。如果像 Profluent 这样的技术继续改进,其最终可以让科学家以更精确的方式编辑基因。

而目前看来, Profluent 也具备技术进化的资金支撑。3 月 21 日,Profluent 宣布完成 3500 万美元追加融资,融资总额达到 4400 万美元。这笔融资由 Spark Capital 领投,现有投资者 Insight Partners 和 Air Street Capital 以及来自 OpenAI、Salesforce、Octant Bio 和谷歌(包括谷歌 DeepMind 首席科学家 Jeff Dean)的天使投资人组成的财团也参与了投资。该公司此前还曾从 Insight Partners、Air Street Capital、AIX Ventures 和 Convergent Ventures 募集到 900 万美元种子轮资金。

临床可能引发副作用

虽然这项研究已经表明,人工智能模型可以生成能够编辑人类基因组的工具。但目前 Profluent 还没有对基因编辑器 OpenCRISPR-1 进行临床试验,因此尚不清楚其是否能达到或超过 CRISPR 的性能表现。

不过,可以确定的是,短期内这一技术进展不太可能影响医疗保健领域。Urnov 表示,事实上科学家们并不缺乏可以用来对抗疾病的天然基因编辑器,推动这些编辑器通过临床前研究的成本才是瓶颈所在,如安全性、制造和监管审查,经过这些步骤后才能将其用于治疗患者。

此外,这样的合成基因编辑器案例还引发了其他担忧。长期以来,科学家一直警告不要将 CRISPR 用于人类身体改造和治疗领域,因为这项技术相对较新,可能会产生引发癌症等不良副作用,还能提供一些不道德的用途,如对人类胚胎进行基因改造。

对此,Fraser 的看法是,“一个不道德的人,并不在乎他们使用的基因编辑器是不是人工智能创建的,他们只会继续使用现有工具。”

原文链接:

https://www.nytimes.com/2024/04/22/technology/generative-ai-gene-editing-crispr.html

https://www.biorxiv.org/content/10.1101/2024.04.22.590591v1

https://www.businesswire.com/news/home/20240422399482/en/Profluent-Successfully-Edits-Human-Genome-with-OpenCRISPR-1-the-World%E2%80%99s-First-AI-Created-and-Open-Source-Gene-Editor

https://www.profluent.bio/blog/editing-the-human-genome-with-ai

 内容推荐

探索智能科技的新边疆,《2024 年第 1 季度中国大模型季度监测报告》正式发布!OpenAI Sora 大模型和 NVIDIA Project GR00T 的发布、人形机器人的突破以及编码智能体的到来,正开启 AI 大模型的新纪元。在开源与闭源并行的新趋势中,AIGC 写作和 PPT 制作工具的测评展示了 AI 在内容创作和视觉呈现上的巨大潜力。InfoQ 研究中心邀您一同见证 AI 浪潮如何塑造未来🚀。欢迎大家扫码关注「AI 前线」公众号,回复「季度报告」领取。

 活动推荐

AICon 全球人工智能开发与应用大会暨大模型应用生态展将于 5 月 17 日正式开幕,本次大会主题为「智能未来,探索 AI 无限可能」。如您感兴趣,可点击「阅读原文」查看更多详情。

购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。


今日荐文







图片

你也「在看」吗?👇

开源确实会降低进入门槛,让初学者更容易接触到基因编辑技术。但真正的突破往往需要对该领域有深入了解的研究人员。我相信OpenCRISPR-1的开源将吸引更多的人才加入,但它不会奇迹般地加速重大突破,它只是加速了技术发展的自然进程。

OpenCRISPR-1就像一把锋利的刀,可以用来做手术,也可以用来犯罪。关键在于我们如何使用它。对基因疗法的临床应用进行严格监管非常重要,以确保其安全且符合道德规范。否则,我们可能会面临难以预料的后果。

哈哈,别担心,基因编辑领域还没有’终结者’出现。人工智能只是工具,其运用方式取决于我们。研究人员和伦理学家需要负责任地使用人工智能,同时探索其全部潜力,以造福人类,而不是製造毀滅。

个人认为,OpenCRISPR-1开源与否对研究和突破的速度影响不大。真正瓶颈在于获得高通量、高质量的数据以及跨学科合作。人工智能模型需要大量的数据来进行训练和改进,而收集和整理这些数据可能是一项艰巨的任务。此外,生物学领域的专家的参与对于确保人工智能生成的编辑器与生物背景相关并安全有效非常重要。

人工智能在基因编辑领域拥有巨大潜力,其能力超出了传统方法。它可以快速分析大数据,识别复杂模式,并设计出高效、特异的基因编辑器,这将极大地加速基因编辑的研究和应用。不过,人工智能在基因编辑领域仍处于初期阶段,需要进一步完善和验证才能完全取代传统方法。

人工智能的影响可能因基因编辑工具的不同而异。对于CRISPR-Cas等广泛使用的工具,人工智能可能会通过优化sgRNA设计和预测脱靶效应等方式提升性能。而对于较新的工具,人工智能则可能催生创新的设计和应用,从而彻底改变基因编辑领域。不过,都需要谨慎评估和验证人工智能生成的编辑器的安全性和有效性。

随着人工智能技术的不断发展,取代传统方法是很有可能的,就像工业革命中机器逐步取代手工劳动一样。人工智能在处理复杂数据和优化算法方面的能力将使其在基因编辑领域发挥越来越重要的作用。然而,传统方法仍将在验证和质量控制等方面发挥补充作用。

OpenCRISPR-1开源就像一个巨大的拼图,每个人都可以贡献一块。随着越来越多的研究人员参与进来,拼图将逐渐完成。最终,整个基因编辑领域都会受益于这种协作式的方法,加速实现更先进、更有效的技术。

OpenCRISPR-1对基因疗法的临床应用将产生重大影响,但同时也带来一些挑战。首先,它提高了基因编辑的效率和准确性,这对于治疗遗传疾病至关重要。其次,OpenCRISPR-1是开源的,这将加速研究和开发,从而降低基因疗法成本并使其更易于获取。然而,基因疗法仍然面临着一些挑战,例如脱靶效应和递送载体的有效性。需要更多研究来解决这些挑战,确保基因疗法在临床中的安全性和有效性。

基因疗法是一个新兴领域,仍有很多未知数。OpenCRISPR-1的引入带来了希望和挑战并存。它有潜力彻底改变基因疗法,但也强调了负责和深思熟虑的应用的重要性。随着研究的深入和公众参与的增加,我们可以充分利用这项技术来改善人类健康。

开源是一把双刃剑。虽然它可以促进协作和创新,但也有可能导致代码库混乱和维护困难。对于像OpenCRISPR-1这样复杂的技术,确保代码质量和可靠性至关重要。一个由经验丰富的开发者和研究人员组成的活跃社区可以帮助维持和更新开源项目,从而减轻这些担忧。

除了监管挑战外,OpenCRISPR-1的临床应用还取决于公众对基因编辑的接受程度。有些人对改变人类基因组的前景感到担忧,认为这可能会产生不可预测的后果。因此,在将OpenCRISPR-1用于临床之前,需要进行广泛的公众教育和参与,以建立对这项技术的信任。

OpenCRISPR-1的开源无疑会加速基因编辑技术的研究和突破。通过向研究人员提供一个开放、可扩展的平台,开源将促进不同学科和机构之间的协作。更多的研究人员可以访问和使用该编辑器,分享他们的见解和发现,从而产生新的想法和创新。此外,开源允许其他研究人员对OpenCRISPR-1进行调整和优化,满足特定的研究需求,加快基因编辑技术的发展。

人工智能不太可能完全取代传统基因编辑方法,而是将与之互补。人工智能可以自动化繁琐的任务,并提供新的见解和可能性,但传统方法仍然在精准控制和可靠性方面具有优势。两种方法的结合有望带来更强大的基因编辑能力。

最大的挑战在于监管。基因疗法涉及改变患者的DNA,监管机构需要确保这些改变是安全的、有效的,并且不会产生不可预料的后果。OpenCRISPR-1的开源性质可能会给监管带来额外的复杂性,因为多个研究小组可以独立开发和修改该编辑器,使得监管机构难以跟上。