继 AlphaFold 获得诺贝尔化学奖之后,Google DeepMind 再次在生物学领域取得重大突破——发布了 AlphaGenome,一个能够预测非编码 DNA 功能的 AI 模型。
什么是 DNA 的「暗物质」?
我们的基因组中,超过 98% 的 DNA 并不编码蛋白质。这些曾被称为「垃圾 DNA」的序列,现在被科学家认为是决定基因活性的关键——它们就像基因的「开关」,控制着基因何时开启、何时关闭。
问题是:这些非编码 DNA 究竟如何影响我们的健康?这一直是生物学的未解之谜。
AlphaGenome 能做什么?
| 能力 | 说明 |
|---|---|
| 超长序列输入 | 最长 100 万个 DNA 碱基对 |
| 突变影响预测 | 预测序列突变如何影响基因表达 |
| 致病突变筛选 | 帮助科学家缩小搜索范围 |
DeepMind 副总裁 Pushmeet Kohli 打了个比方:
「基因组就像一本 30 亿字符的巨书,AlphaGenome 能告诉你:如果改变其中某些词,会产生什么影响。」
技术突破
相比之前的工具,AlphaGenome 的关键突破在于:
- 超长序列处理:之前的模型在序列长度和准确性之间必须取舍,AlphaGenome 两者兼得
- 多数据集融合:整合了多个关于基因表达的数据集
- 开源可用:DeepMind 已向研究人员免费开放
潜在应用
- 理解不同细胞/组织中的基因调控机制
- 通过全基因组关联研究理解疾病
- 研究癌症中哪些突变真正致病
- 诊断罕见病
- 设计新的基因疗法
局限性
- 只在人类和小鼠数据上训练,暂不适用于其他物种
- 可能漏报某些实际有影响的变异
- 是研究工具,不能直接用于临床诊断
富贵点评
从 AlphaFold 到 AlphaMissense 再到 AlphaGenome,DeepMind 的「Alpha 系列」正在系统性地攻克生物学的核心问题 🧬
有意思的是,这次的突破不是靠更大的模型,而是靠更聪明的工程——能处理 100 万碱基对的长序列,这才是真正的技术壁垒。
AI 在生物学领域的应用,可能比在写代码、画图这些领域更有长期价值。毕竟,理解生命的密码,才是真正改变人类命运的事。
原文来源:Scientific American | Nature 论文
📋 要点回顾
- 发布方:DeepMind 发布 AlphaGenome
- 能力:预测 100 万碱基对长度的非编码 DNA 功能
- 意义:帮助理解基因组「暗物质」如何影响疾病
- 应用:加速遗传病研究和药物开发
❓ 常见问题
Q: 什么是基因组「暗物质」?
A: 人类基因组中只有约 2% 是编码蛋白质的基因,其余 98% 被称为「暗物质」。它们的功能长期不明,但可能影响基因表达和疾病。
Q: AlphaGenome 和 AlphaFold 有什么关系?
A: 都是 DeepMind 的生物 AI 项目。AlphaFold 预测蛋白质结构,AlphaGenome 预测 DNA 功能。两者互补,共同推进生物学研究。
Q: 这对普通人有什么影响?
A: 长期来看可能加速遗传病的诊断和治疗。比如找到某些疾病的遗传根源,开发针对性药物。但从研究到临床应用还需要时间。
作者:王富贵 | 发布时间:2026年02月04日