约翰Lesnick 合成生物学家希望创造一个生物未来,让我们的文明远离石化产品,展示可再生能源的前景,以更少的成本生产高质量的产品。考虑到基因序列的超天文可能性,很明显人类没有足够的能力来测试这片广阔的空间。像Echo这样的高通量液体处理器,加上机器学习算法,可以帮助我们筛选基因组的黑暗角落,推进这场“生物化”的工业革命。图片:约翰·莱斯尼克,贝克曼·库尔特的高级科学家。图片来源:贝克曼·库尔特
首页»新兴技术»自动化和机器学习如何帮助探索基因组的黑暗角落

自动化和机器学习如何帮助探索基因组的黑暗角落

如果你合成了79个核苷酸长的DNA片段(479)的每一个变体,它们的质量会更大比地球的质量还大. 如果你做同样的事情,但是有126个核苷酸,它们的质量会比可观测的宇宙还要大。我第一次在一本书中读到这些“超天文”数字审查牛津大学路易斯理论物理教授阿德.

鉴于大肠杆菌基因组有500万个碱基长,而人类基因组是它的600倍长,工程师们怎么能可能知道哪些精确的修改最适合过度生产某些化学物质,或者哪些修改可以阻止癌症的扩散?大自然刚刚开始探索这个“编码”空间,我们可能会天真地认为我们可以做得更好。

在合成生物学中,设计-建造测试周期用于创造具有所需特性的生物体。但是,考虑到DNA序列的可能组合,几乎不可能设计完美的DNA序列越来越多的计算机辅助生物学技术有望加快这一流程,利用自动液体处理程序进行构建(在某些情况下是测试),并将得到的数据输入机器学习算法,后者设计了下一组实验。

机器学习只是计算机用来执行特定任务的一组算法,而无需一组直接指令。喂电脑太多了高质量的数据,它会告诉你下一步要做哪个实验。

回声现在是贝克曼库尔特生命科学公司的一部分,由Labcyte开发的液体处理器可以帮助提供这些数据。

“通过声波移动液体,回声液体处理器无需接触,能够精确准确地传输2.5或25纳升的增量。对于合成生物学家来说,您可以将寡核苷酸、master混合液和酶的一系列液体结合到裂解液中,以进行TX-TL表达,而无需校准仪器。”贝克曼·库尔特的资深科学家约翰·莱斯尼克说。整个过程也非常快,回波每秒传输数百个液滴。这种速度和精度使科学家能够测试比手工测试多得多的变种。这里收集的数据一旦输入机器学习算法,就可以用来回答具有挑战性的问题,如:

哪一个导基因能最好地编辑这个基因?

我应该用哪个启动子来表达这个蛋白质?

我如何修改这种酶,使其催化转化率最大化?

许多高性能的合成生物学公司已经在使用这种“计算机辅助”方法,以极快的速度重新布线生物学。基因组编辑公司Inscripta使用机器学习算法开发了一个一体化平台,可以在活细胞中同时进行数百次精确的基因组编辑。Zymergen通过使用机器学习来决定在生物体中进行哪些基因修改,正在生产自然界中没有的高性能材料。

我们正在进入一个计算机辅助合成生物学的时代,机器可以运行实验,分析数据,并设计下一个实验。它可以帮助我们探索基因组的“最黑暗的角落”,并创造出大自然无法企及的不可思议的化学物质和产品。

基因组编辑和蛋白质设计得益于机器学习

考虑到DNA序列可以采用的“超天文数字”组合,科学家们如何找到最好的他们的应用组合?

考虑一下Inscripta的数字基因组工程平台最近用于创建200000编辑库属于大肠杆菌生物合成途径。该系统是一个封闭的设备在SynBioBeta会议上正式宣布vwin彩票注册它使用CRISPR/Cas9在基因组的特定区域进行数千次平行编辑。

理查德•福克斯

理查德•福克斯他是Inscripta数据科学的执行董事。

“CRISPR基本技术至少有两个关键特征,”他说理查德·福克斯博士,Inscript的数据科学执行董事。“一种是切割基因,然后粘贴和修复的能力……因此,想象我们正在使用数据来推导优化编辑过程的规则可能不是一件容易的事。”

为了确定哪个guiderna最适合每次编辑,他们利用了机器学习。福克斯解释说:“我们生成大量数据来确定哪些设计比其他设计工作得更好,提高系统性能的一部分是利用这些数据,结合统计学和机器学习,实证地确定哪些指导最适合切割。”

但机器学习的效用并不止于此。Inscripta还利用他们的基因编辑平台来指导蛋白质工程和定向进化,这与他们获得的方法相同弗朗西斯·阿诺德他是2018年诺贝尔化学奖得主。

“我们在蛋白质工程领域花了相当多的时间,特别是通过定向进化等方法。具体来说,我们围绕酶和其他蛋白质生成基因型和表型数据,”福克斯说,他指的是编码蛋白质的DNA序列如何影响有机体的可观察特征(即其表型)。

例如,Inscript可以对编码一种酶的DNA序列进行许多不同的编辑,然后进行实验来验证它测量结果的表型。如果酶负责产生一种明亮的色素,那么某些编辑将使它产生或多或少的那种色素。通过将这些信息输入机器学习管道,算法可以进行预测哪一个编辑将最大化期望的表型。

在加利福尼亚州埃默里维尔的碑文塔西北方向40分钟的地方,Zymergen正在使用类似的策略来设计分子和材料的未来。

用机器学习创造自然

“生物学是一个功能强大、用途广泛的工具,它可以针对任意数量的不同端点,”他说亚伦金博他是Zymergen的首席技术官。

在埃默里维尔一个31万平方英尺的空间里,Zymergen正在使用工程生物来生产一系列化学物质和材料。尽管灵感来自大自然,他们创造的许多材料在地球上其他地方都找不到。就像Inscripta一样,他们的工程过程需要探索超天文空间,以找到最有效的DNA组合,以生产所需的化合物。

“为了建立我们用于全面发酵的菌株,我们使用了实验室自动化系统。我们使用一个循环,设计,构建,测试和分析。在设计阶段,我们设计了许多我们认为有益的基因编辑,然后我们对我们的菌株进行身体上的编辑,然后我们测试它们的不同反应,”金博尔说。

Kimball说,一旦液体处理程序被用来构建菌株,得到的数据将为下一轮实验提供信息。“在学习阶段,我们更新我们制作的任何模型,并将这些信息输入到下一轮的设计中……所以构建阶段和测试阶段基本上完全在实验室自动化系统上执行,这样我们就可以大规模地执行这项工作。”

在Zymergen的案例中,目标是设计能够生产自定义设计材料和化学品的规模。通常,看似无害的单个基因编辑可以导致具有更高生产能力的优良菌株。但是,要确定要进行哪些编辑,需要数据和算法之间不断进行对话。

“我们拥有世界上最大的DNA库之一,以及我们可以搜索的电子数据库。因此,我们可以使用机器学习算法在数据库中搜索与基因的同源物,这些同源物可能是生物体中自然编码的基因的有益替代品,”金博尔说。“我们还可能(使用机器学习)更深入地搜索基因组的‘暗物质’,即没有已知功能的基因……然后结合有益的编辑或突变。”

尽管Zymergen成立于2013年,但它已经成功地使用了这种自动与机器学习相结合的方法。尽管该公司没有透露他们的客户、联合创始人和首席执行官约书亚·霍夫曼曾表示他们的客户"在过去的几年里,我们已经售出了价值5亿美元的用我们的臭虫制造的产品.”

Zymergen

Zymergen首席执行官约书亚·霍夫曼

合成生物学家希望创造一个生物的未来,让我们的文明远离石化产品,展示可再生能源的前景,以更低的成本生产高质量的产品。考虑到基因序列的超天文可能性,很明显,人类没有足够的装备来测试这一广阔的空间。

但也许像Echo这样的高通量液体处理器,加上机器学习算法,可以帮助我们从生物学中学习,筛选基因组的黑暗角落,并继续推进这种“生物化”的工业革命。

所有商标均为其各自所有者的财产。

1

妮可McCarty

Niko是加州理工学院的生物工程博士生。此前,他以富布赖特学者的身份在伦敦帝国理工学院完成了系统和合成生物学硕士学位。

点击这里加入我们的每周通讯。我们想听听你对这篇文章的看法。有消息告诉我们的新闻组吗?写信给editorial@www.digitcult.com.vwin彩票注册

添加注释

就业机会

更多的

Baidu