合成生物学智能化设计与应用

978-7-115-63556-3
作者: 滕越
译者:
编辑: 吴晋瑜

图书目录:

详情

本书以人工智能技术在合成生物学领域的理论、方法及应用为主线,详细阐述人工智能在合成生物学不同层面设计中的应用进展,深入讨论人工智能在合成生物学实际应用中面临的挑战与困难。本书先概述合成生物学与人工智能基本概念以及发展简史,然后介绍人工智能技术在生物元件、生物模块、生物系统设计方面的应用,并通过案例展示了人工智能与合成生物学技术在生物医药领域的研究进展,最后分析了人工智能驱动合成生物技术的发展趋势,并讨论了实际应用所面临的挑战和困难,以及展望该交叉领域的未来研究方向。 本书适合作为生物类、计算机类、化工类、环境类、医药专业的本科生及研究生的教学用书,也适合生物、信息、医药、化工、能源、资源和环境等领域的科研人员、程序开发人员参考。

图书摘要

版权信息

书名:合成生物学智能化设计与应用

ISBN:978-7-115-63556-3

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

版  权

主  编 滕 越

责任编辑 吴晋瑜

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315

内 容 提 要

本书以人工智能技术在合成生物学领域的理论、方法及应用为主线,详细阐述人工智能在合成生物学不同层面设计中的应用进展,深入讨论人工智能在合成生物学实际应用中面临的挑战与困难。本书先概述合成生物学与人工智能基本概念以及发展简史,然后介绍人工智能技术在生物元件、生物模块、生物系统设计方面的应用,并通过案例展示了人工智能与合成生物学技术在生物医药领域的研究进展,最后分析了人工智能驱动合成生物技术的发展趋势,并讨论了实际应用所面临的挑战和困难,以及展望该交叉领域的未来研究方向。

本书适合作为生物类、计算机类、化工类、环境类、医药专业的本科生及研究生的教学用书,也适合生物、信息、医药、化工、能源、资源和环境等领域的科研人员、程序开发人员参考。

编委会名单(排名不分先后)

主 编:滕 越(军事科学院军事医学研究院)

参 编:钟 超(中国科学院深圳先进技术研究院)

    刘 玲(中国科学院微生物所)

    齐建勋(中国科学院微生物所)

    黄 牛(北京生命科学研究所)

    张数一(清华大学)

    孙 智(北京大学)

    王 涛(天津大学)

    陈为刚(天津大学)

    史志远(天津大学)

    田 健(中国农业科学院)

    韩双艳(华南理工大学)

    崔 巍(华南理工大学)

    余 岩(四川大学)

    刘 杰(中山大学)

    袁 清(解放军总医院)

    杨 飞(解放军总医院)

    商 微(解放军总医院)

    刘 萱(军事科学院军事医学研究院)

    刘芮存(军事科学院军事医学研究院)

    刘拓宇(军事科学院军事医学研究院)

    罗博煜(军事科学院军事医学研究院)

    庄滢潭(军事科学院军事医学研究院)

合成生物学自20世纪中叶以来,历经了从理论构想到技术实践的深刻转变。从DNA双螺旋结构的发现,到限制性内切酶的应用,再到基因工程的深入发展,这一领域逐渐形成了以定量、计算和预测为核心的工程化研究模式。随着基因组计划的推进和系统生物学的兴起,研究人员开始尝试重新设计和构建生物系统,如人工基因调控网络和生物传感器,这标志着合成生物学的发展进入全新时代。

合成生物学与人工智能技术的结合是当今科技领域的前沿热点,它们的交叉应用很有可能重塑生物技术的未来。在人工智能技术迅速发展的今天,众多科学家和研究人员,依托自身丰富的行业知识、专家经验,积极将人工智能技术运用到DNA改组技术、工程化载体的设计等复杂生物问题的解决方案中,以期为生物系统带来更多的可能性,以及提升生物系统的可控性。

近年来,我们将人工智能技术应用于生物元件设计、生物系统优化等研究工作,并就“合成生物学+人工智能”的深度融合如何推动生物医药、能源和环境保护等做了大量的探究性工作。我们希望能将自己的研究成果集结成册,出版一部兼具学术价值和实践指导意义的专业图书,为相关领域的科技工作者和从业者提供参考,进而为推动跨学科思维的培养和科技进步尽一点绵薄之力。

在这本书里,我们系统梳理了合成生物学的基本概念和历史发展脉络,着重探讨合成生物学的智能化设计与应用,揭示这一领域如何从传统的生物学研究转变为可量化、可预测的工程化科学,以及如何通过工程化思维改造生物系统。此外,我们还介绍了合成生物学与人工智能技术相结合的若干进展,包括智能算法在生物元件设计中的应用、基于机器学习的生物系统优化策略,以及如何利用大数据分析来预测和控制生物过程,以期帮助读者全面理解合成生物学的智能化设计与应用的相关内容,进而激发更多跨学科合作的灵感。

滕越

前  言

当前,全球科技革命与产业变革的浪潮汹涌而来,各学科之间的交叉融合不断深化,科学研究范式正在经历前所未有的变革。世界各国纷纷布局,大力推动科技创新战略和政策的制定及实施,以期提升自身的科技实力和竞争力,适应新的科技发展趋势。科技创新战略和政策的制定及实施,旨在加强重点领域的研发投入,如生物制造、人工智能、生物技术、新能源等具有重要战略意义的领域。这些领域的创新和发展,不仅有助于推动经济发展、提高人民生活水平,还将为应对气候变化、公共卫生等全球性挑战提供强有力的支持。

合成生物学是一个跨学科领域,其运用工程学理念,重新设计、改造甚至重新合成生物体,突破传统自然发生和进化过程,实现产量或性能的提升。通过合成生物学,科学家们可以设计和构建新的生物部件、设备和系统,以及通过基因编辑技术改进现有的生命系统。这促进了对生命密码从“读”到“写”的跨越,打开了从非生命化学物质向生命物质转化的大门,催生了继DNA双螺旋结构发现和人类基因组测序之后的“第三次生物科学革命”。

同传统的生物技术相比,合成生物学有以下三大突出优势。其一,推动生命设计新技术的发展,开启智创时代。合成生物学在生物技术颠覆性创新方面展现出无限可能和巨大潜力。其二,推动生物制造新战略的发展,实现产业升级。合成生物学具有“原料循环可持续、生产路径经济高效、生产产品性能优越”的优势;基于合成生物学设计的生物功能模块具有简单、可控的特点,使其更易实现标准化、工程化和规模化。其三,推动交叉领域新变革,凸显多重价值。合成生物学天然具有交叉学科属性,基因技术、纳米材料、信息科学等技术的迅速发展为合成生物学实现了“快充”式“蓄能”,而这种“能量场”的“高电势”又能在能源、农业、化工、医药等领域实现广泛“赋能”。

合成生物学在诞生之际,便与信息技术的发展紧密相关。生物学实验数据的纵深积累以及人工智能技术的快速发展,使得人工智能在合成生物学领域的应用成为必然。在合成生物学领域,人工智能的应用可以帮助科学家们更好地理解和预测生命系统的行为,从而优化设计和改造。也就是说,人工智能在合成生物学领域的应用将促进智能化、自动化、体系化的生物技术与生物体系的形成,加速医疗、农业、能源等多个领域的创新、创造,引领新经济模式的发展,对于保障经济社会可持续发展、支撑国家建设与国家安全具有重大战略意义。

本书对合成生物学的核心概念和原理进行系统的梳理,介绍人工智能技术在合成生物学不同层面中的应用概况,并探讨合成生物学技术在工业、农业、健康、能源、环境、材料等领域的潜在价值和战略意义,预测合成生物学与人工智能技术交叉融合的发展趋势,以期让从事生物、信息、医药、化工、能源、资源和环境等领域的相关科研人员从中有所收获。

“合成生物学”是高度汇聚各学科知识与前沿技术的新兴学科,又具有深度赋能各研究和应用领域的巨大潜力。鉴于此,在撰写本书的过程中,我们组织了多轮筹划组织、编写研讨和校稿提升工作,力求准确、全面地将相关内容呈现给读者。但由于该领域发展迅猛,且笔者自感自身水平有限,故书中难免有疏漏和不妥之处,诚盼读者在翻阅之余,拨冗指正,提出宝贵建议!我们会在后续的更新完善中不断提高。

最后,本书得以顺利付梓,离不开笔者所在单位领导的大力支持、诸多同行的鼎力相助以及实验室小伙伴们的积极参与,笔者在此表示衷心的感谢!相信在未来的研究和应用中,合成生物学与人工智能的交叉领域将会出现更辉煌的成就!

资源与支持

资源获取

本书提供如下资源:

本书思维导图;

异步社区7天VIP会员。

要获得以上资源,你可以扫描下方二维码,根据指引领取。

提交勘误

作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎读者将发现的问题反馈给我们,帮助我们提升图书的质量。

当读者发现错误时,请登录异步社区(https://www.epubit.com),按书名搜索,进入本书页面,单击“发表勘误”,输入勘误信息,单击“提交勘误”按钮即可(见右图)。本书的作者和编辑会对读者提交的勘误进行审核,确认并接受后,将赠予读者异步社区100积分。积分可用于在异步社区兑换优惠券、样书或奖品。

与我们联系

我们的联系邮箱是wujinyu@ptpress.com.cn。

如果读者对本书有任何疑问或建议,请你发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。

如果读者有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们。

如果读者所在的学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。

如果读者在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请将怀疑有侵权行为的链接发邮件给我们。这一举动是对作者权益的保护,也是我们持续为广大读者提供有价值的内容的动力之源。

关于异步社区和异步图书

“异步社区”(www.epubit.com)是由人民邮电出版社创办的IT专业图书社区,于2015年8月上线运营,致力于优质内容的出版和分享,为读者提供高品质的学习内容,为作译者提供专业的出版服务,实现作者与读者在线交流互动,以及传统出版与数字出版的融合发展。

“异步图书”是异步社区策划出版的精品IT图书的品牌,依托于人民邮电出版社在计算机图书领域多年来的发展与积淀。异步图书面向IT行业以及各行业使用IT技术的用户。

第1章 合成生物学概述

合成生物学(synthetic biology)是生物学与数学、物理学、化学、工程科学、信息科学、计算机科学等学科融合形成的新兴交叉学科,基于工程化设计理念,利用基因操纵、计算模拟、化学合成等技术手段,对生物体进行有目标的设计、改造乃至重新合成,突破了生命进化的自然法则,实现了生命密码从“读”到“写”的跨越,打开了从非生命化学物质向生命物质转化的大门,展现出无限潜力。

合成生物学通过对生命系统的重新设计和改造来推动生物技术产生新的跃升。也就是说,合成生物学基于元件工程、线路工程、染色体及基因组工程、合成细胞工程、生物大数据技术等生物技术,将原有的生物技术提升到工程化、系统化和标准化的高度,可以完成传统生物技术难以胜任的任务,甚至创造出自然进化无法实现的生物功能,大幅提升生物制造能力。

合成生物学颠覆了以描述、定性、发现为主的传统生物学研究方式,转向可定量、可计算、可预测以及工程化的模式,催生了继DNA双螺旋结构发现和人类基因组测序之后的“第三次生物科学革命”,被视为“改变未来的颠覆性技术”。

1.1 发展历程

“合成生物学”一词最早出现在法国科学家Stephane Leduc所著的《生命的机理》(The Mechanism of Life)一书中,至今已有上百年的历史。Stephane Leduc在其著作中利用物理学理论阐释生命起源和进化规律,并认为“合成生物学”是“对形状和结构的合成”——这种描述与今天的“合成生物学”有较大的差距。

20世纪中期,随着现代生物学的发展,合成生物学理论和技术基础逐步形成。1953年,James Dewey Watson和Francis Crick发现了DNA双螺旋结构,并提出遗传信息的“中心法则”;1961年,法国科学家Francois Jacob和Jacques Monod用大肠杆菌做试验,提出了乳糖操纵子模型,推断出细胞中存在调控线路以响应外部环境,开创了基因调控的研究。进入20世纪七八十年代,随着PCR等分子克隆技术的出现与发展,基因操作在微生物研究中得到了广泛的应用,而人工基因调控技术手段的出现,使得基因工程在世界范围内迅速发展起来,进而使得合成生物学的理论和技术基础得到完善。1970年,美国科学家Kent Wilcox和Hamilton Smith发现了第一种Ⅱ型限制性内切酶Hind Ⅱ,而这种酶能够准确识别并切割基因特殊位点(这种酶又称为“分子手术刀”);Kathleen Danna和Daniel Nathans通过研究流感嗜血杆菌限制酶对SV40 病毒DNA的特异性切割,得到了限制性内切酶图谱。

1978年,波兰科学家Wacław Szybalski首次提出了合成生物学愿景,认为限制性核酸内切酶的发现不仅为科研人员提供了DNA重组工具,更引领人类进入了合成生物学领域。1980年,“合成生物学”第一次作为文章标题(《基因外科术:合成生物学的开始》)出现在学术期刊上。

20世纪90年代以后,人类基因组计划的实施、组学研究的兴起促进了系统生物学(systems biology)与生物信息学(bioinformatics)的快速发展。系统生物学是分子生物学之后现代生物学的新阶段,其研究对象是自然界中生物的系统整体,以实验、定量分析、数学模拟、仿真建模等方法作为技术手段,从生物动力学视角对生命现象进行研究,整合不同层次的信息以理解生物系统如何行使功能。

随着测序技术的不断改进以及测序成本的降低,基因组、转录组、蛋白质组、代谢组等生物信息数据呈指数级增长,使得数据挖掘和数据分析面临新的挑战,进而推动了生物信息学的迅速发展。由此可见,生物信息学是一个跨学科领域,其主要研究范畴包括开发用于理解生物数据的方法和软件工具,需要综合应用生物学、计算机科学、信息工程、数学和统计学来分析和解释生物数据。进入21世纪,科学家通过高通量测序技术分析DNA、RNA、蛋白质、代谢产物等,运用系统生物学与生物信息学方法,解析大量细胞成分及其相互作用,为生物体和生命运动提供了“蓝图”,也为合成生物学的出现奠定了基础。

21世纪初,合成生物学领域有一系列标志性成果陆续发布。2000年,James Collins等人构建了由相互抑制的转录因子组成的双稳态开关;Elowitz和Leibler设计了由三重负反馈环组成的振荡电路,可进行周期性振荡的蛋白表达。这两项发表在Nature杂志上的工作成果,初步建立起了“设计-构建-测试-学习”的调试循环流程,标志着合成生物学作为一个新领域诞生。2002年,纽约州立大学石溪分校的Eckard Wimmer在Science发表论文,通过化学合成病毒基因组获得了具有感染性的脊髓灰质炎病毒,即人类历史上首个人工合成的生命体。2003年,Martin等人在大肠杆菌中实现了青蒿酸前体(青蒿二烯)的人工合成,其通过异源表达酿酒酵母甲羟戊酸途径克服了大肠杆菌中萜类前体物合成的技术障碍。随着国际基因工程机器大赛(International Genetically Engineered Machine Competition,简称iGEM)的举办以及合成生物学定义在国际范围内得到广泛认可,合成生物学里程碑式成果不断涌现,科研人员使用电子线路工程学原理研究基因线路设计和定量行为之间的关系,构建了自调节正反馈和负反馈的振荡器、各类逻辑门等简单基因线路,探索了真核和原核生物中基因表达和分子噪声间的关系,增进了对合成生物学的理解。随后,合成生物学迅速发展的新技术和工程手段使其研究与应用领域大为拓展。图1-1展示了合成生物学的标志性成果。近十年来,合成生物学使能技术更新换代,工程化、自动化平台建设逐渐完备,全面推动生物技术、生物产业和生物医药发展进入新阶段,在实现人类“能力提升”的宏伟目标上迈出了坚实的一步。

图1-1 合成生物学的标志性成果

1.2 定义与本质

2000年,斯坦福大学的Eric Kool等学者在美国化学学会年会上提出了“合成生物学”这一术语,用来描述利用有机化学和生物化学在生物系统中发挥作用的非天然分子合成。英国工程和物理科学研究委员会(Engineering and Physical Sciences Research Council,EPSRC)将合成生物学定义为“针对应用目的,对以生物为基础的元件、器件和系统以及对现有天然生物系统的重新设计和工程化”。

目前,对合成生物学的定义已经有许多类似的表述,大多是指利用基因技术和工程学概念来重新设计和合成新的生物体系或改造已有的生物体系。具体而言,合成生物学是指通过系统化和工程化手段,设计和构造自然界中不存在的元件(part)、装置(device)和系统(system),或者对现有元件、装置和系统进行重新设计以赋予其新的生物学功能,即有目的地设计、改造乃至重新合成“生命体”。我们也可以将合成生物学的本质概括为“造物致知,造物致用”:“造物致知”,即通过合成生物学研究来增进对自然和人工生命体的基础认知;“造物致用”,即通过合成生物学研究来创造社会经济价值。

合成生物学区别于其他传统生命科学的关键在于其“工程学本质”,主要体现其侧重于“自下而上”的正向工程学策略和“自上而下”目标导向的逆向工程学策略。在“自下而上”的策略中,对生物元件进行标准化表征,构建通用模块,利用抽提、解耦和标准化等方式降低生物系统复杂性,在经过简化的“细胞”底盘上构建人工生物系统并实现其运行的定量可控。从元件标准化到模块构建再到系统集成,打破了“自然”和“非自然”的界限,将“格物致知”研究策略推进到了“造物致知”的新领域。“自上而下”目标导向的逆向工程学策略则主要应用于人工生命体的构建。例如,在最小基因组的研究中,通过去除非必需基因来了解基因组架构并改善其特性,进而达到可模拟和预测的目的。

合成生物学的工程化研究融合了分子生物学、系统生物学和定量生物学的本质,提供了一条“从创造到理解”的研究思路和方法,即利用工程学的模块化概念和系统设计理论,在不同层次上对生物元件、模块到复杂途径网络的结构和功能进行解析、设计和模拟,这有助于更深入、更完整地理解生命的本质,进而改变了“从整体到局部”的经典生命科学研究模式。

1.3 基本原理

合成生物学运用基于多学科技术建立的“设计、构建、测试、学习”(Design-Build- Test-Learn,DBTL)工程学循环,可以获得具有特定功能的人工生物元器件和人工生物系统(结构更复杂、功能更强大、性能更优越),并实现其运行的定量和可控。

本节将从合成生物学的层级化结构和工程化设计两方面阐释合成生物学的原理。

1.3.1 层级化结构

合成生物学主要基于“自下而上”的正向工程学思想,通过三个基本层次进行层级化构建,即生物元件生物装置生物系统(见图1-2)。生物元件是指具有特定功能的DNA序列,是遗传系统中最简单、最基本的生物积块(BioBrick)。具有不同功能的生物元件可以组合为更复杂的生物装置,而具有不同功能的生物装置协同运作就可以构成更复杂的生物系统。

图1-2 层级化结构示意图

1.生物元件

生物元件是遗传系统中生命体发挥功能的最小单元,按照功能的不同,生物元件可以划分为启动子、核糖体结合位点、终止子、蛋白质编码序列等。

(1)启动子(promoter)。启动子是指通过控制RNA聚合酶与DNA的结合,从而控制目的基因转录的元件,即通过控制启动子的位置、操纵位点数量或者启动子序列本身来调控转录起始复合物与启动子的结合亲和力,从而控制转录强度。启动子可分为激活型启动子、阻遏型启动子和组成型启动子。激活型启动子会受到转录因子的正调控,转录因子水平的提升会使此类启动子的活性增加。典型的基于化学诱导剂的激活型启动子包括pLac启动子和pBAD启动子,这些启动子在基因线路中得到了广泛应用。除了基于化学诱导剂的诱导方式,“非接触式”激活型启动子可以满足对诱导方式的特殊要求,其中包括以光源等作为诱导剂的光敏启动子以及通过热激或冷激等作为诱导剂的温敏启动子。阻遏型启动子会受到转录因子的负调控,转录因子水平的提升会使此类启动子的活性降低。例如,在蓝光阻遏型启动子设计中,对蓝光敏感的蛋白结构域被插入大肠杆菌启动子的−35至−10区域内,当蓝光存在时,该蛋白形成二聚体并造成空间位阻,可以阻止RNA聚合酶的募集和转录。组成型启动子直接受到RNA聚合酶的影响,此类启动子的下游基因表达相对稳定,其表达强度取决于基因线路上所使用的组成型启动子的强度。值得一提的是,Anderson启动子库是一种合成生物学常用库,提供了各种强度的组成型启动子。但需要注意的是,强度极高的组成型启动子会消耗细胞内大部分聚合酶和核糖体资源,进而给细胞带来一定的代谢负担,甚至会导致宿主细胞出现明显的生长缺陷现象。此外,可将两种或两种以上不同启动子元件融合构成新的启动子,即杂合启动子。例如,pTac启动子为色氨酸启动子与乳糖启动子融合形成,兼具强启动能力和可调控性。

(2)核糖体结合位点(ribosome binding site,RBS)。RBS是指mRNA分子中位于启动子下游、起始密码子上游的一段短核苷酸序列,用于募集核糖体以启动转录。由于核苷酸的变化可以改变mRNA 5′端的二级结构,影响核糖体与mRNA结合自由能,从而改变蛋白质的整体翻译速率,因此RBS序列中的微小变化往往会导致表达效率上的巨大差异。Anderson RBS库是广泛使用的RBS库之一,可提供各种转录强度的RBS序列。一些在线设计工具可以预测RBS序列的强度,可为用户设计提供所需强度的RBS序列。此外,在5′端引入绝缘子(insulator)可提高预测效率。

(3)终止子(terminator)。终止子是指标志着转录结束的一段短DNA序列。原核生物的终止子在终止点之前都有回文结构,可使转录出来的RNA形成一个茎环式的发夹结构。一类终止子不依赖β因子,一般通过转录生成mRNA发夹结构,进而阻止RNA聚合酶继续沿DNA移动,使聚合酶从DNA链上脱落下来终止转录;另一类终止子则依赖β因子,即转录终止需要β因子的协同。通常,为了防止转录终止子不能完全终止转录,我们可以使用双终止子使之完全终止转录。既往研究已发现并鉴定了大肠杆菌几百种不同强度的终止子,其中有39种强终止子适用于复杂的大型基因线路设计。

(4)蛋白质编码序列(protein coding sequence,CDS)蛋白质编码序列位于RBS下游,是基因线路中表达的目标蛋白质。CDS以起始密码子开始,以终止密码子结束,并保证在CDS中间没有提前出现终止密码子。如果CDS来自其他物种,应根据宿主菌的密码子使用频率进行密码子优化以改善蛋白质表达。

按在生物系统中的功能不同,生物元件可以分为响应元件、调控元件、报告元件和降解元件。

(1)响应元件(response element)。响应元件可以是DNA、RNA或蛋白分子,能够在分子信号的诱导下激活或抑制基因的表达。响应元件在生物传感器中具有广泛的应用前景,可用其设计生物学反应系统与信号感应系统,实现对生物系统的精确调控。常见的响应元件包括感光元件、温度元件、酸碱响应元件以及化学信号响应元件等。

感光元件一般为光感基因所表达的光敏受体蛋白,这些蛋白可以感受到不同波长的光信号,并转换成细胞内的生物信号,从而调控基因表达。

温度元件包括热激反应元件和冷激反应元件,可以根据外界温度变化调控基因表达水平。

酸碱响应元件通过转录因子或RNA稳定性等方式,根据细胞外环境的pH值来调控基因表达水平。

化学信号响应元件可以识别和结合特定的化学物质浓度和种类,进而通过细胞内信号转导改变基因表达水平。例如,一些小分子化合物(如阿拉伯糖、异丙基硫代-β-半乳糖苷)可以作为外部信号调控基因表达。

此外,还有声响应元件、电响应元件以及氧气响应元件等,在选择响应元件时,我们需要综合考虑应用场景、灵敏度、特异性及环境依赖性等因素。

(2)调控元件(regulator element)。调控元件通常为蛋白质或RNA,能够与DNA序列结合并实现对基因表达的快速响应和精确调控。常见的调控元件包括强调控元件、弱调控元件、可变调控元件和组织特异性调控元件。

强调控元件通常具有较高的活性,能够快速驱动基因表达。

弱调控元件具有较低的活性,能够维持基因表达的稳定。

可变调控元件可以根据外部信号调节基因表达水平。

不同种类的组织或细胞中基因调控表达存在差异。组织特异性启动子是一种组织特异性调控元件,在该启动子调控下,外源基因一般只在某些特定的器官或组织部位表达。例如,Bilal等人采用Cre重组酶双荧光报告基因小鼠作为实验动物,将在心脏具有特异活性的Nppa和Myl2启动子插入表达Cre的腺相关病毒(AAV9)载体中,最后将AAV9基因特异性表达载体应用在心脏腔室中进行基因特异性表达研究。

(3)报告元件(reporter element)。报告元件通常可以产生明显可观察的蛋白质或者RNA分子作为信号,用于监测生物系统的状态。典型的报告蛋白元件包括荧光蛋白(绿色荧光蛋白、红色荧光蛋白等)、生物发光系统(luxCDABE)、荧光素酶基因(Luc)和比色系统(LacZ蓝白斑)。例如,β-半乳糖苷酶基因(LacZ)可以编码一种酶,能够将X-gal转化为蓝色产物。除了上述报告元件,还有许多其他的报告元件,例如荧光蛋白基因的突变体、荧光素酶的突变体等。在选择报告元件时,我们需要考虑其灵敏度、特异性、稳定性、不影响目标基因表达等因素,并结合具体应用场景进行优化和设计。尤其是,在研究基因表达动力学时,我们应该考虑到不同的荧光蛋白具有不同的荧光成熟时间——这可能在建模研究动力学时带来不必要的延迟。如果有其他蛋白质并行表达,可使用合适的荧光报告分子,例如以单体形式存在的超折叠绿色荧光蛋白(superfolder green fluorescent protein,sfGFP),可以最大程度地减少对其他蛋白质的干扰。

(4)降解元件(degradation element)。降解元件一般为能够催化mRNA降解的RNA分子,进而控制基因的表达和生物系统的代谢过程,可用于构建RNA干扰、基因沉默或者其他基因敲除技术。例如,RNase E(ribonuclease E)是大肠杆菌及相关微生物中的核糖核酸酶,能识别并切割特定的RNA序列,在mRNA降解以及rRNA和tRNA成熟中可起到关键作用;RNase Ⅲ(Ribonuclease Ⅲ)是大肠杆菌中的一种特异性核酸外切酶,能识别并切割RNA的双链结构;丁型肝炎病毒(hepatitis delta virus,HDV)的基因组中编码有一种核酸酶,能识别并切割其RNA的特定序列。此外,蛋白质降解决定子(degron)通过与目的基因融合表达,可被细胞内的蛋白酶识别,以介导蛋白质的降解。

2.生物装置

将生物元件按一定的逻辑拓扑结构加以组合,使其发挥特定的功能,即可形成生物装置(biological device)。生物装置通过信号传导、代谢作用以及其他方式处理输入信号,进而生成输出信号。也就是说,生物装置内可发生一系列生物化学反应,包括转录、翻译、蛋白质磷酸化、变构调节、蛋白质相互作用以及酶反应等。

基础的生物装置包括报告装置、信号转导装置以及蛋白质生成装置。

(1)报告装置。报告装置是使产物可以被检出的装置。它将启动子、调控元件和报告元件加以组合,实现对生物系统的状态监控。

(2)信号转导装置。信号转导装置是环境与细胞或者细胞与细胞之间接收、传递信号的装置。细胞通过感受环境信号或其他细胞分泌的信号分子等,将信号转入细胞内部,通过信号转导逐级传递至效应蛋白,最终输出特定的信号。

(3)蛋白质生成装置。蛋白质生成装置是能够产生目标蛋白质的装置。它可以整合调控元件序列与蛋白质编码序列,按需求实现目标蛋白质的表达。

构建生物装置的基础是设计与合成基因线路,这也是合成生物学学科形成的标志性工作。所谓基因线路的合成,是指利用电气工程框架和数字电路的逻辑运算思想,按照电子工程学原理和方式设计、模拟,运用不同功能的基因和由生物分子组成的基本功能元件构建动态调控系统,通过特定的控制逻辑在活细胞内感知和处理信号分子。研究人员可以用相应的数学模型对这些简单的基因线路进行描述并利用外界信号对其加以调控,以及对设计方式进行评估并可重设计、重合成。2000年,波士顿大学的James Collins课题组采用反馈调节设计出了双稳态开关(toggle switch),这是第一个真正具有合成生物学意义的基因线路功能模块,是构建具备设计功能的工程基因线路的开创性工作。同年,普林斯顿大学的Elowitz和Leibler设计并构建了基因表达振荡器,利用3个转录抑制模块实现输出信号的规律性振荡。随后,各种控制模块陆续得以设计、构建,包括基因开关、振荡器、放大器、逻辑门、计数器以及复杂组合基因线路。2008年,研究人员在大肠杆菌中开发了快速、可持续并具有鲁棒性的遗传振荡器,使之通过负反馈线路实现时间延迟,产生功能性转录因子的细胞级联过程,并通过正反馈线路提升振荡器的鲁棒性和可调性,实现了振荡线路设计和理论研究方面的重大突破。2009年,研究人员首次在哺乳动物细胞中实现了对基因表达的周期性调控,该振荡器基于正反馈与负反馈基因回路,可自主、自我维持,以及可调控完成基因的振荡表达。这项工作有助于理解哺乳动物昼夜节律钟的精准分子机制和表达动态。2010年,研究人员通过合并群体感应制成了同步基因振荡器,该振荡器由正、负反馈线路组成,其工作原理是:单一细菌产生的信号分子可向外扩散并激活周边细菌的基因线路,通过在线路中表达可分解该信号分子的蛋白,为循环提供延时制动,单一细菌和相邻细菌中的不同基因线路发生动态相互作用,可用于建立信号分子和荧光蛋白的定期脉冲。这项工作为环境传感器以及药物输送系统奠定了强大的基础。

目前,基因线路的研究范畴已经从转录调控扩展至转录后和翻译调控,基因线路由此成为构建人工生命系统以及探索生命运行规律的强大工具。

3.生物系统

通过串联、反馈或者前馈等形式,我们将生物装置组合成更复杂的级联线路或者调控网络,即生物系统(biological system)。自然生物系统中的调控网络有转录调控网络、蛋白质信号通路和代谢网络。这里我们将以工程信号转导系统、人工细胞-细胞通信系统、代谢工程、生物传感器、最小基因组等为例,介绍生物系统的构建策略以及研究进展。

(1)工程信号转导(engineering signal transduction)系统。细胞与环境间的相互作用,以及许多细胞功能是由多个相互联系的工程信号转导级联系统介导的,这些工程信号转导级联系统由复杂的蛋白质线路组成,蛋白质线路则由许多不同的模块域组成,从而赋予了信号转导级联系统特定的功能和路径连接,并决定了信号网络的输入和输出。这些蛋白质可以通过直接修饰(如磷酸化)或者与特定配体结合来转导信号。蛋白质调控的级联线路对输入具有超敏感性响应,输入信号中的微弱变化就可能促使输出发生由低到高或由高到低的转换。了解和操纵信号转导机制可增加合成网络设计的复杂性和灵活性。Dueber 等人对酵母中变构蛋白信号开关进行了模块化的重编程,与诱导肌动蛋白N-WASP输出结构域变构激活的正常输入不同,该蛋白被设计成具有不同的自抑制输入结构域,可以响应不同的诱导剂。通过这种方式,肌动蛋白N-WASP 输出与异源输入耦合,进而创建了全新的信号通路,使设计人员能够观察和理解某些参数如何影响开关的行为。酵母支架蛋白Ste5和Pbs2通常分别介导的是α-factor因子响应和渗透反应,但经过融合和改造,将α-factor因子输入引导至渗透反应输出;Howard等人将磷酸酪氨酸识别结构域 Grb2 和 ShcA 融合到Fadd蛋白的死亡效应结构域,构建的新型嵌合蛋白可有效地引导有丝分裂或转化受体酪氨酸激酶信号以触发细胞死亡。

(2)人工细胞-细胞通信系统(artificial cell-cell communication system)。利用合成基因线路可构建人工细胞-细胞通信系统。Basu等人利用由细菌种群中两种不同细胞类型组成的特性良好的自然模块设计了人工细胞-细胞通信系统。在该系统中,一种细胞负责发送信号,另一种细胞则用作信号接收器,可对发送细胞诱导剂信号的行为作出反应。该系统被设计为响应诱导信号时空特征的脉冲发生器,为了响应由发送细胞产生诱导剂增加的持久性,接收细胞以GFP的脉冲来响应。在接收信号细胞的基因线路中,GFP和lambda抑制器都通过信号分子激活的LuxR转录因子响应N-酰基高丝氨酸内酯(N-acyl homoserine lactones AHL)浓度而表达,同时GFP的转录也可被lambda抑制元件所抑制。随着AHL浓度的上升,GFP表达先上升,随后被同时表达上升的lambda抑制器抑制。结果表明,根据诱导剂浓度和两种细胞距离的变化,可通过数学模型定量描绘出对信号分子的动力学响应曲线,实现了脉冲发生器的构建。2015年,研究人员利用细胞信号传导机制来调节多种细胞类型的基因表达,构建了由两种不同的细胞类型组成的合成微生物群落,即“激活剂”菌株和“阻遏剂”菌株,这些菌株产生了两个正交的细胞信号分子,在横跨两个菌株的合成线路中调节基因表达,形成种群水平振荡,这项工作通过研究种群水平动态进行编程的能力为具有多种细胞类型的复杂组织和器官的人工合成指明了方向。

(3)代谢工程(metabolic pathway engineering)。在大肠杆菌和酿酒酵母菌等模式生物中使用工程途径和模块化的生物合成级联,可以改变细胞原有的代谢途径,进而产生非天然的代谢物或提高目标代谢物的产量。代谢工程的一个重要特点是将新的途径整合到细胞中,并考虑到维持细胞基本功能所需的本地代谢物和操作手段。例如,青蒿素是治疗疟疾耐药性效果最好的药物,以青蒿素类药物为主的联合疗法也是当下治疗疟疾最有效、最重要的手段。青蒿素是由青蒿天然产生的,获取难度大、制备时间长且价格昂贵。为了降低青蒿素的成本,Ro等人开发了酵母生产青蒿酸(青蒿素前体)的系统,使用一种改进的甲羟戊酸途径,通过使酵母细胞工程化来表达amorphadiene合成酶和细胞色素P450氧化酶(这两种酶都源自工程菌大肠杆菌),其中P450氧化酶通过三步氧化法可将amorphadiene 氧化成青蒿酸。随着后续研究中产量优化和规模化采收,基于青蒿素相关治疗药物的生产时间将显著缩短,其成本也会降低。

(4)生物传感器(biosensor)。合成生物学的发展大大促进了生物传感器的发展。生物传感器利用待检测物质作为输入信号,通过构建的基因线路将输入信号转为细胞内的生化信号,并实现下游特定基因的表达。全细胞生物传感器的制造通常包含三个阶段:对输入的单一信号或多重信号感知信号处理产生可观测的输出反应。目标物理量的检测通常是通过转录因子发生别构效应(通过影响启动子区域来激活或抑制基因转录的启动)从而转换为内部生化信号,并触发随后的一系列细胞信号转导事件,从而将细胞内部的生化信号转化为外部可定量或定性检测的报告信号。合成生物学技术大幅提升了可用于生物传感器的元件数量和质量。例如,计算机驱动的蛋白质工程技术可设计具有全新结构的蛋白质结构域、蛋白质相互作用表面以及具有功能活性的酶,促进了生物传感器特定功能的实现。此外,基于细菌分裂与繁殖的全细胞生物传感器大幅度降低了制造成本,具有重要的经济意义,减少了将生物传感平台扩展到工业应用水平的障碍。

(5)最小基因组(minimal genome)合成生物学的目标之一是更好地理解生命,以及在功能上整合组成细胞的系统。解决这个问题的主要策略之一是定义基因组中足以维持生命的最小组成部分。随着高通量DNA测序和合成技术的发展,研究人员构建了多种缩减基因组的底盘菌株。目前有两种互补的策略来研究最小基因组:一种是“自上而下”的策略,即去除非必需的遗传基因,进一步简化生物体基因组——随着大规模基因组测序与分析技术的发展,研究人员通过对来自不同生物体的基因组加以比较分析,揭示对于细胞生命和代谢途径等必不可少的基因;另一种是“自下而上”的策略,即合成基因组的每个组件,并通过组装实现基因组的人工合成。高速发展的生物技术使基因调控网络的设计、生物合成途径的开拓乃至整个基因组的构建成为可能,目前已成功合成的有病毒、细菌和真菌基因组。例如,研究发现,模式生物大肠杆菌的基因组大于5 Mb,包含4000多个基因,其中1000多个为未知功能的基因。大肠杆菌可在多种环境(如好氧和厌氧,以及不同营养物质、pH值和温度等)下繁殖,然而其基因组编码了许多实验室培养和工业发酵不需要的基因,这些基因会导致能量和原料的浪费(如非必需基因组片段复制,以及功能冗余的转录物、蛋白质和代谢物的合成),若删除这些不必要序列,则有可能使其成为生物制造产业中的优良细胞底盘。

1.3.2 工程化设计

设计合成生物学工程化系统所面临的主要挑战在于生物元件复杂性,例如正交性、环境依赖性、稳定性、可预测性等。就正交性来讲,源于自然界的生物元件经常与底盘细胞存在不可预知的干扰,而这样的干扰会影响人工生物系统的性能。良好的正交性即表示元件间或元件与宿主遗传背景间不存在不良相互作用或干扰。

本节将介绍实现合成生物元件、生物装置和系统模块化设计的几个必要步骤,即解耦、抽提和标准化。

1.解耦

耦合是指系统内部各个部分之间存在相互依赖、相互影响、相互制约的情况,而解耦(decoupling)是指将一个复杂系统分解成较为独立的模块(类似于将一个复杂的问题分解成许多较简单的问题),这些模块可以独立工作,但也可以整合起来形成一个有效整体。这里给出解耦的两个代表性例子:在建筑工程领域,一个项目通常被分解成设计、预算、施工、项目管理和监查等可独立处理的任务;在软件工程中,解耦就是减少耦合的过程,即把各代码模块的关联依赖降到最低,让代码更加模块化、灵活、易于维护和扩展。

在合成生物学领域,遵循解耦的思想同样可以处理复杂生物系统的模块化和标准化问题。通过将生物系统解耦成一系列相互独立的模块,我们可以实现标准化模块的快速组装。例如,开发标准化底盘细胞,为搭载于细胞中的任何生物装置提供已知速率的核苷酸、氨基酸和其他资源(类似于电池),而这些与生物装置的细节无关。此外,为了解决生物元件之间以及元件与环境背景之间的干扰问题,我们应在构建生物装置时最大限度地实现“解耦”。具有良好特性的标准化生物元件可以满足“解耦”需求,进而构建包含不同功能或具有不同动力学参数的标准化元件库。当具有多个生物装置或生物系统时,我们应保证中心法则关键过程(复制、转录和翻译)的离散性,例如在基因线路工程中,使用独立的启动子来正交控制多个基因的转录——这可以通过选用具有正交性的转录因子实现。

2.抽提

处理复杂天然生物系统的另一个策略就是抽提。抽提(abstraction)是指研究生物体各个元件的特征、功能等,并进行概括、抽象、总结,然后加以详细表征,以便于更广泛地使用,并使生物系统可以达到预期的功能。

目前主要有两种策略对生物系统进行抽提,如下所示。

(1)用分层次抽提来提取描述生物功能的信息,以降低生物系统的复杂程度。对于生物工程的抽象层次模型,只考虑在每一层次的信息,而不考虑其他层次的细节。原则上,不同层次的信息只允许有限交流。

(2)对于构成工程生物系统的模块,通过重新设计和构建,对其进行适当简化,以便模拟和组装。例如,天然启动子、核糖体结合位点和开放阅读框的新组合所产生的蛋白表达水平一般很难预测,而通过人工设计改造的上述元件可通过数学建模等方式进行表达量的预测。

3.标准化

随着高通量测序技术的快速发展、测序成本的降低以及组装方法的不断完善,已测序的基因组规模呈指数级增长,为合成生物学研究提供了更多天然的生物元件。这些天然的生物元件包括蛋白质编码序列、基因表达和信号传导的调控元件以及其他功能性遗传元件。然而,未经标准化的天然生物元件难以符合特定的工程需求,不能直接应用到合成生物学系统的构建中。

电子、机械等工程领域通常依赖于标准化元件,通过对自然界的原材料加以提炼和改造,生产出符合制造和使用标准的工业元件,进而集成工业产品。在设计合成生物学系统时,标准化的生物元件有助于实现方便、快捷的自动化或半自动化组装,从而灵活运用生物元件进行多种生物学实验操作,既可以避免大量重复劳动,又能降低时间成本。

将具有生物功能的元件经过DNA序列设计使之满足特定要求,即可形成标准化生物元件,即生物积块。标准化生物元件的典型应用例子是BioBrick组装,BioBrick组装标准要求每一个生物积块使用相同的前缀和后缀序列,其中前缀序列包含EcoR I和Xba I两个酶切位点,后缀序列包含Spe I和Pst I两个酶切位点。因此,要兼容BioBrick组装标准,必须对生物积块进行设计,以确保基因编码序列不含有上述BioBrick限制性内切酶位点。除BioBrick组装方法之外,研究人员还开发了BglBrick、Golden Gate、Gibson组装以及同源重组等方法,成功实现了从单基因序列到完整基因组的组装。随着生物元件的数量越来越多,DNA元件组装方法不断丰富,如何快速、有效地完成目标序列的标准化组装成了合成生物学的一个关键问题。Densmore等人开发了DNA组装的自动化设计软件,该软件可针对需要组装的最终DNA序列设计最优的组装方案,通过高效利用元件库中的已有元件和不同序列间的共有序列,优化目标序列的合成途径,确定最佳的组装阶段数并最小化组装时间,加快DNA合成与组装速度。此外,生物元件产生信号的量化和度量也是标准化的一个重要方面。PoPS是指RNA聚合酶分子每秒(RNA polymerase per second)通过DNA上某一定点的数量,用于衡量转录水平上元件输入/输出信号的强度。

截至目前,研究人员已建立了许多具有代表性的标准,例如DNA序列数据、微阵列数据、蛋白结构数据、酶命名法则、系统生物学模型和限制性内切酶活性等。研究人员可以通过收集、整理和保存各类生物元件来构建生物元件数据库,实现生物元件的共享,进而提高生物系统设计与构建的效率。

常见的标准化生物元件数据库名称如下。

(1)标准生物元件登记库(Registry of Standard Biological Parts,RSBP)。2003年,麻省理工学院创办了国际基因工程机器大赛(iGEM),并组建了标准生物元件登记库。迄今为止,标准生物元件登记库已登记了超过20000个标准化生物元件,其中包括启动子、转录单元、质粒骨架、转座子、蛋白质编码区等DNA序列,核糖体结合位点、终止子等RNA序列,以及一些蛋白质结构域。值得一提的是,标准生物元件登记库中的生物学元件都是以载体形式保存的。

(2)生物积块基金会(BioBricks Foundation,BBF)。生物积块基金会由众多合成生物学领域专家于2004年发起,致力于推动合成生物学技术在更多领域的发展。生物积块基金会制定了元件使用与分享过程中的法律框架与相关标准,例如生物积块公共协议(BioBricks Public Agreement),以期促进和规范标准化生物元件的收集与共享。

(3)标准虚拟元件库(Standard Virtual Parts,SVPs)。标准虚拟元件库由英国学者Cooling等人创建,其包含模块化、可重复使用的生物学元件及相互作用模型,例如启动子、操纵子、蛋白编码序列、核糖体结合位点、终止子以及元件间相互作用模型,这些元件可用于基因回路以及生物系统的模型驱动设计。

(4)合成元件库(Inventory of Composable Element,ICE)。ICE由美国能源部联合生物能源研究所(Joint BioEnergy Institute,JBEI)开发,是一个开源生物元件信息管理平台,包含质粒、菌株以及各种标准DNA元件。ICE基于网络注册理念创建,既可以通过网络浏览器访问,也可以通过网络应用程序接口访问。

(5)标准生物元件知识库(Standard Biological Parts Knowledgebase,SBPkb)。标准生物元件知识库由华盛顿大学的研究人员创建,可查询和检索用于合成生物学研究的标准化生物元件。SBPkb将生物元件信息转换为可以利用合成生物学元件语义框架进行计算的信息,这个框架被称为合成生物学公开语言语义(Synthetic Biology Open Language-semantic, SBOL-semantic),SBOL也是目前合成生物学领域进行元件设计的标准语言。

(6)合成生物学数据与元件库(Registry and Database of Bioparts For Synthetic Biology)。这是中国科学院于2016年创建的国内第一个合成生物学元件库,其包括生物元件、底盘细胞、化合物、途径、基因组及模型等多类数据信息与实体。该库通过对公共数据库的序列进行筛选整合,共获得36万个催化元件信息,其中7万多个催化元件的表征信息具有实验数据支持。

1.4 主要技术方法

合成生物学的主要技术方法包括DNA合成、DNA测序、DNA组装、基因编辑、密码子扩展、非细胞合成以及定向进化等。本节将重点介绍DNA合成、DNA测序、DNA组装、基因编辑和定向进化。

1.4.1 DNA合成

DNA合成(DNA synthesis)技术是指按照预定的核苷酸序列,将脱氧核苷酸逐个进行人工链接合成DNA的方法,使人们可以从信息和原始化学物质出发,在不依赖DNA模板的情况下直接构建遗传物质。高通量、快速、低成本的DNA合成是合成生物学领域的核心技术。

DNA合成一般采用固相亚磷酰胺三酯法,这种方法具有高效、快速偶联等优点,已在DNA化学合成中得到广泛应用。其反应过程主要是单个碱基经过保护基(deblocking)、活化(activation)、连接(coupling)、封闭(capping)和氧化(oxidation)5个步骤连接到位于固相载体的DNA片段上,重复上述步骤可获得DNA粗片段,对粗片段再进行切割、脱保护基、纯化,即可得到目标DNA片段。合成的DNA片段构建到质粒中,并转入细胞进行复制。

除此之外,DNA合成的方法还有柱式合成酶促合成。柱式合成方法具有可合成任意序列、准确性高等优势,但其通量较低,无法满足未来DNA合成需求;酶促合成方法具有低成本、高保真、高效率等优势,但相关技术尚未成熟,其发展存在一定的不确定性。

近年来,DNA微阵列原位化学合成法得到了飞速发展和广泛应用。这种方法是在固相亚磷酰胺三酯法的基础上,整合分子生物学、微电子学、光电化学等学科的相关技术,实现DNA序列的并行高通量合成。DNA合成技术使研究人员可以在缺少DNA模板的情况下“从头开始”设计与合成DNA分子,进而在不同维度上实现基因元件、基因线路、信号通路及复杂生命体的设计与构造。

1.4.2 DNA测序

测序是重建DNA样本中核苷酸原始顺序的过程。DNA测序(DNA sequencing)技术分为一代Sanger测序、二代以Illumina测序平台为代表的高通量测序和三代单分子测序。1977年,Maxam和Gilbert等发明的化学降解法与Sanger等发明的双脱氧核苷酸末端终止法,标志着一代测序技术的诞生。Sanger测序技术是通过核酸模板在核酸聚合酶、引物、4种单脱氧核苷酸存在的条件下,在4管反应体系中分别按比例引入4种脱氧核苷酸,反应终止后用凝胶电泳分离大小不同的片段。其技术流程为文库制备、测序反应、测序示踪和计算机分析。

目前普遍使用的是二代测序技术,即以大规模并行方式读取相对较短的序列(片段),其步骤如下。

(1)将长序列切割为片段并使用聚合酶链反应(polymerase chain reaction,PCR)扩增。

(2)将DNA接头序列连接到扩增完成后的各条DNA链的两端。

(3)将双链DNA分离成单链并加入玻璃流动池,接头序列与流动池表面上的互补片段结合,并局部复制以产生相同DNA克隆簇。

(4)将被荧光标记的互补核苷酸加到每个克隆簇中的单链DNA末端,记录荧光颜色对每个克隆簇中的DNA进行测序。

(5)被荧光识别到的碱基结果会以文本格式存储。

二代测序技术具有成本低廉、快速和准确等特点,但其使用的短读长测序方式对片段长度具有严格限制。

以Oxford Nanopore Technologies公司的纳米孔单分子测序技术和Pacific Biosciences公司的single molecule real-time(SMRT)测序技术为代表的三代单分子测序技术近年来受到了学术界的广泛关注。与前两代测序技术相比,三代测序技术的特点是通过单分子测序实现长片段测序,从根本上改变测序数据的结构,提高测序能力。其中,SMRT测序技术利用荧光信号进行测序,而纳米孔单分子测序技术则利用不同碱基产生的电信号进行测序。纳米孔单分子测序技术的仪器小巧便携、成本较低且无须复杂的建库过程,使其可应用于快速、实时的基因测序中,在科学研究和临床应用中都有着非常重要的意义,具有广阔的应用前景。

1.4.3 DNA组装

DNA组装(DNA assembly)是指通过特定技术实现DNA序列的“切”和“连”,其是合成生物学的基础技术之一。在合成生物学和生物工程领域,遗传元件无缝拼接以及重复DNA序列串联,都需要用到高效的 DNA 组装技术,只有这样,才能满足发展迅速的基因组设计合成领域的需求。

基于酶切连接策略的DNA组装方法广泛应用于迭代DNA组装,主要有寡核苷酸组装方法、BioBrick方法、Golden Gate方法、Gibson方法以及TPA方法。现有的DNA合成方法较为有限,无法直接准确合成长片段DNA。对此,我们可以采用分级的体外与体内组装技术,将分段合成的寡核苷酸片段组配成长片段DNA,进而实现长片段基因甚至基因组的合成。

(1)寡核苷酸组装方法。寡核苷酸组装方法主要应用于长片段基因或基因组的合成。目前应用得较为广泛的寡核苷酸组装方法有连接酶组装法(ligase chain reaction,LCR)和聚合酶组装法(polymerase cycling assembly,PCA)两种。LCR通过DNA连接酶将首尾相连、重叠杂交的5′磷酸化寡核苷酸片段连接成双链DNA;PCA则利用DNA聚合酶延伸杂交的重叠寡核苷酸片段获得不同长度的混合物,最后用引物扩增出成功组装的基因全长片段。PCA具有良好的兼容性,也被应用于芯片合成的寡核苷酸组装。

(2)BioBrick方法。双链 DNA的拼接是依靠限制性内切酶产生的黏性末端来串联DNA片段。基于这一方法发展而来的BioBrick技术由Knight研究组于2003年提出。该方法通过一对同尾酶和两个非同尾酶将载体和DNA元件标准化并形成元件库,随后标准化的元件通过DNA连接酶作用根据顺序依次组装起来。基于作用位点的不同,BioBrick技术可以使用不同的同尾酶发挥不同的作用。虽然该方法实现了元件的标准化和DNA组装的便捷化,但由于两个DNA元件之间有6个碱基对的残痕,元件组装通量较低。之后出现的BglBrick方法和ePathBrick方法通过将残痕转化为融合蛋白的连接肽,成功解决了这个问题,推动了组装技术的发展。

(3)Golden Gate方法。Golden Gate 方法采用IIS型限制性内切酶切割产生的黏性末端来实现组装,由于IIS型限制性内切酶识别位点与切割位点有所不同,Golden Gate 技术可以自由地设计黏性末端,从而实现同时组装多个DNA片段,大大提高了DNA组装的效率。例如,Engler 等人用Golden Gate方法进行一步酶切连接,结合基因改组(gene shuffling)技术,一次性完成了3个片段与载体的拼接,构建了理论上可达19683种不同的重组胰蛋白酶原基因,得以筛选高效表达的胰蛋白酶突变体。

(4)Gibson方法。Gibson方法由Gibson于2009 年开发,是一种简单、快速、高效的DNA定向无缝克隆技术,可将插入片段(PCR产物)定向克隆至任意载体的任意位点。Gibson方法的原理可以概括为三步反应:首先,T5核酸外切酶从DNA片段的5′端切割一条链,产生的单链DNA末端(overhang)两两配对,形成一个有间隙(gap)的环状DNA;其次,Phusion DNA聚合酶通过DNA合成填补间隙,产生一个只有缺刻(nick)的环状DNA;最后,Taq DNA连接酶通过形成磷酸二酯键修复缺刻,得到一个完整的双链DNA或质粒。相比其他DNA组装方法,Gibson方法连接利用的是片段间的长重叠区域,更特异性地确保了连接顺序,同时做到了无缝拼接,使得组装尺度扩大到了百kb级左右。

(5)TPATwin-Primer Assembly)方法。与上述几种酶依赖性DNA组装方法不同,TPA方法不需要酶的参与。TPA方法是由赵惠民团队于2017年提出的一项双引物非酶促DNA组装的高效准确的多片段DNA组装方法。其原理可分为两步:首先,设计出长短、上下不同的4种引物,并利用聚合酶链式反应,分别对设计的片段进行扩增;其次,将得到的正确的扩增片段通过退火组装成一个质粒,验证正确后转化到菌内即可。TPA方法在不使用酶的条件下,将聚合酶链式反应扩增的片段组装成质粒,具有广阔的应用前景。

1.4.4 基因编辑

基因编辑技术(gene editing technology)又称为基因组编辑(genome editing),是一种以特异性改变遗传物质靶向序列为目标基因,通过删除、替换、插入等操作,获得新的功能或表型,甚至创造新的物种。

从最初的基因打靶技术到锌指核酸酶(zinc finger nuclease,ZFN)、类转录激活因子效应核酸酶(transcription activator-like effector nuclease,TALEN)以及CRISPR(clustered regularly interspaced short palindromic repeats)/Cas9系统,再到以碱基编辑技术为代表的新兴技术的出现,基因编辑技术经过不断的发展和完善,变得更加灵活、高效。基因编辑技术的发展和应用在农业育种和作物改良以及人类疾病的基因治疗方面展现出巨大的潜力,开创了全球生命科学研究的新时代。

(1)ZFN作为第一代基因编辑技术,ZFN使用同时包含DNA识别结合域(锌指蛋白结构域)和DNA裂解域的核酸酶(限制性核酸内切酶FokⅠ的核酸酶切活性区域)形成的能够产生位点特异性DSB的系统来执行基因编辑功能。ZFN由Chandrasegaran团队于1996年提出。ZFN的α螺旋中的1、3、6位的氨基酸分别特异性地识别并结合DNA序列中的3个连续的碱基,这也使得锌指核酸酶能定位于复杂基因组内的独特的靶向序列。利用内源DNA修复机制,锌指核酸酶可用于精确修饰高等生物的基因组。然而,ZFN的序列特异性也使得其具有目标识别率低、成本高等特点,限制了它的大范围应用。

(2)TALEN。TALEN同样使用同时包含DNA识别结合域和DNA裂解域的核酸酶。与ZFN不同的是,TALEN将TALE蛋白与FokⅠ内切酶区域加以结合。由于4种碱基都有各自对应的TALE模块,因此TALEN可以通过目标序列的不同组装不同的TALE识别模块,加强了其设计的简便性。但其目标识别率低、成本高、脱靶概率高、结构复杂等问题仍未得到解决。

(3)CRISPR/Cas9系统。学术界对于便捷、识别率高的基因编辑技术的渴望推动了新一代基因编辑技术的发展,CRISPR/Cas9系统源于细菌中的适应性免疫系统,可直接用于基因突变或基因敲除。CRISPR/Cas9的基本原理是利用向导 RNA介导 Cas 蛋白在特定的靶标序列处引起 dsDNA的断裂,然后利用同源重组方法进行精准的 DNA序列替换或利用非同源末端连接方法进行靶标基因的中断。CRISPR/Cas9系统通过CRISPR RNA(crRNA)和trans-activating crRNA(tracrRNA)以及Cas9蛋白组成的复合体抵御外源性DNA的入侵。Cas9是一种与sgRNA结合的核酸酶,通过sgRNA中存在的一个20 bp的核苷酸序列,将Cas9激活并靶向到一个特定的基因组位点(称为原间隔子邻近基序或PAM位点)。Cas9随后催化一个靠近PAM位点的DSB,NHEJ修复低保真度的DSB将在酶切位点形成一个小的插入/删除,从而在目标位点内进行突变。与ZFN和TALENs相比,CRISPR/Cas9系统具有操作简单、成本低、编辑位点精确、脱靶率低等特点,其基因编辑效率超过30%,大大降低了基因编辑的时间成本和经济成本。其在抗生素耐药菌、COVID-19检测、癌症治疗、高产水稻品种的生产等方面皆有大量的应用。

(4)碱基编辑器。单碱基编辑技术可以实现对单碱基的精准编辑,大大降低了编辑过程中对靶基因功能的影响。2016年,美国哈佛大学David Liu的实验室使用专门设计的Cas9融合蛋白开发了一个单碱基编辑器,即胞嘧啶碱基编辑器(cytosine base editor,CBE)。2017年,David Liu还公布了其开发的腺嘌呤碱基编辑器(adenine base editor,ABE),该编辑器通过使用腺嘌呤脱氨酶促进腺嘌呤(A)突变为鸟嘌呤(G)。当含有腺嘌呤脱氨酶的Cas9融合蛋白被sgRNA靶向到基因组DNA时,腺嘌呤脱氨酶催化腺嘌呤脱氨生成肌苷(I),肌苷被读取并复制为鸟嘌呤残基。因此,在DNA复制后,A-T碱基对直接取代了G-C碱基对。目前,单碱基编辑器已应用于基因编辑、基因治疗、生成相关动物模型和功能基因筛选。

2020年,Dali Li团队通过融合激活诱导的人胞嘧啶脱氨酶、腺嘌呤脱氨酶和nCas9,开发了一种新型的双功能、高活性碱基编辑器,并将其命名为A&C-BEmax。A&C-BEmax可以有效地转化同一等位基因内目标序列上的C > T和A > G,双碱基编辑技术由此应运而生。同时,中国科学院遗传学研究所的Caixia Gao和Jiayang Li在nCas9的N端融合了胞嘧啶脱氨酶APOBEC3A和腺嘌呤脱氨酶ABE7.10,并通过此种方法成功构建了4种新型的饱和靶向内源性基因突变编辑器(saturated targeted endogenous mutagenesis editor,STEME),依次将其命名为STEME-1STEME-4。这些碱基编辑器具有在单一sgRNA的引导下诱导C > T和A > G靶位点同时突变的明显优势,还显著提高了靶基因的饱和度和突变类型的多样性。

单碱基编辑器只能催化单一碱基类型的转换,限制了其广泛的应用。使用双碱基编辑技术可以同时有效地产生两种不同的碱基突变,极大地丰富了碱基编辑的手段,使得基因编辑过程在不失精准性的条件下更加快捷。

(5)转座子类编辑技术。一般来讲,基因编辑技术依赖于DNA断裂,这通常会导致错误被放置在链断裂修复部位的DNA中,同时会触发DNA损伤反应,从而导致其他不良的细胞反应。因此,研究人员试图利用转位现象,在不破坏目标位点的情况下插入所需的DNA序列,而不破坏细胞。转座子可以整合到细菌基因组的特定位点,而不需要消化DNA。重要的是,整合酶插入DNA的位点完全由它们相关的CRISPR系统控制。采用转座子类编辑技术,可以将任何DNA序列插入细菌基因组中的任何位置。对编辑后的细菌进行测序,在非目标位置没有额外的拷贝的条件下,证实了整合可以实现精确的插入。2019年6月,张锋的团队从一种蓝细菌——贺氏伪枝藻(Scytonema hofmanni)中获得了与CRISPR效应蛋白Cas12k相关的转座酶,并构建了名为CAST的系统,该系统将nCas9与单链DNA转座子TNPA偶联,然后检测大肠杆菌基因组中的蛋白复合物,促进了外源DNA的位点特异性整合。

1.4.5 定向进化

从生物化学和分子生物学的角度来讲,定向进化(directed evolution)是指模仿自然进化过程,通过基因多样化和突变库筛选的迭代循环,加速实现在胞内或胞外进行的自然进化过程。定向进化可以在不了解蛋白质的结构和作用机制的前提下,获得期望功能或全新功能的蛋白质。“定向进化”这一概念于20世纪90年代由生物工程学家Frances Arnold教授提出,在酶工程领域中发挥着重要作用。

近年来,包括高效构建基因突变库的方法、高通量筛选突变库的方法、连续定向进化策略、自动化生物合成平台助力定向进化在内的策略,提升了定向进化的效率,使得突变库的筛选速率提高了百倍以上。

(1)高效基因突变库构建方法。构建高效、多样化的基因突变库是定向进化的基础。目前主要的构建方法有体外突变法体内突变法。体外突变法主要包括可以产生随机突变的易错PCR、DNA改组等。通过将这些传统方法与基因高通量合成技术及 DNA 测序技术相结合,传统的体外突变法存在的共有缺陷(如密码子缺乏控制、具有序列偏好性等)在一定程度上得到了改善。例如,通过采用半理性设计突变氨基酸的方法,将PCR 反扩载体与 T5 介导的克隆方法联用,构建了突变效率高达81.25%的柠檬烯环氧水解酶4个位点组合突变体库,成功实现了对定点饱和突变库构建方法的改进。体内突变法则通过基于CRISPR-Cas 系统的高效胞内蛋白质定向进化工具,对参与同一代谢途径的多个蛋白进行定向进化。

(2)新型高通量筛选技术。开发更快速、灵敏、准确的高通量筛选技术,可以最大程度地创建序列覆盖率高、多样性强的突变库,同时能最大程度地发掘不同氨基酸序列与其对应表型之间的关系。例如,利用文库展示技术进行突变库的高通量筛选,在蛋白质工程中得到了广泛的应用,包括噬菌体展示技术、细胞表面展示技术、核糖体展示技术以及mRNA展示技术。

文库展示技术(library-based display)将突变的目标蛋白展示于不同的生物体表面,并对蛋白质进行直接干扰,使蛋白质与外部环境接触,从而影响蛋白质的降解程度和折叠状态,之后通过一定的方法富集、筛选蛋白质检测出相关的基因信息。其中,噬菌体展示技术有力地促进了蛋白质工程的发展,其将蛋白基因插入噬菌体外壳蛋白结构基因的适当位置,随着噬菌体的传代,融合蛋白会展示在噬菌体的表面,对应的编码基因则位于病毒颗粒内,大量蛋白由此与其 DNA编码序列建立了直接联系,使各种靶分子(抗体、酶等)的配体通过“吸附、洗脱、扩增”得到快速鉴定。除此之外,细胞表面展示技术、核糖体展示技术以及mRNA展示技术也可应用于突变库的筛选。一些微型化、自动化和集成化的新型技术体系也为一些代谢途径关键酶、优势菌株、催化元件在定向进化过程中的高通量筛选和选择提供了优良的解决方案。

(3)连续定向进化。连续定向进化旨在无人为干预的情况下完成基因突变、蛋白表达、表型选择与筛选的迭代实验,其通过缩短每轮的进化时间来增加迭代次数,利用可自我复制的生物体,提高获得目标性状突变体的概率,在其基因组复制过程引入突变并利用突变后该生物体复制扩增能力的差异性变化来实现建库与筛选这两个步骤的自动连接和迭代循环,从而减少人力劳动,使定向进化快速进行。例如,David Liu团队开发了噬菌体辅助的连续进化系统(phage-assisted continuous evolution,PACE),通过设计特定的基因回路,将 pⅢ的表达与目标蛋白的活性相偶联,再通过控制系统使得含有目标活性突变体的噬菌体迭代富集,从而实现进化与筛选自动循环——可以在24h内完成30轮以上的蛋白质进化。

(4)计算机辅助定向进化。如果说定向进化的关键在于对突变库的高效筛选,那么计算机辅助定向进化(主要是采用机器学习技术)可以通过构建输入数据到输出数据的复杂函数关系,并通过相关训练模型对训练集以外的序列空间进行探索,因此在筛选和收集正向突变方面有着巨大的优势。不同的算法及软件,如Modeller、Rosetta以及AlphaFold 2等在内的多种方法已广泛用于蛋白质结构的预测。其中,AlphaFold 2采用了生物信息学和物理方法相结合的双重预测方法。例如,George Carman课题组利用 AlphaFold 2预测了突变的酿酒酵母磷脂酸磷酸酶的结构,通过其结构发现了其催化关键位点并推测了其催化活性机理。尽管计算机辅助定向进化受到用于训练模型的数据的数量和质量的限制,但大量的研究已证明这的确是定向进化方向颇具发展前景的方法。计算机辅助定向进化已应用于酶结构与底物属性的预测、反应最佳微环境的预测以及酶最佳催化位点的预测。可以说,随着计算机技术和生物技术的进步,以及序列-功能对数据的不断增长,在酶分子的定向进化过程中,机器学习技术会在探索未知酶序列信息以及空间结构中发挥越来越重要的作用。

1.5 里程碑成果

合成生物学通过对生命系统的重新设计和改造,推动生物技术实现了新的飞跃。基于染色体及基因组工程、元件工程、合成细胞工程、生物大数据技术等工程生物学技术,将原有的生物技术提升到工程化、系统化和标准化的高度,极大地提升生物技术的水平,为构筑未来工程生物学奠定基础。

就合成生物学的发展而言,从基因组合成、基因调控网络与信号转导路径到细胞的人工设计与合成,完成了单基因操作难以实现的任务。随着生物计算模拟、低成本DNA 合成、标准化生物元器件构建、基因组编辑等核心技术的不断突破,设计合成可预测、可再造和可调控的人工生命体系成为可能。另外,高通量筛选和自动化技术的应用,使生物元件与通路的合成、功能测试等实现自动化,将显著增强“合成”与“测试”的能力。同时,合成生物学与信息技术、材料技术、纳米技术等融合发展,还将催生一系列新的前沿技术和方向,例如合成生物电子学、合成生物半导体、合成生物计算机及信息存储、合成生物传感、合成生物材料、合成生物器官芯片、合成生物诊疗等。

合成生物学的里程碑成果体现在合成能力的飞速发展、核心技术的不断升级和创新应用成果凸显这三方面。

1.5.1 合成能力飞速发展

人工基因组合成是指在工程学思想的指导下,借助计算机工具设计具有特定功能的人工基因组,并利用 DNA 从头合成和模块化组装技术构建人工设计基因组,使其实现预期功能。2002年,纽约州立大学石溪分校的Eckard Wimmer通过化学合成病毒基因组获得了具有感染性的脊髓灰质炎病毒,这是人类历史上首个人工合成的生命体;2008年,美国Craig Venter研究所合成了5.8×105个碱基对的生殖道支原体全基因组,首次实现了人工合成微生物基因组;2010年,美国Craig Venter研究所宣布了首个“人工合成基因组细胞(JCVI-syn1.0)”的诞生,其设计、合成和组装了1.08Mb的支原体基因组,并将其移植到山羊支原体受体细胞中,产生了仅由合成染色体控制的支原体细胞,这标志着人工合成基因组实现了对生命活动的调控。这项工作在科学界引起了巨大反响,使“合成生物学”进入了大众的视野。2012年,美国约翰·霍普金斯大学开始着手酵母染色体人工版本(Synthetic Yeast Genome Project,Sc2.0)的合成,这是首次挑战真核细胞基因组的合成,该项目由美国、中国、英国、法国、澳大利亚、新加坡等多国研究机构参与并分工协作。Sc2.0旨在设计和完全化学合成16条染色体,这些染色体包含来自啤酒酵母的1250万个碱基和一个带有所有 tRNA 基因的“新染色体”,删除了转座子、内含子等非必需遗传元件,人工酵母基因组序列精简了6%。该项目不仅为真核染色体的系统研究提供了一个平台,还通过其“从构建到理解”的过程扩展了生物学知识的范围。目前,人工合成基因组生物已涵盖了病毒、原核生物和真核生物,预定特性的人造细胞已悄然实现,这是生命体系从自然发生到人工产生的一个转折点。

近年来,人工基因组合成不断取得突破性技术进展。最小基因组的合成不但增进了人类对细胞行为和机制的理解,也为科学研究和生物制造产业提供了优质的底盘细胞;密码子扩展和非天然氨基酸技术的应用实现了全新生命体的创建,拓展了人工基因组合成新策略和形式。2011年,利用多重自动基因组工程在32个大肠杆菌菌株中完成了同义终止密码子替换,实现了对大肠杆菌基因组314 个TAG到TAA终止密码子的转换。2014年,美国科研人员设计合成了一个非天然碱基配对, 并将它们整合到大肠杆菌基因组,首次扩展了生命遗传密码,使未来的生命形式有无限可能。2016年,美国Craig Venter研究所合成了最小支原体基因组JCVI-syn 3.0,精简了大量非必需基因和半必需基因,使其仅含有473个基因,基因组大小为531000个碱基对,这种细菌具有已知生物体中规模最小的基因组。2018年,我国研究人员将单细胞真核生物酿酒酵母的16条天然染色体人工创建为具有完整功能的单条染色体,构建出世界首例人造单染色体真核细胞,为利用极简生命形式理解染色体进化、研究生命本质开辟了新方向;2019年,美国研究人员将4种合成核苷酸与4种天然核苷酸组合,构建出由8种核苷酸组成的DNA,这些DNA分子的形状和行为都具有一定的可行性,可以转录为RNA,极大地扩展了核酸储存的信息密度等;同年,精简了丝氨酸密码子TCG、TCA和终止密码子TAG,完成了大肠杆菌基因组1.8万个密码子的转换,构建了仅有61个密码子的大肠杆菌基因组。

1.5.2 核心技术不断升级

在生物元件和基因线路的设计构建方面,自2000年人工合成首个生物开关和压缩振荡子后,多种优质调控元件和更复杂的基因回路等相继出现。随着国际基因工程机器大赛举办以及合成生物学定义在国际范围内得到广泛认可,许多令人惊叹的科研成果横空出世,元件和线路设计的里程碑式研究不断出现,揭示了生物系统“有序性”的形成原理,为合成生物学家从头设计复杂生命体系提供了重要理论指导。例如,基于共转录tRNA构建出翻译层面的AND逻辑门;群感系统被进一步改造用于实现多细胞模式;感应线路的开发可以在细胞内将光输入转化为基因表达。设计全新蛋白质及其功能方向也不断有新进展。尤其是基于新一代人工智能系统精确预测蛋白质的三维结构,其准确性已接近冷冻电子显微镜、X射线晶体学等实验技术,为全新蛋白质的设计奠定了基础。

遗传物质的编辑、合成和组装技术是合成生物学的基础,因此基因编辑技术的发展能够极大推进合成生物学的广泛应用,同时合成生物学可以促进现有的基因组编辑工具的优化。从 2012 年起,科学家利用 CRISPR/Cas9系统的可编程和精准切割等特点陆续开发了一系列基因组编辑的工具,其宿主目前已经覆盖了从细菌到高等生物的范围,在复杂基因线路设计、微生物基因组编辑等合成生物学领域取得了突破性进展。例如,Wu等人在大肠杆菌中应用CRISPRi系统对糖酵解途径、TCA 循环、脂肪酸合成途径进行调控,实现了类黄酮的增产;利用合成生物学技术和CRISPR基因编辑技术,开发了高适应性、高敏感度的CRISPR分子诊断方法,针对多类病原的CRISPR分子诊断方法已进入临床研发阶段。

合成生物学底盘细胞的改造与构建,是实现“造物致知”和“造物致用”目标的重要手段,也将为构建细胞工厂提供优良的底盘。英国布里斯托大学的研究人员采用自下而上的策略设计了一种新型人造合成细胞,他们将大肠杆菌和铜绿假单胞菌两种细菌菌落与微滴混合在黏稠的液体中,打破细菌膜,使细菌溢出其内容物——这些内容物被液滴捕获以产生膜包被的原始细胞。研究人员已证实,这些细胞能够进行复杂的处理,例如通过糖酵解产生能量储存分子腺苷三磷酸(adenosine triphosphate,ATP),以及基因的转录和翻译。这是首次利用原核细胞构建类真核细胞体系,对合成生物学具有很大的帮助。丹麦科技大学和加州大学伯克利分校的研究团队通过56次基因编辑对酵母细胞进行基因工程改造(涉及 30 个合成步骤),以生物合成抗癌药物长春碱和长春新碱,这是目前为止利用微生物作为细胞工厂进行生物合成的最长合成线路,未来可以作为一种生产平台生产更多的生物分子。

1.5.3 创新应用成果凸显

近年来,全球面临日趋严峻的能源资源短缺、生态环境恶化、粮食安全、疾病危害等挑战,高质量、高效率、可持续和主动健康成为生物产业发展和变革的主要方向,也是合成生物学的重要使命。设计功能强大、性能优越的人工生物系统,可实现燃料、材料及各类高值化学品的产业转型升级和绿色发展;重塑构建植物的信号或代谢通路,可实现高效光合、固氮和抗逆,破解农业发展的资源环境瓶颈约束;创建人工细胞工厂,可实现稀缺天然产物、药物的高效合成,推进医药健康产业的高质量发展;设计构建疾病发生发展的人工干预途径,可实现基因治疗、干细胞治疗、免疫治疗等生物治疗领域的新突破;人工合成微生物及群落,可大幅提升环境污染监测、修复和治理能力,助力健康环境和生态文明建设。

在生物制药领域,合成生物学通过设计和构建人工细胞工厂,为复杂天然产物的绿色高效合成提供了新的思路,在氨基糖苷类抗生素、核苷类抗生素、核糖体肽、萜类以及聚酮类化合物等天然药物生物合成方面已经取得了诸多应用成果。通过设计和构建人工细胞工厂,Paddon等人在酵母菌中成功生产出青蒿素前体,将其产量从100mg/L提升到25g/L,成为合成生物学成果产业化的里程碑事件。斯坦福大学的研究人员在酵母菌中实现完全合成阿片类药物,他们将植物、细菌和啮齿动物基因混合导入酵母菌中,用改造过的酵母菌成功地将糖转化为蒂巴因——吗啡等止痛药物的前体。Wang等人在代谢水平上清晰阐明链霉菌初级代谢到次级代谢的代谢转换机制并进行工程应用,为实现聚酮类药物乃至其他次级代谢生物活性产物高效、绿色的生物制造开辟了新思路。近年来,我国研究人员利用合成生物学技术改造的高产药物菌株开始投入工业化生产,实现了纳他霉素、玫瑰孢链霉菌达托霉素、他克莫司等药物的生物合成。

在健康医疗领域合成生物学可以利用细胞装备生物传感器检测疾病靶标,并通过响应环境刺激来调控效应分子,激活下游信号通路,其以工程化细胞为基础的新型治疗方法为传统医学难以解决的问题提供了新思路和新手段。2017年,FDA批准了第一个CAR-T细胞治疗药物;Krawczyk等人利用合成生物学方法工程化改造人胰岛β细胞,并利用定制的生物微电子设备实现对胰岛素合成和释放的精准调控,这是继光、磁、无线电波、超声等基因调控系统之后,又一项极具应用前景的远程调控细胞功能的技术;Nissim等人构建了可响应细菌密度、氧含量和葡萄糖浓度等多种调控信号的生物传感器,能够实现响应肿瘤微环境驱动抗癌基因表达并释放抗癌分子。此外,我国研究人员将含有组织型纤溶酶原激活剂信号肽基因的全长S基因克隆到工程化复制缺陷型人5型腺病毒中,构建出了有效的人体腺病毒载体新冠疫苗,还开发出了融合佐剂效应的人工设计纳米颗粒疫苗,能够有效增强体液免疫和细胞免疫效果。

在化学品合成领域,合成生物学研究已应用于第二代生物乙醇、生物柴油等生物燃料产品的研发。研究人员以工程化微生物作为底盘细胞,实现了乙醇、1,4-丁二醇、聚羟基脂肪酸酯等燃料的高效率、低成本和多样化生产,开辟了微生物工程化炼制能源新途径。例如,加州大学的研究人员通过改变大肠杆菌的氨基酸生物合成途径首次成功合成长链醇燃料——其具有更高的能量密度,有望成为理想的替代生物燃料。此外,人工改造的藻类可通过光合作用合成生物石油,具有打造规模化生物燃料工业生产“细胞工厂”的发展空间。根据麦肯锡统计,未来生物制造将覆盖约60%的化学品合成,合成生物学技术在能源、化工等领域具有改变世界工业格局的潜力。

在农业与食品领域,我国研究人员从头设计并构建了11步反应的非自然固碳与淀粉合成途径,在实验室中首次实现从二氧化碳到淀粉分子的全合成;Lin等人在水稻和小麦原生质体中利用引导编辑系统实现16个内源位点的精准编辑,为植物基因组功能解析及实现作物精准育种提供了重要技术支撑。细胞培养肉技术是近年来兴起的一种新型食品合成生物技术,其通过大规模培养动物细胞获得肌肉、脂肪等组织,再经食品化加工生产得到肉类食品。研究人员通过构建正反馈基因线路设计等合成生物学技术改造和优化了巴斯德毕赤酵母,可生成大豆血红蛋白,然后将其添加到人造肉饼中以模拟肉的口感和风味;已有研究人员通过基因工程和细胞工程等技术手段高效表达天然奶中的各种乳蛋白组分,陆续剔除乳糖、胆固醇、抗生素和致敏原等不良因子,获得了人造乳制品。2022年,耶路撒冷希伯来大学证明了几个鸡品种的成纤维细胞自发永生化和遗传稳定性,估计生产成本为每磅[1]1.84.5美元,是一种具有成本效益的细胞培养鸡肉生产方法。

[1] 1磅等于0.45359237千克。——编辑注

在生物计算领域,2012年和2013年,NatureScience分别刊登了哈佛医学院George Church等人和欧洲生物信息研究所Goldman等人在DNA数据存储领域的研究成果,这两项研究的成功有赖于DNA合成和测序技术的巨大进步,使得合成与读取数以万计的DNA分子成为可能。在此之后,DNA数据存储领域的新进展如雨后春笋般涌现。例如,天津大学合成生物学科研团队创新DNA存储算法,通过将 DNA合成技术与纠错编码结合,将10幅敦煌壁画存入DNA,并证实壁画信息在实验室常温下可保存千年,证实了DNA分子已成为世界上最可靠的数据存储介质之一。美国华盛顿大学开发了用于体内分子记录的“DNA打字机”,记录和解码了数千个符号、复杂事件历史和短文本消息,结合单细胞测序重建3257个细胞的单系谱系,展示了一个能在活真核细胞内运行的人工数字系统。生物分子计算伴随着合成生物学的兴起而不断发展,DNA等纳米材料不仅可用于逻辑运算,还可以构造神经网络,并从训练数据中进行学习,为在分子层面实现神经拟态计算提供了可能。以碳基生物合成材料作为计算机存储与运算介质,有望制造运算速度和存储能力大幅度增强的新型分子计算机,具备分析、判断、联想、记忆等功能,给经济社会发展和人类生活带来难以估量的颠覆性影响。

1.6 小结

本章主要概述了合成生物学的基本概念、本质与原理,介绍了常见的合成生物学技术方法,以及具有里程碑意义的研究成果,旨在让读者对合成生物学的基本理念和范畴有一定的了解。

人工智能是引领新一轮科技革命的战略性技术,作为计算机科学中解决“输入-输出”映射问题的技术,它与合成生物学中“输入-输出”的思想不谋而合。在生物系统的设计与改造中,人工智能模型是“设计-构建-验证-学习”循环的重要组成部分,促进了合成生物学智能化、自动化和一体化的革新,为构建合成生物学理论体系框架,升级迭代合成生物学使能技术提供了新的方法。

1.7 参考文献

[1] Watson J D,Crick F H. Molecular structure of nucleic acids: a structure for deoxyribose nucleic acid[J]. Nature, 1953, 171(4356): 737-738.

[2] Jacob F,Monod J. Genetic regulatory mechanisms in the synthesis of proteins[J]. J Mol Biol, 1961, 3: 318-356.

[3] Kelly T J Jr, Smith H O. A restriction enzyme from Hemophilus influenzae.Ⅱ[J]. J Mol Biol, 1970, 51(2):
393-409.

[4] Danna K, Nathans D. Specific cleavage of simian virus 40 DNA by restriction endonuclease of Hemophilus influenzae[J]. Proc Natl Acad Sci U S A, 1971, 68(12): 2913-2917.

[5] Szybalski W, Skalka A. Nobel prizes and restriction enzymes[J]. Gene, 1978, 4(3): 181-182.

[6] Jeff Gauthier, Antony T Vincent, Steve J Charette et al. A brief history of bioinformatics[J]. Brief Bioinform, 2019, 20(6): 1981-1996.

[7] Gardner T S, Cantor C R, Collins J J. Construction of a genetic toggle switch in Escherichia coli[J]. Nature, 2000, 403(6767): 339-342.

[8] Elowitz M B, Leibler S. A synthetic oscillatory network of transcriptional regulators[J]. Nature, 2000, 403(6767): 335-338.

[9] Cello J, Paul A V, Wimmer E. Chemical synthesis of poliovirus cDNA: generation of infectious virus in the absence of natural template[J]. Science, 2002, 297(5583): 1016-1018.

[10] Vincent J J Martin, Douglas J Pitera, Sydnor T Withers, et al. Engineering a mevalonate pathway in Escherichia coli for production of terpenoids[J]. Nat Biotechnol, 2003, 21(7): 796-802.

[11] Benner S A, Sismour A M, Synthetic biology[J]. Nature Reviews Genetics, 2005, 6(7): 533-543.

[12] 张先恩,中国合成生物学发展回顾与展望[J]. 中国科学:生命科学,2019, 49(12): 1543-1572.

[13] 赵国屏,合成生物学:开启生命科学“会聚”研究新时代[J]. 中国科学院院刊,2018, 33(11): 1135-1149.

[14] Khalil A S, Collins J J. Synthetic biology: applications come of age[J]. Nat Rev Genet, 2010, 11(5): 367-379.

[15] Cameron D E, Bashor C J, Collins J J. A brief history of synthetic biology[J]. Nat Rev Microbiol, 2014, 12(5): 381-390.

[16] Jordan Ang, Edouard Harris, Brendan J Hussey, et al. Tuning Response Curves for Synthetic Biology[J]. ACS Synthetic Biology, 2013, 2(10): 547-567.

[17] Evan J Olson, Lucas A Hartsough, Brian P Landry Olson, et al. Characterizing bacterial gene circuit dynamics with optically programmed gene expression signals[J]. Nature Methods, 2014, 11(4): 449-455.

[18] Premkumar Jayaraman, Kavya Devarajan, Tze Kwang Chua, et al. Blue light-mediated transcriptional activation and repression of gene expression in bacteria[J]. Nucleic Acids Research, 2016, 44(14): 6994-7005.

[19] Gen Nonaka, Matthew Blankschien, Christophe Herman, et al. Regulon and promoter analysis of the E. coli heat-shock factor, sigma32, reveals a multifaceted cellular response to heat stress[J]. Genes Dev, 2006, 20(13): 1776-1789.

[20] Guoliang Qing, Li-Chung Ma, Ahmad Khorchid, et al. Cold-shock induced high-yield protein production in Escherichia coli[J]. Nature Biotechnology, 2004, 22(7): 877-882.

[21] Alec A K Nielsen, Bryan S Der, Jonghyeon Shin, et al. Genetic circuit design automation[J]. Science, 2016, 352(6281): aac7341.

[22] Ying-Ja Chen, Peng Liu, Alec A K Nielsen, et al. Characterization of 582 natural and synthetic terminators and quantification of their design constraints[J]. Nat Methods, 2013, 10(7): 659-664.

[23] Anyuan Liu, Xiaoshuai Huang, Wenting He, et al. pHmScarlet is a pH-sensitive red fluorescent protein to monitor exocytosis docking and fusion steps[J]. Nat Commun, 2021, 12(1): 1413.

[24] Siying Qin, Hang Yin, Celi Yang, et al. A magnetic protein biocompass[J]. Nature Materials, 2016, 15(2): 217-226.

[25] Justus Niemeyer, David Scheuring, Julian Oestreicher, et al. Real-time monitoring of subcellular H2O2 distribution in Chlamydomonas reinhardtii[J]. The Plant Cell, 2021, 33(9): 2935-2949.

[26] Alina S Bilal, Erik A Blackwood, Donna J Thuerauf, et al. Optimizing Adeno-Associated Virus Serotype 9 for Studies of Cardiac Chamber-Specific Gene Regulation[J]. Circulation, 2021, 143(20): 2025-2027.

[27] Enrique Balleza, J Mark Kim, Philippe Cluzel. Systematic characterization of maturation time of fluorescent proteins in living cells[J]. Nat Methods, 2018, 15(1): 47-51.

[28] Jean-Denis Pédelacq, Stéphanie Cabantous, Timothy Tran,et al. Engineering and characterization of a superfolder green fluorescent protein[J]. Nat Biotechnol, 2006, 24(1): 79-88.

[29] Kosman D, Reinitz J, Sharp D H. Automated assay of gene expression at cellular resolution[J]. Pac Symp Biocomput, 1998: 6-17.

[30] Jesse Stricker, Scott Cookson, Matthew R Bennett, et al. A fast, robust and tunable synthetic gene oscillator[J]. Nature,2008,456(7221):516-519.

[31] Marcel Tigges, Tatiana T Marquez-Lago, Jörg Stelling, et al. A tunable synthetic mammalian oscillator[J]. Nature, 2009, 457(7227): 309-312.

[32] Tal Danino,Octavio Mondragón-Palomino,Lev Tsimring,et al. A synchronized quorum of genetic clocks[J]. Nature, 2010, 463(7279): 326-330.

[33] John E Dueber, Brian J Yeh, Kayam Chak, et al. Reprogramming control of an allosteric signaling switch through modular recombination[J]. Science. 2003, 301(5641): 1904-1908.

[34] Park S H, Zarrinpar A, Lim W A. Rewiring MAP kinase pathways using alternative scaffold assembly mechanisms[J]. Science, 2003, 299(5609): 1061-1064.

[35] Subhayu Basu, Rishabh Mehreja, Stephan Thiberge, et al. Spatiotemporal control of gene expression with pulse-generating networks[J]. Proc Natl Acad Sci U S A, 2004, 101(17): 6355-6360.

[36] Ye Chen, Jae Kyoung Kim, Andrew J Hirning, et al. SYNTHETIC BIOLOGY. Emergent genetic oscillations in a synthetic microbial consortium[J]. Science, 2015, 349(6251): 986-989.

[37] Dae-Kyun Ro, Eric M Paradise, Mario Ouellet, et al. Production of the antimalarial drug precursor artemisinic acid in engineered yeast[J]. Nature, 2006, 440(7086): 940-943.

[38] 李金玉,杨珊,崔玉军,等,细菌最小基因组研究进展[J]. 遗传,2021, 43(02): 142-159.

[39] Monica Riley, Takashi Abe, Martha B Arnaud, et al. Escherichia coli K-12: a cooperatively developed annotation snapshot-2005[J]. Nucleic Acids Res, 2006, 34(1): 1-9.

[40] Endy D. Foundations for engineering biology[J]. Nature, 2005, 438(7067): 449-453.

[41] Canton B, Labno A, Endy D. Refinement and standardization of synthetic biological parts and devices[J]. Nat Biotechnol, 2008, 26(7): 787-793.

[42] Michal Galdzicki, Cesar Rodriguez, Deepak Chandra, et al. Standard biological parts knowledgebase [J]. PLoS One, 2011, 6(2): e17005.

[43] 常汉臣, 王琛, 王培霞, 等. DNA 组装技术[J]. 生物工程学报, 2019, 35(12): 2215-2226.

[44] Douglas Densmore, Timothy H-C Hsiau, Joshua T Kittleson, et al. Algorithms for automated DNA assembly[J]. Nucleic Acids Res, 2010, 38(8): 2607-2616.

[45] Shetty R P, Endy D, Knight Jr F. Engineering BioBrick vectors from BioBrick parts[J]. J Biol Eng, 2008, 2: 5.

[46] Smolke C D. Building outside of the box: iGEM and the BioBricks Foundation[J]. Nat Biotechnol, 2009, 27(12): 1099-1102.

[47] Cooling M T, Rouilly V. Misirli G, et al. Standard virtual biological parts: a repository of modular modeling components for synthetic biology[J]. Bioinformatics, 2010, 26(7): 925-931.

[48] Timothy S Ham, Zinovii Dmytriv, Hector Plahar, et al. Design, implementation and practice of JBEI-ICE: an open source biological part registry platform and tools[J]. Nucleic Acids Research, 2012, 40(18): el41-e141.

[49] Caruthers M H, Barone A D, Beaucage S L, et al.Chemical synthesis of deoxyoligonucleotides by the phosphoramidite method[J]. Methods in enzymology, 1987, 154: 287-313.

[50] 闫汉, 肖鹏峰, 刘全俊, 等. DNA微阵列原位化学合成[J]. 合成生物学, 2021, 2(3): 354-370.

[51] 杨姗, 李金玉, 崔玉军, 等. DNA计算的发展现状及未来展望[J]. 生物工程学报,2021, 37(4): 1120-1130.

[52] Sam Behjati, Patrick S Tarpey.What is next generation sequencing?[J]. Arch Dis Child Educ Pract Ed, 2013, 98: 236-238.

[53] Pan Du, Warren A Kibbe, Simon M Lin. lumi: a pipcline for processing llumina microarray[J]. Bioinformatics, 2008, 24(13): 1547-1548.

[54] Siying Ma, Nicholas Tang, Jingdong Tian. DNA synthesis, assembly and applications in synthetic biology[J]. Curr Opin Chem Biol, 2012, 16(3-4): 260-267.

[55] David S Kong, Peter A Carr, Lu Chen, et al. Parallel gene synthesis in a microfluidic device[J]. Nucleic Acids Res, 2007, 35(8): e61.

[56] Thomas F. Knight. Idempotent Vector Design for Standard Assembly of BioBricks[D]. Boston: Massachusetts Institute of Technology, 2003.

[57] Phillips Ira, Pamela A. Silver. A New Biobrick Assembly Strategy Designed for Facile Protein Engineering[D]. Boston: Massachusetts Institute of Technology, 2006.

[58] Grünberg R, Arndt K, Müller K. Fusion Protein (Freiburg) Biobrick assembly standard[R]. [S.L.: s.n.], 2009.

[59] Engler C, Marillonnet S. Generation of families of construct variants using golden gate shuffling[J]. Methods Mol Biol, 2011, 729: 167-181.

[60] Daniel G Gibson, Lei Young, Ray-Yuan Chuang, et al. Enzymatic assembly of DNA molecules up to several hundred kilobases[J]. Nat Methods, 2009, 6(5): 343-345.

[61] Daniel G Gibson, Hamilton O Smith, Clyde A Hutchison 3rd, et al. Chemical synthesis of the mouse mitochondrial genome[J]. Nat Methods, 2010, 7(11): 901-903.

[62] Jing Liang, Zihe Liu, Xi Z Low, et al. Twin-primer non-enzymatic DNA assembly: an officient and accurate multi-part DNA assembly method[J]. Nucleic Acids Res, 2017, 45(11): e94.

[63] Sheng Huang, Yali Yan, Fei Su, et al. Research progress in gene editing technology[J]. Front Biosci (Landmark Ed), 2021, 26(10): 916-927.

[64] Joung J K, Sander J.D. TALENs: a widely applicable technology for targeted genome editing[J]. Nat Rev Mol Cell Biol, 2013, 14(1): 49-55.

[65] Rodolphe Barrangou, Christophe Fremaux, Hélène Deveau, et al. CRISPR provides acquired resistance against viruses in prokaryotes[J]. Science, 2007, 315(5819): 1709-1712.

[66] Xiuhong Shao, Shaoping Wu, Tongxin Dou, et al. Using CRISPR/Cas9 genome editing system to create MaGA20ox2 gene-modified semi-dwarf banana[J]. Plant Biotechnol J, 2020, 18(1): 17-19.

[67] Seoyun Yum, Minghao Li, Zhijian J Chen.Old dogs, new trick: classic cancer therapies activate cGAS[J].Cell Res, 2020.30(8): 639-648.

[68] Jinshan Zhang, Zhenyu Zhou, Jinjuan Bai, et al. Disruption of MIR396e and MIR396f improves rice yield under nitrogen-deficient conditions[J]. Natl Sci Rev, 2020, 7(1): 102-112.

[69] Liyu Huang, Ru Zhang, Guangfu Huang, et al. Developing superior alleles of yield genes in rice by artificial mutagenesis using the CRISPR/Cas9 system[J]. The Crop Journal, 2018, 6(5): 475-481.

[70] Alexis C Komor, Yongjoo B Kim, Michael S Packer, et al. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage[J]. Nature, 2016, 533(7603): 420-424.

[71] Russell T Walton, Kathleen A Christie, Madelynn N Whittaker, et al. Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants[J]. Science, 2020, 368(6488): 290-296.

[72] Bin Ren, Fang Yan, Yongjie Kuang, et al. Improved Base Editor for Efficiently Inducing Genetic Variations in Rice with CRISPR/Cas9-Guided Hyperactive hAID Mutant[J]. Mol Plant, 2018, 11(4): 623-626.

[73] Matt Sternke, Katherine W Tripp, Doug Barrick.Consensus sequence design as a general strategy to create hyperstable, biologically active proteins[J]. Proc Natl Acad Sci U S A, 2019. 116(23): 11275-11284.

[74] Daan C Swarts, John van der Oost, Martin Jinek.Structural Basis for Guide RNA Processing and Seed-Dependent DNA Targeting by CRISPR-Cas12a[J]. Mol Cell, 2017, 66(2): 221-233.e4.

[75] Tyler S Halpin-Healy, Sanne E Klompe, Samuel H Sternberg, et al. Structural basis of DNA targeting by a transposon-encoded CRISPR-Cas system[J]. Nature, 2020, 577(7789): 271-274.

[76] Lena Goshayeshi, Sara Yousefi Taemeh, Nima Dehdilani, et al. CRISPR/dCas9-mediated transposition with specificity and efficiency of site-directed genomic insertions[J]. Faseb j, 2021, 35(2): e21359.

[77] Aitao Li, Carlos G Acevedo-Rocha, Zhoutong Sun, et al. Beating Bias in the Directed Evolution of Proteins: Combining High-Fidelity on-Chip Solid-Phase Gene Synthesis with Efficient Gene Assembly for Combinatorial Library Construction[J]. Chembiochem, 2018, 19(3): 221-228.

[78] Zhoutong Sun, Richard Lonsdale, Lian Wu, et al. Structure-Guided Triple-Code Saturation Mutagenesis: Efficient Tuning of the Stereoselectivity of an Epoxide Hydrolase[J]. ACS Catalysis, 2016, 6(3): 1590-1597.

[79] Jian Xu, Yixin Cen, Warispreet Singh, et al. Stereodivergent Protein Engineering of a Lipase To Access All Possible Stereoisomers of Chiral Esters with Two Stereocenters[J]. J Am Chem Soc, 2019, 141(19): 7934-7945.

[80] 祁延萍, 朱晋, 张凯, 等. 定向进化在蛋白质工程中的应用研究进展[J]. 合成生物学, 2022, 3(6): 1081-1108.

[81] Paschke M. Phage display systems and their applications[J]. Appl Microbiol Biotechnol, 2006, 70(1): 2-11.

[82] Lee S Y, Choi J H, Xu Z. Microbial cell-surface display[J]. Trends Biotechnol, 2003, 21(1): 45-52.

[83] Valencia C A, Jianwei Zou, Rihe Liu. In vitro selection of proteins with desired characteristics using mRNA-display[J]. Methods, 2013, 60(1): 55-69.

[84] Kevin M Esvelt, Jacob C Carlson, David R Liu.A system for the continuous directed evolution of biomolecules[J]. Nature, 2011, 472(7344): 499-503.

[85] Webb B.Sali A. Comparative Protein Structure Modeling Using MODELLER[J]. Current Protocols in Bioinformatics, 2016, 54(1): 5.6.1-5.6.37.

[86] Julia Koehler Leman, Brian D Weitzner, Steven M Lewis, et al. Macromolecular modeling and design in Rosetta: recent methods and frameworks[J]. Nat Methods, 2020, 17(7): 665-680.

[87] John Jumper, Richard Evans, Alexander Pritzel, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583-589.

[88] Yeonhee Park, Geordan J Stukey, Ruta Jog, et al. Mutant phosphatidate phosphatase Pah1-W637A exhibits altered phosphorylation, membrane association, and enzyme function in yeast[J].J Biol Chem, 2022, 298(2): 101578.

[89] Daniel G Gibson, Gwynedd A Benders, Cynthia Andrews-Pfannkoch, et al. Complete chemical synthesis, assembly, and cloning of a Mycoplasma genitalium genome[J]. Science, 2008, 319(5867): 1215-1220.

[90] Daniel G Gibson, John I Glass, Carole Lartigue, et al. Creation of a bacterial cell controlled by a chemically synthesized genome[J]. Science, 2010, 329(5987): 52-56.

[91] He-Ming Xu, Ze-Xiong Xie, Duo Liu, et al. Design and synthesis of yeast chromosomes[J]. Yi Chuan, 2017, 39(10): 865-876.

[92] Farren J Isaacs, Peter A Carr, Harris H Wang, et al. Precise manipulation of chromosomes in vivo enables genome-wide codon replacement[J]. Science, 2011, 333(6040): 348-353.

[93] Denis A Malyshev, Kirandeep Dhami, Thomas Lavergne, et al. A semi-synthetic organism with an expanded genetic alphabet[J]. Nature, 2014, 509(7500): 385-388.

[94] Clyde A Hutchison 3rd, Ray-Yuan Chuang, Vladimir N Noskov, et al. Design and synthesis of a minimal bacterial genome[J]. Science, 2016, 351(6280): aad6253.

[95] Yangyang Shao, Ning Lu, Zhenfang Wu, et al. Creating a functional single-chromosome yeast[J]. Nature, 2018, 560(7718): 331-335.

[96] Shuichi Hoshika, Nicole A Leal, Myong-Jung Kim, et al. Hachimoji DNA and RNA: A genetic system with eight building blocks[J]. Science, 2019, 363(6429): 884-887.

[97] Julius Fredens, Kaihang Wang, Daniel de la Torre, et al. Total synthesis of Escherichia coli with a recoded genome[J]. Nature, 2019, 569(7757): 514-518.

[98] Kai Papenfort, Elena Espinosa, Josep Casadesús, et al. Small RNA-based feedforward loop with AND-gate logic regulates extrachromosomal DNA transfer in Salmonella[J]. Proc Natl Acad Sci U S A, 2015, 112(34): E4772-4781.

[99] Ashley G Rivenbark, Sabine Stolzenburg, Adriana S Beltran, et al. Epigenetic reprogramming of cancer cells via targeted DNA methylation[J]. Epigenetics, 2012, 7(4): 350-360.

[100] Petazzi P Menéndez, A Sevilla. CRISPR/Cas9-Mediated Gene Knockout and Knockin Human iPSCs[M/OL]. NewYork: Springer Us, 2022.

[101] Junjun Wu, Guocheng Du, Jian Chen, et al. Enhancing flavonoid production by systematically tuning the central metabolic pathways based on a CRISPR interference system in Escherichia coli[J]. Sci Rep, 2015, 5: 13477.

[102] 刘锦嵩,鄢盛恺.针对新型冠状病毒感染的基于CRISPR-Cas系统分子诊断及治疗策略研究[J]. 国际生物制品学杂志,2022, 45(1): 1-7.

[103] Can Xu, Nicolas Martin, Mei Li, et al. Living material assembly of bacteriogenic protocells[J]. Nature, 2022, 609(7929): 1029-1037.

[104] Jie Zhang, Lea G Hansen, Olga Gudich, et al. A microbial supply chain for production of the anti-cancer drug vinblastine[J]. Nature, 2022, 609(7926): 341-347.

[105] C J Paddon, P J Westfall, D J Pitera, et al. High-level semi-synthetic production of the potent antimalarial artemisinin[J]. Nature, 2013, 496(7446): 528-532.

[106] Stephanie Galanie, Kate Thodey, Isis J Trenchard, et al. Complete biosynthesis of opioids in yeast[J]. Science, 2015, 349(6252): 1095-1100.

[107] Weishan Wang, Shanshan Li, Zilong Li, et al. Harnessing the intracellular triacylglycerols for titer improvement of polyketides in Streptomyces[J]. Nat Biotechnol, 2020, 38(1): 76-83.

[108] Krzysztof Krawezyk, Shuai Xue, Peter Buchmann, et al. Electrogenetic cellular insulin release for real-time glycemic control in type I diabetic mice[J]. Science, 2020, 368(6494): 993-1001.

[109] Nissim L, Bar-Ziv R H. A tunable dual-promoter integrator for targeting of cancer cells[J]. Mol Syst Biol, 2010, 6: 444.

[110] Cong T Trinh, Pornkamol Unrean, Friedrich Srienc.Minimal Escherichia coli cell for the most efficient production of ethanol from hexoses and pentoses[J].Appl Environ Microbiol, 2008, 74(12): 3634-3643.

[111] Eric J Steen, Yisheng Kang, Gregory Bokinsky, et al. Microbial production of fatty-acid- derived fuels and chemicals from plant biomass[J]. Nature, 2010, 463(7280): 559-562.

[112] Wensi Meng, Yongjia Zhang, Liting Ma. Non-Sterilized Fermentation of 2, 3-Butanediol with Seawater by Metabolic Engineered Fast-Growing Vibrio natriegens[J]. Frontiers in Bioengineering and Biotechnology, 2022, 7(10).

[113] Shota Atsumi, Taizo Hanai, James C Liao. Non-fermentative pathways for synthesis of branched-chain higher alcohols as biofuels[J]. Nature, 2008, 451(7174): 86-89.

[114] Chiranjib Banerjee, Kashyap K Dubey, Pratyoosh Shukla. Metabolic Engineering of Microalgal Based Biofuel Production: Prospects and Challenges[J]. Front Microbiol, 2016, 7: 432.

[115] Tao Cai, Hongbing Sun, Jing Qiao, et al. Cell-free chemoenzymatic starch synthesis from carbon dioxide[J].Science, 2021, 373(6562): 1523-1527.

[116] Qiupeng Lin, Yuan Zong, Chenxiao Xue, et al. Prime genome editing in rice and wheat[J]. Nat Biotechnol, 2020, 38(5): 582-585.

[117] Sarah P F Bonny, Graham E Gardner, David W Pethick, et al. What is artificial meat and what does it mean for the future of the meat industry?[J]. Journal of Integrative Agriculture, 2015, 14(2): 255-263.

[118] Nick Goldman, Paul Bertone, Siyuan Chen, et al.Towards practical, high-capacity, low- maintenance information storage in synthesized DNA[J]. Nature, 2013, 494(7435): 77-80.

[119] Lifu Song, Feng Geng, Zi-Yi Gong, et al. Robust data storage in DNA by de Bruijn graph-based de novo strand assembly [J]. Nat Commun, 2022, 13(1): 5361.

[120] 滕越, 杨姗, 刘芮存. 基于生物分子的神经拟态计算研究进展[J]. 科学通报, 2021, 66(31): 3944-3951.

相关图书

大模型应用开发 动手做AI Agent
大模型应用开发 动手做AI Agent
AI原生应用开发:提示工程原理与实战
AI原生应用开发:提示工程原理与实战
生成式人工智能(基于PyTorch实现)
生成式人工智能(基于PyTorch实现)
AI辅助编程实战
AI辅助编程实战
大语言模型工程师手册:从概念到生产实践
大语言模型工程师手册:从概念到生产实践
GPT图解 大模型是怎样构建的
GPT图解 大模型是怎样构建的

相关文章

相关课程