合成生物学之DNA合成组装

原标题:合成生物学之DNA合成组装

合成生物学-借上帝之手探生命之源

合成生物学采用工程方法对生物体进行有目标的设计、改造乃至创建赋予非自然功能的“人造生命”,是继“DNA双螺旋结构的发现”、“人类基因组计划”后的第三次生物技术革命。

这是一门整合酶工程、基因合成、基因测序、基因编辑等多种生物技术工具的系统工程。合成生物学从底层脱氧核苷酸出发,经DNA小片段到DNA大片段乃至到整个基因组,从单一零散的元器件到功能模块再到整个生命系统网络,“自下而上”地逐级构筑生命活动,通过“设计−构建−测试−学习”(DBTL)的循环过程来创造新功能生命体,实现从非生命物质到生命体系的跨越。随着基因测序、基因合成、基因编辑等生物技术(BT)、信息技术(IT)和人工智能(AI)的融合创新,合成生物学的黄金时代即将开启,挖掘生命密码,探究生命本源,未来大有可为。

基因组合成-生命结构的编码器

基因组合成是合成生物学取得的重要进展之一。从第一代Sanger测序到二代高通量测序(NGS),再到以SMRT测序和纳米孔ONT技术为主的三代测序,人类破解基因组序列的能力大大提高,对于基因、基因组乃至生命结构的了解达到了空前未有的深度,人类“编写”生物基因组也逐渐成为现实。基因组的编辑,甚至全基因组的重设计与合成,是获得新的生命体用于疾病治疗、药物生产等重要的研究手段。

从1970年合成的第一条基因(酵母丙氨酸tRNA基因77bp)到2020年大肠杆菌基因组(4M)合成,DNA合成长度在不断增加,实现了从单个基因到基因组,自然界已有基因到非自然基因,kb级别到Gb级别,原核生物到真核生物的突破,并激励着人类向更加复杂的高等哺乳动物甚至人类基因组合成发起挑战。

相对于单独的基因,基因组合成的规模都在百kb甚至Mb级别,哺乳动物或人类基因组的规模需要达到了Gb级别。商业化的基因合成大都在10kb以内,大片段DNA合成技术是目前基因合成领域技术开发的重难点之一。大片段DNA(>10kb)的合成组装和高效交付已成为未来合成基因组学的核心基础。因此,寡核苷酸合成和基因合成技术的进展主要集中在降低成本、提高通量和合成 DNA 的长度上。

泓迅科技-大片段DNA合成组装解决方案

DNA合成组装技术是基因组学,乃至合成生物学的底层推动技术。从头合成DNA的化学合成法长度被限制在200nt以内,要想获得Kb超长基因乃至Mb级别的全基因组,可将分段合成的寡核苷酸片段装配成长片段DNA或基因组。

常用的DNA组装方法可分为三类:酶依赖的DNA组装(基于DNA聚合酶、核酸内切酶、核酸外切酶、连接酶)、非酶依赖的DNA组装、依赖于体内同源重组的 DNA 组装。当前较为常用的技术有重叠延伸 PCR(OE-PCR)组装技术、BioBricks™组装技术、Golden Gate组装技术、TPA(Twin-primer non-enzymatic)组装技术、Gibson组装技术、TAR酵母同源重组等技术。

酶依赖的DNA组装技术

非酶依赖的DNA组装(TPA组装技术)

TAR酵母同源重组技术

泓迅科技作为合成生物学赋能技术的先锋者,自主研发Complex Index(CI)、NGTM Codon、AI-TAT、DNA StudioTM等多款生物智能分析工具,推动DNA合成向着更加智能化、精准化和快速化方向发展。我们在构建大分子DNA方面拥有丰富的经验,帮助您解决长DNA合成组装、复杂基因序列合成组装(重复序列、高GC含量、回文序列等)。

泓迅案例-长DNA合成组装(38kb)

合成组装碱基长度为37848bp的目标片段,并将合成的片段组装至pSynoYac1-Cm (约10kb)上。

难度分析:

1. 合成该目的片段需要400多条小片段寡核苷酸,进行80多次的重叠延伸PCR拼接组装,工作量较大,成功率较低。

2. 序列的复杂度较高,GC含量波动大,长重复序列(≥20bp)多达108个。

3. 38kb片段与10kb载体的组装难度大,成功率低。

4. 目的片段与宿主细胞基因组同源性高,极易出现片段缺失以及碱基突变的情况。

目的片段的GC含量分析图

目的片段的重复序列分析图

解决方案:

我们利用CRISPR基因编辑技术对酿酒酵母BY4741基因组进行了改造,开发得到一株酵母菌,显著提高了酵母体内同源重组的特异性、成功率以及组装稳定性。针对片段缺失,我们改良酵母转化的操作流程和反应体系配方,显著增加了酿酒酵母大片段DNA的转化效率。此外,我们对传统酵母质粒提取方法进行了优化,总结出一套成熟、稳定的提取方法,且此方法优于市面上大部分酵母质粒提取试剂盒。通过上述一系列的优化改进,我们将最终目标片段的构建分为两轮进行酵母体内同源重组组装,最终成功获得长达37848bp的100%正确目的序列。

泓迅案例-复杂基因合成组装(14kb)

合成组装14kb的复杂基因片段,并将合成的目的基因组装到pSynoYac0-Cm (约10kb)上。

难度分析:

1. 目的片段中GC含量波动较大,局部区域甚至高达100%。

2. 目的片段中有多个重复片段,直接重复649bp片段4个,1579bp片段2个,反向重复649bp片段4个,1299bp片段2个。

目的片段的GC含量分析图

目的片段的重复序列分析图

解决方案:

我们首先将整个片段分割成A、B、C 3个中片段,其中A、C中片段分别分割成4个小片段。首先,8个小片段和B中片段再次被拆分成若干段60~70bp寡核苷酸,使用亚磷酰胺化学法合成这些寡核苷酸序列,并使用高保真Pfu聚合酶进行链式组装;接着,将正确的小目的片段通过Gibson系统同源重组至载体pUC57上,并进行PCR、测序验证;随后,通过酶切连接和Gibson系统进行A、C片段中间构建的组装,并进行PCR、测序验证;最终,从A、B、C三个中间构建质粒上酶切回收、纯化目的片段,将目的片段连同穿梭载体pSynoYac0-Cm一起转化至酿酒酵母中,通过TAR同源重组方法进行组装,并进行PCR、测序验证。

复杂的GC含量会极大增加聚合酶链式组装的难度,该目的基因的GC含量特别复杂,针对这种情况,我们调整PCR反应体系中聚合酶、离子及其它组分含量,并优化退火温度、延伸时间等PCR扩增程序的参数,来保证PCR链式组装的成功率和保真性。目的片段中有较多个超过500bp的重复序列,常规的组装方案很容易发生错配。针对这一难点,我们从开始就进行针对性设计及优化,灵活联用酶切连接、Golden Gate及Gibson组装等方法分段组装合成重复序列的中间构建。在最终构建的测序验证上,我们即使用了NGS法进行全长基因测序,又使用Sanger测序对重复序列进行验证,两种测序方法的结果相互应证,确保交付给客户的最终构建与客户需求的目的序列100%匹配。

泓迅科技精准的设计与先进的制造工艺,致力合成基因组学的发展,我们为您提供标准序列及难度序列大片段DNA合成组装解决方案,在保证成本优势的情况下,迅速、准确地合成组装DNA大片段,交付100%正确的目的序列。泓迅科技高准确性、高性价比的服务和产品赋能科学发展,为合成生物学相关研究助力,是您值得信赖的DNA解决方案合作伙伴。

参考文献:

[1]Clarke L, Kitney R. Developing synthetic biology for industrial biotechnology applications. Biochem Soc Trans. 2020 Feb 28;48(1):113-122.

[2]Chang H, Wang C, Wang P, Zhou J, Li B. DNA assembly technologies: a review. Sheng Wu Gong Cheng Xue Bao. 2019 Dec 25;35(12):2215-2226.

[3]Clarke LJ, Kitney RI. Synthetic biology in the UK - An outline of plans and progress. Synth Syst Biotechnol. 2016 Oct 17;1(4):243-257.

[4]Chao R, Yuan Y, Zhao H. Recent advances in DNA assembly technologies. FEMS Yeast Res. 2015 Feb;15(1):1-9.

[5]Gibson DG. Enzymatic assembly of overlapping DNA fragments. Methods Enzymol. 2011;498:349-61.

[6]Gibson DG, Benders GA, Axelrod KC, etc. One-step assembly in yeast of 25 overlapping DNA fragments to form a complete synthetic Mycoplasma genitalium genome. Proc Natl Acad Sci U S A. 2008 Dec 23;105(51):20404-9.返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读