技术是核心,服务是宗旨

动植物基因组de novo测序

 

  基因组de novo 测序,即基因组从头测序,是指不依赖已知的基因组序列信息,对某个物种的全基因组序列进行测序,然后利用生物信息学手段对测序序列进行拼接、组装,从而获得该物种的全基因组序列图谱。全基因组序列图谱的构建将全面加深对该物种起源进化以及对特定环境适应性过程的理解,为今后在该物种内发现新基因以及物种改良起到巨大的作用,为基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA 序列信息。

  通过漫长的物种形成和进化,不同的物种基因组的杂合度和基因组上的重复区域不尽相同。一般杂合度不超过0.5%、重复序列含量不超过50%、GC 含量为35% 到65% 之间的单倍体或二倍体动植物基因组定义为简单基因组。而动植物复杂基因组是指GC 含量小于35% 或大于65%,重复序列高于50% 或杂合率大于0.5%的二倍体或多倍体的动植物基因组。

  利用illumina 测序技术,构建插入片段大小为180 bp、300 bp、500 bp、2 kb、5 kb、10 kb、20 kb等大小不同的测序文库,进行125 bp/150 bp/250 bp 的双末端测序。其中插入片段长度超过1 kb 的文库称之为mate-pair 文库,长片段文库的构建便于基因组组装过程中的重复序列定位。当测序的总体深度达到70× 以上时,即可保证基因组拼接所需数据及序列中单碱基的准确性。

 

►【技术路线】  

 

A&P Genome de novo Seq

基因组调查:评估基因组的GC含量、重复度、杂合度,并估计基因组的大小。

基因组拼接统计:拼接统计,包括原始数据统计、测序深度、ContigN 50、Scaffold N50、基因组GC含量等。

基因组注释及基因功能分类:包括基因预测、功能注释、ncRNA注释、重复序列分析以及GO分类、KEGG通路分析。

比较基因组及进化分析:核苷酸水平共线性分析,氨基酸水平共线性分析,基因簇分析以及进化关系。

 

►【组装评估技术指标】  

 

基因组框架图

 

基因组覆盖率 > 90%

基因区覆盖率 > 95%

Contig N50 > 5 kb

Scaffold N50 > 20 kb

单碱基错误率 < 0.01%

 

基因组精细图

 

基因组覆盖率 > 90%

基因区覆盖率 > 98%

Contig N50 > 20 kb

Scaffold N50 > 300 kb

单碱基错误率 < 0.01%

 

►【样品要求】 

  • 样品总量:小片段文库样本制备需要总量大于1 μg 的样品,mate-pair 文库(2 kb、5 kb、10 kb、)样品,制备需要总量20-50 μg ,为保证实验质量及延续性,请一次性提供至少2 次样本制备总量;

  • 样品浓度纯度:样品浓度>200 ug/μl,OD260/280 介于1.8-2.0 之间,无蛋白质、RNA 或者肉眼可见杂质污染;

  • 样品质量:基因组完整、无降解,电泳结果基因组DNA 主带应在入-Hind llldigest 最大条带23 KB 以上且主带清晰,无弥散;

  • 样品保存:请保存于干粉、酒精、TE buffer 或超纯水中,并请在样品信息单中注明。

 

官方微信

 

weixin