基于高通量测序的极小种群野生植物长梗杜鹃转录组分析

       摘要: 为加强特有濒危植物长梗杜鹃资源的评价、保护和鉴定工作,及为今后遗传育种和改善其农艺性状提供有益参考.本研究采用新一代高通量测序平台Illumina HiSeq 4000对其转录组测序,得到的数据过滤后进行de novo组装并聚类去冗余,获得74 092个Unigenes,平均长度、N50、Q20、Q30以及GC含量分别为938 nt、1 616 nt、98.22%、95.20%和43.24%,其中1Kb以上的Unigenes有23 879条.通过与七大功能数据库比对,分别有39 876 (NR:53.82%)、38 065(NT:51.38%)、27 384(Swissprot:36.96%)、16 099(COG:21.73%)、30 401(KEGG:41.03%)、17 518(G0:23.64%)以及29 676(Interpro:40.05%)条Unigenes获得功能注释.长梗杜鹃转录组中的Unigenes根据GO功能大致可分为生物学过程、细胞组分和分子功能3大类56亚类,其中执行生物学过程的基因最多,占41.53%;与COG数据库比对,根据其功能大致可分为25类;以KEGG数据库为参考,可归为6个代谢通路大类、32类代谢途径,并发掘出176条与人类疾病相关的Unigenes,包括内分泌及代谢疾病(167条)和抗药性(9条).根据注释结果共检测出39 418个CDS,未注释上的Unigenes使用ESTScan预测后获得3 194个CDS.同时,预出到1 488个编码TF的Unigenes,以及检测到57 927个SNP多态位点.该转录组分析为今后长梗杜鹃乃至杜鹃属植物功能基因挖掘与利用、基因克隆、抗性机理分析、遗传资源分类和进化、分子标记开发以及分子辅助育种等研究提供了基础数据和重要参考.

作者:
李太强 刘雄芳 万友名 李正红 起国海 李钰莹 刘秀贤 和锐 马艳 马宏
单位:
中国林业科学研究院资源昆虫研究所,昆明,650233
出处:
《植物研究》
刊期:
2017年第37卷第6期
基金:
“云南省技术创新人才”培养对象项目

基于高通量测序的极小种群野生植物长梗杜鹃转录组分析

摘要: 为加强特有濒危植物长梗杜鹃资源的评价、保护和鉴定工作,及为今后遗传育种和改善其农艺性状提供有益参考.本研究采用新一代高通量测序平台Illumina HiSeq 4000对其转录组测序,得到的数据过滤后进行de novo组装并聚类去冗余,获得74 092个Unigenes,平均长度、N50、Q20、Q30以及GC含量分别为938 nt、1 616 nt、98.22%、95.20%和43.24%,其中1Kb以上的Unigenes有23 879条.通过与七大功能数据库比对,分别有39 876 (NR:53.82%)、38 065(NT:51.38%)、27 384(Swissprot:36.96%)、16 099(COG:21.73%)、30 401(KEGG:41.03%)、17 518(G0:23.64%)以及29 676(Interpro:40.05%)条Unigenes获得功能注释.长梗杜鹃转录组中的Unigenes根据GO功能大致可分为生物学过程、细胞组分和分子功能3大类56亚类,其中执行生物学过程的基因最多,占41.53%;与COG数据库比对,根据其功能大致可分为25类;以KEGG数据库为参考,可归为6个代谢通路大类、32类代谢途径,并发掘出176条与人类疾病相关的Unigenes,包括内分泌及代谢疾病(167条)和抗药性(9条).根据注释结果共检测出39 418个CDS,未注释上的Unigenes使用ESTScan预测后获得3 194个CDS.同时,预出到1 488个编码TF的Unigenes,以及检测到57 927个SNP多态位点.该转录组分析为今后长梗杜鹃乃至杜鹃属植物功能基因挖掘与利用、基因克隆、抗性机理分析、遗传资源分类和进化、分子标记开发以及分子辅助育种等研究提供了基础数据和重要参考.

说明:如本页面涉及到版权问题或作者不愿意公开,请联系本站管理员删除!

0.314749s