鲤鱼线粒体基因组和全基因组信息的基因流分析

1为了解鲤线粒体基因组的结构组成特点,并基于全基因组研究不同品种之间的基因流关系,我们通过新一代高通量测序组装技术得到了10个鲤品种,计33条全基因组序列和33条线粒体基因组全序列,并进行了相关的分析,结果显示10个品种鲤线粒体基因组全序列的长度在16,580到16,584bp之间。对这些线粒体基因组序列进行多重比较后,除去插入、删除位点外,共筛选到1693个SNP位点。对33条鲤科鱼类全基因组进行分析,在所有的核苷酸替换中,转换占57.47%,颠换占42.53%。Tajima’s D 值为 -0.08599,各群体间遗传分化系数的平均值(Fst)为0.154,核苷酸多样性指数(Pi)为0.0042,显示出较丰富的遗传多样性。我们对全基因组序列进行了D统计分析和主成分分析,证明了我们所研究的10个鲤品种之间存在着一定的基因交流。
目录
引言
鲤科(Cyprinidae)是鲤形目中分布最广、种类最多,养殖历史悠久,深受人们喜爱的重要淡水经济鱼类。鲤科约有12个亚科,210个属,2000余种。鲤鱼是世界上最古老的鱼类驯化品种[1],在中国已经有4000多年的历史[2],同时也成为了中国重要的农业品种。我国有鲢、鲤、裂腹鱼、鳅鮀、鳊、雅罗鱼、鲴、鳑鲏、鲃、鮈共10个亚科。鲤的观赏鱼也是种类繁多,大、中、小型鱼都有,约有1600多种,我国约产370种。鲤主要分布于水中层或底栖,卵生,食性复杂。由于鲤具有敏锐的听觉,即使在较混浊、视线不佳的水域,鲤亦能适应生存。鱼类在适宜的生存条件下,较易随着江河湖泊进行大规模地迁徙而广泛地分布于世界各地,若这种迁徙在某种条件下连续或者渐次地发生,经过若干代(年)以后,则有可能使得相邻的生态区域的种群之间发生基因的交流。对于大多数的物种,由于环境因子的异质性和生物行为的差异,可能导致基因流的不随机性,使得区域种群间出现不同程度的遗传差异,使得种群的遗传结构逐渐的发生变化,这就可能为鲤新物种的产生提供了条件[3],也可能对鲤的种质质量产生一定的影响,从而影响到鲤人工养殖的繁育发育质量,这一问题是人工养殖鲤鱼中需要解决的重要问题。
近年来,随着分子生物学技术的发展,在许多生物学领域方面利用生物全基因组和线粒体基因组进行物种基因流分析和遗传结构多样性的研究成为热点。由于线粒体基因组(mt *好棒文|www.hbsrm.com +Q: ^351916072^ 
DNA)具有母系遗传,进化速度快,拷贝数多,不易发生重组[4],高替代率[5]的特点,常用作研究动物群体基因组进化的有效遗传标记[6][7],其次也可作为物种种属鉴定的标志。尽管很多学者已经基于线粒体基因组对很多生物进行基因流的研究,例如,李菁[8]等人在玉米螟成虫线粒体基因组方面的研究,孙嵬[9]等人在黄胫小车蝗线粒体 COI 基因序列基因流分析的研究,在鲤方面国内外学者也基于全基因组对鲤鱼的种群多样性,亲缘关系,生物学特性等方面进行了广泛深入的研究,例如钟立强[10]等人利用全基因组对黑龙江野鲤,黄河鲤,建鲤,荷包红鲤四种鲤鱼种群多样性的分析。Kohij Mabuchi[11]等人对日本琵琶湖野鲤亲缘关系和生物学特性的研究。但是在鲤鱼各品种之间基于线粒体和全基因组的基因流分析的报告及文章还鲜有报道,相对于其他科的鱼类来说,鲤鱼的大规模迁徙使得其分布较为广泛,各品种之间的基因流动机会也大大增加,使得鲤种群间出现不同程度的遗传变异,从而构成鲤种质质量低下的遗传因素,这一科学问题有待解决。
本研究主要通过组装重测序得到我们所需要的10个品种鲤的33条序列样本,包括基因组全序列和线粒体全系列,对33条线粒体基因组序列和全序列进行比较分析,以期阐明鲤不同品种线粒体基因组的序列长度及变异位点情况,全基因组序列基因流分析特征和主成分分析等,评估整个基因组在遗传发育分析中的适用性,为今后从分子水平上的对鲤的进化分析和在遗传育种中保证种质质量提供参考。
1材料和方法
1.1 不同鲤品种线粒体组和基因组序列的获取
1.1.1 线粒体基因组序列的获取
本研究共采用了33条鲤线粒体基因组全序列进行线粒体基因组的成分对比分析。10个品种鲤的33条完整线粒体基因组序列来自33条鲤鱼已重测序完成的全基因组序列组装出的线粒体组序列,重测序组装所需的标准鲤序列样本来自中国水产科学研究院淡水研究中心徐鹏研究员发布在Nature Genetic上的文章《Genome sequence and genetic diversity of the common carp,Cyprinus carpio》中的已测序完成的松浦镜鲤全基因组[12]。
1.1.2 33条基因组序列样本的测序和组装
本研究主要基于ABI公司的SOLiD技术和基因组鸟枪法测序策略对实验所需的33条鲤的全基因组序列和线粒体基因组全序列进行重测序组装。相关研究表明,从454测序全基因组产生的原始测序数据中能够组装出完整的线粒体基因组[13]。因此,我们以33条线粒体所涉及的10个鲤品种的已重测序完成的全基因组为线粒体基因组测序的基因组DNA来源,以标准鲤鱼的线粒体基因组作为线粒体组组装所需的线粒体参考序列。
在本论文试验期间,SOLiD 测序平台的测序通量相对来说较高,并且采用双碱基编码,其测序准确率也相对较高,因此我们采用 SOLiD 测序技术对10个鲤品种的33条全基因组序列进行全基因组鸟枪法双末端测序。我们通过鸟枪法测序利用超声波将鲤的全基因组DNA序列随机的切割成小片段DNA分子,产生的测序片段也称为读段,为保证样品质量,我们构建了2个鸟枪法双末端基因测序文库。同样我们通过Illumina程序对待测序的基因组建立了2个Matepair测序文库,以获得一定大小片段(8kp)两端的序列,测序由Illumina HiSeq 2000平台完成,用于测序序列框架拼接过程中填补基因组上未被测序或组装的缺口(Gap)和确定Contig之间的顺序,组成Scaffold。将随机切割的DNA 片段连接接头,环化酶切,最后,在 SOLiD 测序平台上对每个测序库完成一次运行测序。利用双末端配对信息和插入长度信息对组装产生的重叠群(Contig)按照测序前的方向和位置进行定位,形成序列框架(Scaffold),得到原始数据,去除低质量片段和小片段的读段最终得到有用的读段数据集。测序后的读段之间会产生不同程度的相互重叠,能被有效地拼接和组装,重叠群的拼接由Celera软件完成[14]。从而得到完整的全基因组序列。详细的组装序列鲤鱼品种见表1。
表1 组装序列的10个鲤科鱼类亚种基本信息
Tab.1 Basic subspecies information of 10 Cyprinidae for assembly sequence

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/nongxue/scyz/56.html

好棒文