温度调控拟南芥下胚轴生长的全基因组关联分析
:温度是影响植物生长、发育的重要环境因子。不同的温度条件会影响拟南芥下胚轴的伸长,进而影响拟南芥幼苗的出土以及对外界环境的感知能力。近年来,随着高通量测序的发展和关联分析理论与实践的不断完善,植物中全基因组关联分析(GWAS)的研究越来越多。关联分析是解析作物表型多样性遗传基础的有效工具,也是挖掘有利等位基因的重要手段,在作物遗传育种中发挥着越来越重要的作用。本试验利用全基因组关联分析的方法来研究温度对拟南芥下胚轴伸长的影响,挖掘了6个可能相关的QTL,17个相关候选基因。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1 材料与方法3
1.1 试验材料 3
1.1.1 拟南芥变种材料3
1.1.2 非生物材料4
1.2 试验方法 4
1.2.1 拟南芥材料的扩繁4
1.2.2 拟南芥植株的培养方法4
1.2.3 预试验4
1.2.4 拟南芥下胚轴长度统计及数据分析4
2 结果与分析4
2.1 不同温度下拟南芥下胚轴生长差异4
2.2 不同温度下拟南芥下胚轴长度的统计以及GWAS分析5
2.3 从主效QTL中确定温度影响拟南芥下胚轴生长的候选基因5
3 讨论 6
3.1 全基因组关联分析方法的不足6
3.2 试验中提高结果可靠性的方法6
致谢7
参考文献7
温度调控拟南芥下胚轴生长的全基因组关联分析
引言
拟南芥(Arabidopsis thaliana)是一种十字花科(Cruciferae)的小型野草,产于朝鲜、日本、俄罗斯(西伯利亚)、印度、伊朗、土库曼斯坦、欧洲、非洲和北美洲等地,在我国华东(江苏南部、安徽)、中南(湖北)、西北(新疆塔城、陕西勉县)和西部(西藏普兰、聂拉木、定日、林芝、察雅、芒康)亦有分布[13]。拟南芥早在16世纪被发现,19世纪末,科学家就注意到了它的研究价值。它是国际上第一个完成全部基因组序列测定的高等
*好棒文|www.hbsrm.com +Q: @351916072@
植物。
拟南芥作为一种模式植物,具有其它植物无法替代的优点:(1)生长周期短,实验室常用的许多品系,从萌芽到种子成熟,大约为6个星期;(2)拟南芥的基因组是目前已知植物基因组中最小的,125Mbp(水稻基因组430Mb,玉米基因组4500Mb),约25900个基因;(3)基因组仅有5条染色体,113亿个碱基对,其染色体数量是玉米的1/20;(4)具有双子叶植物的所有特性,整个生命周期同样经过细胞的分裂、生长发育、分化、衰老、死亡等一系列生物学现象;(5)拟南芥是自花受粉植物,基因高度纯合,用理化因素处理突变率很高,容易获得大量的突变体和基因组资源;(6)植株小,可在有限的空间内可大量种植,收获大量的种子[4]。通过对拟南芥基因组的研究,推动了许多其它植物相关基因的研究。这些优点使得拟南芥成为遗传研究的模式生物,被科学家誉为“植物中的果蝇”。自二十世纪八十年代以来,随着DNA自动测序技术的发展,人类对基因组的研究逐渐深入,基因组全序列测定的研究迅猛发展。拟南芥基因组全序列在2000年底已完全测定并公开发表,这是第一个经完全测序的开花植物。拟南芥基因组测序的完成使得大量涉及重要生命过程的基因被发现。通过与已知功能的基因序列进行比较,可大致确定拟南芥中69%的基因功能[5]。
1987年美国国立卫生研究院(NIH)和美国能源部(DOE)联合提出“人类基因组计划”,随后得到了美国政府的批准,并于1990年正式实施,此后成为包括我国在内的国际合作项目。随着人类基因组计划的开展,许多模式生物的基因组计划也相继展开。自1995年以来,先后完成的基因组全序列测定的生物有:流感噬血杆菌(Haemophilus influenzae)、酿酒酵母(Saccharomyces cerevisiae)、线虫(Caenorhabditis elegans)、果蝇(Drosophila melanogaster)、拟南芥(Arabidopsis thaliana)[5]等。基因组全序列测定为全基因组关联分析(genomewide association studies,GWAS)的发展和应用打下了基础。
全基因组关联分析是综合考虑群体结构、全基因组连锁不平衡(linkage disequili brium,LD)水平和表型数据进行分析方法。全基因组关联分析分辨率取决于LD水平和等位基因或单倍型频率。连锁不平衡,是指群体内不同座位等位基因的非随机关联,一般以r2(squared allelefrequency correlations)半长度的遗传距离表示[6]。样本量少、遗传隔离、群体分层、重组率低、群体混杂、遗传漂变及上位作用等会导致LD衰减距离增加,而高重组率、高突变率以及基因转换(gene conversion)等则会降低LD衰减距离,因此自花授粉的物种比异花授粉的物种具有更高的LD衰减距离[7]。群体的LD水平决定全基因组关联分析所需要的标记数量和密度。如果LD衰减距离较小,则关联作图需要大量的单核苷酸多态性(single nucleotide polymorphisms,SNP)标记,分辨率会较高;反之,需要的SNP标记较少,其分辨率也会较低[8]。GWAS的研究原理是:在基因水平上通过分子标记的手段,对整个基因组内的SNP进行综合分析与分型,再将不同表现的性状变异统计出来,提出假设,并且验证其与期望性状间的关联性[9]。全基因组关联分析需要选择一定数量覆盖全基因组的SNP对研究的群体进行全基因组扫描,然后将得到的分子数据与表型数据进行关联分析。类似于基于候选基因的关联分析,若某个SNP与表型性状显著关联,那么这个SNP与表型数据存在协同变异的关系。因此GWAS是一种综合系统的分析方法,除了检测基因组SNP之外,还需要考虑种质材料的代表性、材料的群体结构和LD分析、表型的选择与鉴定以及表型与基因型的关联分析模型的选择等[8]。
全基因组关联分析最早应用于人类的疾病研究,基于人类的全基因组关联分析是应用人类基因组中数以百万计的单核苷酸多态性为标记进行病例对照关联分析,以期发现影响复杂性疾病发生的遗传特征的一种新策略[10]。2005年,Science杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动,此后一系列GWAS陆续展开。现已经陆续报道了关于人类身高、体重、血压等主要性状,以及视网膜黄斑、白血病、冠心病、肥胖症、糖尿病、精神分裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果,确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异[10]。此外,复杂疾病的GWAS方法学(如研究设计、统计分析与结果的解释)也取得了极大的进步,因此称为“GWAS第一次浪潮”。受到人类疾病遗传学研究的启示,植物遗传育种学家将关联分析理论发展到作物遗传和育种研究中来,特别是在植物复杂性状,如数量性状的遗传基础的研究发挥了巨大作用,现已被广泛应用到植物遗传学和育种相关的性状研究中,并取得了一些重要进展。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1 材料与方法3
1.1 试验材料 3
1.1.1 拟南芥变种材料3
1.1.2 非生物材料4
1.2 试验方法 4
1.2.1 拟南芥材料的扩繁4
1.2.2 拟南芥植株的培养方法4
1.2.3 预试验4
1.2.4 拟南芥下胚轴长度统计及数据分析4
2 结果与分析4
2.1 不同温度下拟南芥下胚轴生长差异4
2.2 不同温度下拟南芥下胚轴长度的统计以及GWAS分析5
2.3 从主效QTL中确定温度影响拟南芥下胚轴生长的候选基因5
3 讨论 6
3.1 全基因组关联分析方法的不足6
3.2 试验中提高结果可靠性的方法6
致谢7
参考文献7
温度调控拟南芥下胚轴生长的全基因组关联分析
引言
拟南芥(Arabidopsis thaliana)是一种十字花科(Cruciferae)的小型野草,产于朝鲜、日本、俄罗斯(西伯利亚)、印度、伊朗、土库曼斯坦、欧洲、非洲和北美洲等地,在我国华东(江苏南部、安徽)、中南(湖北)、西北(新疆塔城、陕西勉县)和西部(西藏普兰、聂拉木、定日、林芝、察雅、芒康)亦有分布[13]。拟南芥早在16世纪被发现,19世纪末,科学家就注意到了它的研究价值。它是国际上第一个完成全部基因组序列测定的高等
*好棒文|www.hbsrm.com +Q: @351916072@
植物。
拟南芥作为一种模式植物,具有其它植物无法替代的优点:(1)生长周期短,实验室常用的许多品系,从萌芽到种子成熟,大约为6个星期;(2)拟南芥的基因组是目前已知植物基因组中最小的,125Mbp(水稻基因组430Mb,玉米基因组4500Mb),约25900个基因;(3)基因组仅有5条染色体,113亿个碱基对,其染色体数量是玉米的1/20;(4)具有双子叶植物的所有特性,整个生命周期同样经过细胞的分裂、生长发育、分化、衰老、死亡等一系列生物学现象;(5)拟南芥是自花受粉植物,基因高度纯合,用理化因素处理突变率很高,容易获得大量的突变体和基因组资源;(6)植株小,可在有限的空间内可大量种植,收获大量的种子[4]。通过对拟南芥基因组的研究,推动了许多其它植物相关基因的研究。这些优点使得拟南芥成为遗传研究的模式生物,被科学家誉为“植物中的果蝇”。自二十世纪八十年代以来,随着DNA自动测序技术的发展,人类对基因组的研究逐渐深入,基因组全序列测定的研究迅猛发展。拟南芥基因组全序列在2000年底已完全测定并公开发表,这是第一个经完全测序的开花植物。拟南芥基因组测序的完成使得大量涉及重要生命过程的基因被发现。通过与已知功能的基因序列进行比较,可大致确定拟南芥中69%的基因功能[5]。
1987年美国国立卫生研究院(NIH)和美国能源部(DOE)联合提出“人类基因组计划”,随后得到了美国政府的批准,并于1990年正式实施,此后成为包括我国在内的国际合作项目。随着人类基因组计划的开展,许多模式生物的基因组计划也相继展开。自1995年以来,先后完成的基因组全序列测定的生物有:流感噬血杆菌(Haemophilus influenzae)、酿酒酵母(Saccharomyces cerevisiae)、线虫(Caenorhabditis elegans)、果蝇(Drosophila melanogaster)、拟南芥(Arabidopsis thaliana)[5]等。基因组全序列测定为全基因组关联分析(genomewide association studies,GWAS)的发展和应用打下了基础。
全基因组关联分析是综合考虑群体结构、全基因组连锁不平衡(linkage disequili brium,LD)水平和表型数据进行分析方法。全基因组关联分析分辨率取决于LD水平和等位基因或单倍型频率。连锁不平衡,是指群体内不同座位等位基因的非随机关联,一般以r2(squared allelefrequency correlations)半长度的遗传距离表示[6]。样本量少、遗传隔离、群体分层、重组率低、群体混杂、遗传漂变及上位作用等会导致LD衰减距离增加,而高重组率、高突变率以及基因转换(gene conversion)等则会降低LD衰减距离,因此自花授粉的物种比异花授粉的物种具有更高的LD衰减距离[7]。群体的LD水平决定全基因组关联分析所需要的标记数量和密度。如果LD衰减距离较小,则关联作图需要大量的单核苷酸多态性(single nucleotide polymorphisms,SNP)标记,分辨率会较高;反之,需要的SNP标记较少,其分辨率也会较低[8]。GWAS的研究原理是:在基因水平上通过分子标记的手段,对整个基因组内的SNP进行综合分析与分型,再将不同表现的性状变异统计出来,提出假设,并且验证其与期望性状间的关联性[9]。全基因组关联分析需要选择一定数量覆盖全基因组的SNP对研究的群体进行全基因组扫描,然后将得到的分子数据与表型数据进行关联分析。类似于基于候选基因的关联分析,若某个SNP与表型性状显著关联,那么这个SNP与表型数据存在协同变异的关系。因此GWAS是一种综合系统的分析方法,除了检测基因组SNP之外,还需要考虑种质材料的代表性、材料的群体结构和LD分析、表型的选择与鉴定以及表型与基因型的关联分析模型的选择等[8]。
全基因组关联分析最早应用于人类的疾病研究,基于人类的全基因组关联分析是应用人类基因组中数以百万计的单核苷酸多态性为标记进行病例对照关联分析,以期发现影响复杂性疾病发生的遗传特征的一种新策略[10]。2005年,Science杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动,此后一系列GWAS陆续展开。现已经陆续报道了关于人类身高、体重、血压等主要性状,以及视网膜黄斑、白血病、冠心病、肥胖症、糖尿病、精神分裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果,确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异[10]。此外,复杂疾病的GWAS方法学(如研究设计、统计分析与结果的解释)也取得了极大的进步,因此称为“GWAS第一次浪潮”。受到人类疾病遗传学研究的启示,植物遗传育种学家将关联分析理论发展到作物遗传和育种研究中来,特别是在植物复杂性状,如数量性状的遗传基础的研究发挥了巨大作用,现已被广泛应用到植物遗传学和育种相关的性状研究中,并取得了一些重要进展。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/nongxue/zwbh/651.html