《第03章人类基因组学.ppt》由会员分享,可在线阅读,更多相关《第03章人类基因组学.ppt(45页珍藏版)》请在优知文库上搜索。
1、第三章第三章 人类基因组学人类基因组学(human genomics)第一节第一节 人类基因组和基因组学人类基因组和基因组学 基因组(基因组(genomegenome)生殖细胞含生殖细胞含1 1套基因组套基因组 1 1套来自父本生殖细胞套来自父本生殖细胞体细胞含体细胞含 2 2套基因组套基因组 1 1套来自母本生殖细胞套来自母本生殖细胞 完整的人类基因组包含:完整的人类基因组包含:1-221-22号常染色体号常染色体 核基因组核基因组 X X和和Y Y染色体染色体线粒体基因组线粒体基因组 基因组学基因组学 (genomics)是从基因组整体层次上系统地研究各生物种是从基因组整体层次上系统地研究
2、各生物种群基因组的结构和功能及相互关系的学科。群基因组的结构和功能及相互关系的学科。基因组学研究内容的三个基本方面:基因组学研究内容的三个基本方面:结构基因组学结构基因组学 (structural genomics)功能基因组学功能基因组学 (functional genomics)比较基因组学比较基因组学 (comparative genomics)由此又派生出其他研究分支。由此又派生出其他研究分支。第二节第二节 人类基因组计划人类基因组计划人类基因组计划人类基因组计划 (human genome project,HGP)是是20世纪世纪90年代开始的,由世界多个国家年代开始的,由世界多个国
3、家参与合作的系统地研究人类基因组的重大科研参与合作的系统地研究人类基因组的重大科研项目。项目。HGP的科学目标:的科学目标:是测定组成人类基因组的全部是测定组成人类基因组的全部DNA序列,序列,从而为阐明人类所有基因的结构与功能,解从而为阐明人类所有基因的结构与功能,解码人类生命奥秘奠基。码人类生命奥秘奠基。HGP的基本任务:的基本任务:构建人类基因组遗传图,物理图,序列构建人类基因组遗传图,物理图,序列图,为最终完成基因图打下基础。图,为最终完成基因图打下基础。HGP的技术成果的技术成果:主要体现在对人类基因组整体结构的认识,主要体现在对人类基因组整体结构的认识,即人类基因组遗传图、物理图、
4、序列图的完即人类基因组遗传图、物理图、序列图的完成,从而奠定了人类结构基因组学基础。而成,从而奠定了人类结构基因组学基础。而人类基因图的完成,仍有大量工作要做。人类基因图的完成,仍有大量工作要做。人类基因组计划的三个主要目标图示人类基因组计划的三个主要目标图示 遗传图(遗传图(genetic mapgenetic map)又称连锁图(又称连锁图(linkage maplinkage map)是将每条染色体上的基因或遗传标记的相是将每条染色体上的基因或遗传标记的相对位置经连锁分析确定下来,构成图谱。对位置经连锁分析确定下来,构成图谱。遗传距离:遗传距离:连锁图中两个基因间图距以连锁图中两个基因间
5、图距以1 1厘摩(厘摩(cMcM)1 1厘摩(厘摩(cMcM)=减数分裂时两个基因间重组减数分裂时两个基因间重组值为值为1%1%。遗传标记(遗传标记(genetic markergenetic marker)可以是任何一种呈孟德尔遗传的性状或可以是任何一种呈孟德尔遗传的性状或物质形式,如:基因、血型、血清蛋白、物质形式,如:基因、血型、血清蛋白、DNADNA多态标记等。确定其在基因组中的位置多态标记等。确定其在基因组中的位置后,可作为参照标记用于遗传重组分后,可作为参照标记用于遗传重组分析。析。第一代第一代(19751975)限制片断长度限制片断长度多态(多态(RFLPRFLP)分布数量分布数
6、量10105 5 多态程度较多态程度较低低,利用价利用价值受限值受限 第二代第二代(19891989)短串连复制序短串连复制序列 长 度 多 态列 长 度 多 态(STR)(STR)分布数量分布数量10104 4 高度多态高度多态 第三代第三代(19961996)单核苷酸多态单核苷酸多态(SNPSNP)分布数量分布数量3 310106 6 一般为二态一般为二态单体型分析单体型分析 DNADNA遗传标记遗传标记l 物理图(物理图(physical map)是要将随机长度的是要将随机长度的DNA片断在染色体上片断在染色体上的的 排列顺序确定下来。这些克隆排列顺序确定下来。这些克隆DNA片断片断连接
7、起来,形成重叠克隆群(连接起来,形成重叠克隆群(Conting),),再将一个个(再将一个个(Conting)相连成线状,覆盖整相连成线状,覆盖整个染色体。这主要靠单拷贝个染色体。这主要靠单拷贝DNA序列标定序列标定部位(部位(STS)作路标来实现。)作路标来实现。DNA序列标定部位(序列标定部位(seguones tagged site,STS)重叠克隆群(重叠克隆群(conting)YAC(yeast artificial chromosome)BAC(bacterial artificial chromosome)序列图(序列图(seguenceseguence map map)是通过对
8、基因组是通过对基因组DNADNA进行碱基排列顺序分进行碱基排列顺序分析而建立的。析而建立的。两种技术路线:两种技术路线:1.1.公共序列路线:即在物理图基础上,公共序列路线:即在物理图基础上,将各个将各个BACBAC克隆片段切成更短的片段,形成亚克隆片段切成更短的片段,形成亚克隆分别进行测序,再将相互重叠的读出序克隆分别进行测序,再将相互重叠的读出序列组装成连续重叠线。列组装成连续重叠线。2.“2.“鸟枪法鸟枪法”测序路线:即直接将基因组测序路线:即直接将基因组DNADNA分割成分割成20kb20kb左右的小片段进行随机测序,左右的小片段进行随机测序,再用超级计算机组装成重叠线。所形成的序再用
9、超级计算机组装成重叠线。所形成的序列图称列图称celeracelera序列。序列。ACGTCCGATCGGTTCATGCC ACGTCCGATCGGTTCATGCC TCGGTTCATGCCAATGCCGTCC TCGGTTCATGCCAATGCCGTCC基因图(基因图(gene mapgene map)即在序列图基础上,用不同的方法测即在序列图基础上,用不同的方法测定各个基因所在区域位置。定各个基因所在区域位置。基因图测定方法:基因图测定方法:1.CpG1.CpG岛的应用:大多数持家基因和岛的应用:大多数持家基因和40%40%组织特异性基因组织特异性基因55端均存在端均存在CpGCpG岛序列
10、。制岛序列。制备备探针,染色体涂染指示基因位置分布。探针,染色体涂染指示基因位置分布。2.2.计算机识别:研发计算机计算机识别:研发计算机GRAILGRAIL系统,可系统,可识别每个基因区的外显子识别每个基因区的外显子-内含子接头区保守内含子接头区保守序列。序列。3.cDNA3.cDNA策略:由组织细胞中表达策略:由组织细胞中表达mRNAmRNA,逆,逆转录合成转录合成cDNAcDNA片段,称为表达序列标签片段,称为表达序列标签(ESTEST),将收获),将收获ESTEST定位后,构建的图称为转定位后,构建的图称为转录图,是人类基因图雏形。录图,是人类基因图雏形。人类基因组结构的分析人类基因组
11、结构的分析 1.1.人类基因组人类基因组DNADNA全长约全长约3 310109 9bpbp,相当,相当36003600厘摩(厘摩(cMcM)。其中仅有约)。其中仅有约5%5%的序列为编码的序列为编码序列(编码蛋白或序列(编码蛋白或tRNAtRNA、rRNArRNA等)。等)。2.2.人类基因组中可能有人类基因组中可能有30000-4000030000-40000个基因,个基因,其中编码蛋白质的外显子只占基因组其中编码蛋白质的外显子只占基因组DNADNA的的1%1%,内含子则占内含子则占24%24%。每个基因平均长。每个基因平均长27kb27kb,平均,平均含有含有9 9个外显子。不同个体间,
12、基因编码仅有个外显子。不同个体间,基因编码仅有0.01%0.01%的差异。的差异。3.3.基因在各个染色体上的分布是不均基因在各个染色体上的分布是不均匀的,匀的,1717、1919、2222号染色体基因密度最高,号染色体基因密度最高,而而4 4、1313、1818、X X、Y Y染色体基因密度最低。染色体基因密度最低。人类基因组中约人类基因组中约20%20%的区段是没有基因的的区段是没有基因的“沙漠沙漠”。后基因组计划后基因组计划(past-genome project,PGP)PGP的研究领域的研究领域人类基因组多样性计划人类基因组多样性计划 环境基因组学环境基因组学功能基因组学(蛋白组学)
13、功能基因组学(蛋白组学)疾病基因组学疾病基因组学比较基因组学比较基因组学 药物基因组学药物基因组学生物信息学生物信息学第三节第三节 后基因组计划后基因组计划一、人类基因组多样性计划(人类基因组多样性计划(human human genome genome diversitydiversity project project,HGDPHGDP)人类基因数量一致人类基因数量一致3-43-4万个万个人类基因组人类基因组DNADNA总量均为总量均为3 310109 9bpbp不同个体基因编码仅有不同个体基因编码仅有0.01%0.01%差异差异种族多样性种族多样性族群多样性族群多样性个体特异性个体特异性
14、人类基因组的多样性与同一性人类基因组的多样性与同一性二、功能基因组学二、功能基因组学功能基因组学(功能基因组学(functional genomicsfunctional genomics)转录图转录图基因表达图:三维转录图。基因表达图:三维转录图。不同时间不同时间不同基因不同基因不同表达水平不同表达水平不同发育期不同发育期不同组织不同组织不同表达水平不同表达水平同一同一组织组织同一同一基因基因三、比较基因组三、比较基因组学学(comparative genomics)各种模式生物基因组序列的比较各种模式生物基因组序列的比较生物种类生物种类 基因组大小基因组大小 预测基因组数目预测基因组数目
15、基因平均长度基因平均长度 大肠杆菌大肠杆菌4.6Mb 4.6Mb 1800 1800 约约1 1kbkb 酵母酵母 12Mb 12Mb 5800 5800 约约2 2kbkb 秀丽线虫秀丽线虫 97Mb97Mb18500 18500 约约5.35.3kbkb 果蝇果蝇 116Mb 116Mb 13600 13600 约约1010kbkb 小鼠小鼠 3000Mb3000Mb4000040000约约3030kbkb 人人 3164Mb 3164Mb 30000-40000 30000-40000 2727kbkb 生物基因组进化的连续性分析生物基因组进化的连续性分析 21%21%的基因原核生物和真
16、核生物共有的基因原核生物和真核生物共有 32%32%的基因真核生物共有而原核生物没有的基因真核生物共有而原核生物没有 24%24%的基因动物所共有的基因动物所共有 22%22%的基因脊椎动物特有的基因脊椎动物特有四、环境基因组学四、环境基因组学(enviromental genomics)是研究与环境因素相关的疾病易感性基因的。是研究与环境因素相关的疾病易感性基因的。环境相关的疾病易感基因环境相关的疾病易感基因基因多态性基因多态性 分类分类 环境成份环境成份 相关疾病相关疾病 CYPCYP1 1A A1 1 激活激活吸烟吸烟 肺癌肺癌GST GST 解毒解毒 吸烟吸烟 肺癌肺癌NATNAT2 2 解毒解毒吸烟吸烟 膀胱癌、乳腺癌膀胱癌、乳腺癌 TCFTCF2 2转录因子转录因子母亲吸烟母亲吸烟 唇裂、腭裂唇裂、腭裂ALAD ALAD 生物合成生物合成 铅铅 铅中毒铅中毒 五、疾病基因组学五、疾病基因组学(morbid genomics)主要任务是分离重要疾病的致病基因与相主要任务是分离重要疾病的致病基因与相关基因,并确定其致病机制。关基因,并确定其致病机制。1.1.肿瘤癌基因和抑癌基因