《第3章人类基因组学.ppt》由会员分享,可在线阅读,更多相关《第3章人类基因组学.ppt(51页珍藏版)》请在优知文库上搜索。
1、(Human genomics)第一节第一节 人类基因组人类基因组 人类基因组(human genome):是人类个体具有的遗传物质的总和是人类个体具有的遗传物质的总和。人类单倍体。人类单倍体基因组基因组DNADNA序列约含序列约含3.23.210109 9 bp bp,总共构成约,总共构成约2 2万万2.52.5万个基因。万个基因。生殖细胞含生殖细胞含1 1套基因组套基因组 1 1套来自父本生殖细胞套来自父本生殖细胞体细胞含体细胞含 2 2套基因组套基因组 1 1套来自母本生殖细胞套来自母本生殖细胞 完整的人类基因组包含:1 1 22 22号常染色体号常染色体 核基因组核基因组 X X和和Y
2、 Y染色体染色体线粒体基因组线粒体基因组 第二节第二节 人类基因组学人类基因组学 基因组学 (genomics)是从基因组整体层次上系统地研究各生物是从基因组整体层次上系统地研究各生物种群基因组的结构和功能及相互关系的学科。种群基因组的结构和功能及相互关系的学科。基因组学的研究内容主要包括:基因组学的研究内容主要包括:结构基因组学结构基因组学 (structural genomics)功能基因组学功能基因组学 (functional genomics)由此又派生出其他研究分支。由此又派生出其他研究分支。一、人类基因组计划一、人类基因组计划 人类基因组计划(human genome projec
3、t,HGP)概述 是是20世纪世纪90年代开始的,由世界多个国家年代开始的,由世界多个国家参与合作的系统地研究人类基因组的重大科研参与合作的系统地研究人类基因组的重大科研项目。项目。HGP的科学目标:是测定组成人类基因组的全部是测定组成人类基因组的全部DNA序列,序列,从而为阐明人类所有基因的结构与功能,解从而为阐明人类所有基因的结构与功能,解码人类生命奥秘奠定基础。码人类生命奥秘奠定基础。HGP的基本任务:构建人类基因组遗传图,物理图,序列构建人类基因组遗传图,物理图,序列图,为最终完成基因图打下基础。图,为最终完成基因图打下基础。HGP的技术成果:主要体现在对人类基因组整体结构的认识,主要
4、体现在对人类基因组整体结构的认识,即人类基因组遗传图、物理图、序列图的完即人类基因组遗传图、物理图、序列图的完成,从而奠定了人类结构基因组学基础。而成,从而奠定了人类结构基因组学基础。而人类基因图的完成,仍有大量工作要做。人类基因图的完成,仍有大量工作要做。人类基因组计划的三个主要目标图示 (一)遗传图(genetic mapgenetic map)遗传图遗传图又称连锁图(又称连锁图(linkage maplinkage map)是将每条染色体上的基因或遗传标记的相是将每条染色体上的基因或遗传标记的相对位置经连锁分析确定下来,构成的图谱。对位置经连锁分析确定下来,构成的图谱。遗传距离:连锁图中
5、两个基因间图距用厘摩(连锁图中两个基因间图距用厘摩(cMcM)衡量)衡量 1 1厘摩(厘摩(cMcM)=减数分裂时两个基因间重组值减数分裂时两个基因间重组值为为1%1%。遗传标记(genetic markergenetic marker)可以是任何一种呈孟德尔遗传的性状或可以是任何一种呈孟德尔遗传的性状或物质形式,如:基因、血型、血清蛋白、物质形式,如:基因、血型、血清蛋白、DNADNA多态标记等。确定其在基因组中的位置多态标记等。确定其在基因组中的位置后,可作为参照标记用于遗传重组分析。后,可作为参照标记用于遗传重组分析。第一代第一代(19751975)限制片断长度限制片断长度多态(多态(R
6、FLPRFLP)分布数量分布数量10105 5 多态程度较多态程度较低低,利用价利用价值受限值受限 第二代第二代(19891989)短串联重复序短串联重复序列 长 度 多 态列 长 度 多 态(STR)(STR)分布数量分布数量10104 4 高度多态高度多态 第三代第三代(19961996)单核苷酸多态单核苷酸多态(SNPSNP)分布数量分布数量3 310106 6 覆盖密度高覆盖密度高DNA遗传标记l (二)物理图(physical map)即确定各遗传标志之间的物理距离的图即确定各遗传标志之间的物理距离的图谱,以碱基对(谱,以碱基对(bpbp,kbkb,mbmb)数量表示。)数量表示。将
7、随机长度的将随机长度的DNA片断在染色体上的排片断在染色体上的排列顺序确定下来。这些克隆列顺序确定下来。这些克隆DNA片断连接起片断连接起来,形成重叠克隆群(来,形成重叠克隆群(Conting),再将一个),再将一个个(个(Conting)相连成线状,覆盖整个染色体。相连成线状,覆盖整个染色体。这主要靠单拷贝这主要靠单拷贝DNA序列即序列标签部位序列即序列标签部位(STS)作路标来实现。作路标来实现。序列标签部位(sequence tagged site,STS)重叠克隆群(重叠克隆群(conting)YAC(yeast artificial chromosome)BAC(bacterial
8、artificial chromosome)(三)序列图(seguence mapseguence map)是通过对基因组是通过对基因组DNADNA进行碱基排列顺序分进行碱基排列顺序分析而建立的图。析而建立的图。两种技术路线:两种技术路线:1.1.公共序列路线:公共序列路线:即在物理图基础上,即在物理图基础上,将各个将各个BACBAC克隆片段切成更短的片段,形成亚克隆片段切成更短的片段,形成亚克隆分别进行测序,再将相互重叠的读出序克隆分别进行测序,再将相互重叠的读出序列组装成连续重叠线。列组装成连续重叠线。2.2.“鸟枪法鸟枪法”测序路线:测序路线:即直接将基因组即直接将基因组DNADNA分割
9、成分割成2kb2kb左右的小片段进行随机测序,左右的小片段进行随机测序,再用超级计算机组装成重叠线。所形成的序再用超级计算机组装成重叠线。所形成的序列图称列图称celeracelera序列。序列。ACGTCCGATCGGTTCATGCC ACGTCCGATCGGTTCATGCC TCGGTTCATGCCAATGCCGTCC TCGGTTCATGCCAATGCCGTCC (四)基因图(gene mapgene map)即在序列图基础上,用不同的方法测即在序列图基础上,用不同的方法测定各个基因所在区域位置。定各个基因所在区域位置。基因图测定方法:基因图测定方法:1.CpG1.CpG岛的应用:岛的应
10、用:大多数持家基因和大多数持家基因和40%40%组织特异性基因组织特异性基因5 5端均存在端均存在CpGCpG岛序列。制备岛序列。制备探针,染色体涂染指示基因位置分布。探针,染色体涂染指示基因位置分布。2.2.计算机识别:计算机识别:研发计算机研发计算机GRAILGRAIL系统,可系统,可识别每个基因区的外显子识别每个基因区的外显子-内含子接头区保守内含子接头区保守序列。序列。3.cDNA3.cDNA策略:策略:由组织细胞中表达由组织细胞中表达mRNAmRNA,逆,逆转录合成转录合成cDNAcDNA片段,称为表达序列标签片段,称为表达序列标签(ESTEST),将收获),将收获ESTEST定位后
11、,构建的图称为转定位后,构建的图称为转录图,是人类基因图雏形。录图,是人类基因图雏形。人类基因组结构的分析 1.1.人类基因组人类基因组DNADNA全长约全长约3.23.210109 9bpbp,相当,相当36003600厘摩(厘摩(cMcM)。其中仅有约)。其中仅有约5%5%的序列为编码的序列为编码序列(编码蛋白或序列(编码蛋白或tRNAtRNA、rRNArRNA等)。等)。2.2.人类基因组中可能有人类基因组中可能有20000 20000 25000 25000个个基因,其中编码蛋白质的外显子只占基因组基因,其中编码蛋白质的外显子只占基因组DNADNA的的1%1%,内含子则占,内含子则占2
12、4%24%。每个基因平均长。每个基因平均长27kb27kb,平均含有,平均含有9 9个外显子。个外显子。3.3.基因在各个染色体上的分布是不均基因在各个染色体上的分布是不均匀的,匀的,1717、1919、2222号染色体基因密度最高,号染色体基因密度最高,而而4 4、1313、1818、X X、Y Y染色体基因密度最低。染色体基因密度最低。人类基因组中约人类基因组中约20%20%的区段是没有基因的的区段是没有基因的“沙漠沙漠”。后基因组计划(past-genome project,PGP)在基因组层次上研究所有基因的表达、调控在基因组层次上研究所有基因的表达、调控与功能,即功能基因组学。与功能
13、,即功能基因组学。PGP的研究领域的研究领域人类基因组多样性计划人类基因组多样性计划 环境基因组学环境基因组学蛋白质组学蛋白质组学 疾病基因组学疾病基因组学比较基因组学比较基因组学 药物基因组学药物基因组学生物信息学生物信息学二、后基因组计划二、后基因组计划(一)人类基因组多样性计划(human genome diversity project,HGDP)人类基因数量约人类基因数量约2 2万万 2.52.5万个万个人类基因组人类基因组DNADNA总量均为总量均为3.23.210109 9bpbp不同个体基因编码仅有不同个体基因编码仅有0.01%0.01%差异差异种族多样性种族多样性族群多样性族
14、群多样性个体特异性个体特异性人类基因组的多样性与同一性(二)比较基因组学(comparative genomics)是对不同物种的基因组及其表达产物进行比较是对不同物种的基因组及其表达产物进行比较研究的学科。研究的学科。各种模式生物基因组序列的比较各种模式生物基因组序列的比较生物种类生物种类 基因组大小基因组大小 预测基因组数目预测基因组数目 基因平均长度基因平均长度 大肠埃希菌大肠埃希菌4.6Mb 4.6Mb 1800 1800 约约1 1kbkb 酵母酵母 12Mb 12Mb 5800 5800 约约2 2kbkb 秀丽线虫秀丽线虫 97Mb97Mb18500 18500 约约5.35.3
15、kbkb 果蝇果蝇 116Mb 116Mb 13600 13600 约约1010kbkb 小鼠小鼠 3000Mb3000Mb4000040000约约3030kbkb 人人 3164Mb 3164Mb 20000 20000 25000 25000 2727kbkb 生物基因组进化的连续性分析 21%21%的基因原核生物和真核生物共有的基因原核生物和真核生物共有 32%32%的基因真核生物共有而原核生物没有的基因真核生物共有而原核生物没有 24%24%的基因动物所共有的基因动物所共有 22%22%的基因脊椎动物特有的基因脊椎动物特有(三)蛋白质组学(proteomics)研究基因组表达的全部蛋白
16、质及其相互研究基因组表达的全部蛋白质及其相互作用的科学。作用的科学。转录图转录图 基因表达图:三维转录图。基因表达图:三维转录图。不同时间不同时间不同基因不同基因不同表达水平不同表达水平不同发育期不同发育期不同组织不同组织不同表达水平不同表达水平同一同一组织组织同一同一基因基因(四)环境基因组学(enviromental genomics)是研究与环境因素相关的疾病易感性基因的。是研究与环境因素相关的疾病易感性基因的。环境相关的疾病易感基因环境相关的疾病易感基因基因多态性基因多态性 分类分类 环境成份环境成份 相关疾病相关疾病 CYPCYP1 1A A1 1 激活激活吸烟吸烟 肺癌肺癌GST GST 解毒解毒 吸烟吸烟 肺癌肺癌NATNAT2 2 解毒解毒吸烟吸烟 膀胱癌、乳腺癌膀胱癌、乳腺癌 TCFTCF2 2转录因子转录因子母亲吸烟母亲吸烟 唇裂、腭裂唇裂、腭裂ALAD ALAD 生物合成生物合成 铅铅 铅中毒铅中毒 (五)疾病基因组学(morbid genomics)主要任务是分离重要疾病的致病基因与相主要任务是分离重要疾病的致病基因与相关基因,并确定其致病机制。关基因,并确定其