《第03章基因与基因组.ppt》由会员分享,可在线阅读,更多相关《第03章基因与基因组.ppt(51页珍藏版)》请在优知文库上搜索。
1、基因与基因组的结构基因与基因组的结构第第 三章三章第一节基因的概念第一节基因的概念 基因基因(gene)是原核、真核生物以及病毒的)是原核、真核生物以及病毒的DNA和和RNA分子分子中具有遗传效应的核苷酸序列,是遗中具有遗传效应的核苷酸序列,是遗传的基本单位。包括编码蛋白质和传的基本单位。包括编码蛋白质和tRNA、rRNA的的结构基因结构基因,以及具有调节控制作用的,以及具有调节控制作用的调控基因调控基因。基因从结构上定义,基因从结构上定义,是指是指DNA分子中的特定区段,分子中的特定区段,其中的核苷酸排列顺序决定了基因的功能。其中的核苷酸排列顺序决定了基因的功能。结构基因:结构基因:具有编码
2、功能的具有编码功能的DNADNA序列。序列。在原核生物在原核生物中结构基因占整个基因组中结构基因占整个基因组DNA的大部分,而在真的大部分,而在真核生物中可能只占一小部分。核生物中可能只占一小部分。调节基因:在结构基因之间还含有大量没有编码调节基因:在结构基因之间还含有大量没有编码功能的间隔区,其中包括与复制、转录、翻译过功能的间隔区,其中包括与复制、转录、翻译过程有关的,能被调控分子识别的序列。程有关的,能被调控分子识别的序列。乳糖操纵子乳糖操纵子(lac operon)的结构的结构 调控区调控区CAP结合位点结合位点启动序列启动序列操纵序列操纵序列 结构基因结构基因Z:-半乳糖苷酶半乳糖苷
3、酶Y:透酶透酶A:乙酰基转移酶:乙酰基转移酶ZYAOPDNA 基因主要位于染色体上,除了染色体基因主要位于染色体上,除了染色体DNA外,细菌的质粒、真核生物的叶绿体、线外,细菌的质粒、真核生物的叶绿体、线粒体等细胞器都含有一定的粒体等细胞器都含有一定的DNA序列,其序列,其上大部分是具有遗传功能的基因,这些染上大部分是具有遗传功能的基因,这些染色体外的色体外的DNA称为称为染色体外遗传物质染色体外遗传物质。基因是基因是DNADNA分子上的结构单位,在染色体或分子上的结构单位,在染色体或DNADNA分分子上,基因成串排列。子上,基因成串排列。一个顺反子就是一段核苷酸序列,能编码一条完一个顺反子就
4、是一段核苷酸序列,能编码一条完整的多肽链。顺反子是整的多肽链。顺反子是DNADNA分子的功能单位。分子的功能单位。现代分子生物学文献中,顺反子和基因这两个术现代分子生物学文献中,顺反子和基因这两个术语互相通用。一般而言,一个顺反子就是一个基语互相通用。一般而言,一个顺反子就是一个基因。因。基因的主要编码产物是多肽链,另外还包括许多基因的主要编码产物是多肽链,另外还包括许多编码编码RNARNA的基因,例如的基因,例如rRNArRNA、tRNAtRNA以及其他小分子以及其他小分子RNARNA等都是基因编码的产物。等都是基因编码的产物。第二节基因的命名第二节基因的命名 1.用三个小写英文斜体字母表示
5、基因的名称,例如用三个小写英文斜体字母表示基因的名称,例如涉及乳糖代谢相关的酶基因:涉及乳糖代谢相关的酶基因:lac;涉及亮氨酸代;涉及亮氨酸代谢相关的酶基因:谢相关的酶基因:leu。2.在三个小写英文斜体字母后面加上一个斜体大写在三个小写英文斜体字母后面加上一个斜体大写字母表示其不同的基因座,全部用正体时表示蛋字母表示其不同的基因座,全部用正体时表示蛋白产物和表型;例如,对于大肠杆菌和其他细菌,白产物和表型;例如,对于大肠杆菌和其他细菌,用三个小写字母表示一个操纵子,接着的大写字用三个小写字母表示一个操纵子,接着的大写字母表示不同基因座,母表示不同基因座,lac操纵子的基因座:操纵子的基因座
6、:lacZ,lacY,lacA;其表达产物蛋白质则是;其表达产物蛋白质则是 lacZ,lacY,lacA。调控区调控区CAP结合位点结合位点启动序列启动序列操纵序列操纵序列 结构基因结构基因Z:-半乳糖苷酶半乳糖苷酶Y:透酶透酶A:乙酰基转移酶:乙酰基转移酶ZYAOPDNA 3.对于质粒和其他染色体外成分,如果是自然产生对于质粒和其他染色体外成分,如果是自然产生的质粒,用三个正体字母表示,第一个字母大写,的质粒,用三个正体字母表示,第一个字母大写,例如:例如:Pst I;但如果是重组质粒,则在两个大写;但如果是重组质粒,则在两个大写字母之前加一个字母之前加一个p,大写字母表示构建该质粒的,大写
7、字母表示构建该质粒的研究者或单位。例如:研究者或单位。例如:pSC101,(,(SC代表代表 Stanley Cohen),及),及 pMT555(MT代表代表 Manchester Technology)。)。4.对于酵母,一般用三个大写斜体字母表对于酵母,一般用三个大写斜体字母表示基因的功能,后面的数字表示不同的基示基因的功能,后面的数字表示不同的基因座。例如,啤酒酵母基因因座。例如,啤酒酵母基因GAL4,CDC28;其表达的蛋白质则是:其表达的蛋白质则是:GAL4,CDC28。5.脊椎动物一般用描述基因功能的脊椎动物一般用描述基因功能的14个小写字个小写字母和数字表示其基因功能。例如,基
8、因母和数字表示其基因功能。例如,基因sey,myc,蛋白蛋白Sey,Myc。6.人类基因的命名方法与脊椎动物相似,但需大人类基因的命名方法与脊椎动物相似,但需大写。例如基因是写。例如基因是MYC、ENO1,蛋白质则为,蛋白质则为MYC、ENO1。第三节第三节 真核生物的断裂基因真核生物的断裂基因 1977年Berget等首先发现,在真核生物基因组中,在真核生物基因组中,基因是不连续的,在基因的编码区域内部含有大基因是不连续的,在基因的编码区域内部含有大量的不编码序列,量的不编码序列,从而隔断了对应于蛋白质的氨基酸序列。这一发现大大地改变了以往人们对基因结构的认识。这种不连续的基因又称断裂基因这
9、种不连续的基因又称断裂基因或割裂基因(或割裂基因(split gene)。指基因的编码序列在)。指基因的编码序列在DNA分子上不连续排列,而被不编码的序列所隔分子上不连续排列,而被不编码的序列所隔开。开。真核生物结构基因,由若干个编码区和非真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因。的完整蛋白质,这些基因称为断裂基因。1.断裂基因断裂基因(splite gene)CABD编码区编码区 A、B、C、D非编码区非
10、编码区2.外显子外显子(exon)和内含子和内含子(intron)外显子外显子在断裂基因及其初级转录产物上出现,在断裂基因及其初级转录产物上出现,并表达为成熟并表达为成熟mRNA的核酸序列。的核酸序列。内含子内含子隔断基因的线性表达而在剪接过程中被隔断基因的线性表达而在剪接过程中被除去的核酸序列。除去的核酸序列。鸡卵清蛋白鸡卵清蛋白基因基因hnRNA首、尾修饰首、尾修饰hnRNA剪接剪接成熟的成熟的mRNA鸡鸡卵卵清清蛋蛋白白基基因因及及其其转转录、录、转转录录后后修修饰饰目目 录录 DNA和相应信使和相应信使RNA结构上的差异在结构上的差异在真核真核生物中普遍存在生物中普遍存在,某些低等真核
11、生物的线,某些低等真核生物的线粒体以及叶绿体基因中也发现有断裂基因,粒体以及叶绿体基因中也发现有断裂基因,但也有一些真核生物的结构基因不含内含但也有一些真核生物的结构基因不含内含子,如在酵母基因组中大部分的基因是不子,如在酵母基因组中大部分的基因是不中断的。中断的。断裂基因在细菌中较为少见。断裂基因在细菌中较为少见。断裂基因的内含子无论在数量和大小上都有很大断裂基因的内含子无论在数量和大小上都有很大差异,但大多数断裂基因都有共同的性质:外显差异,但大多数断裂基因都有共同的性质:外显子在基因中的排列顺序与它在成熟子在基因中的排列顺序与它在成熟mRNA产物中产物中的排列顺序相同;每种断裂基因在所有
12、组织中都的排列顺序相同;每种断裂基因在所有组织中都具有相同的内含子成分;核基因的内含子通常在具有相同的内含子成分;核基因的内含子通常在所有的可读框中都含有无义密码子(所有的可读框中都含有无义密码子(nonsense codon),因此一般没有编码功能;),因此一般没有编码功能;在内含子上发在内含子上发生的突变不影响蛋白质的结构生的突变不影响蛋白质的结构,所以其突变往往,所以其突变往往对生物体没有影响。对生物体没有影响。第四节第四节 基因及基因组的大小基因及基因组的大小 与与C C值矛盾值矛盾 外显子的大小与基因的大小并没有必然的联系。基因大小取决于它所包含的内含子的长度。基因大小取决于它所包含
13、的内含子的长度。基因大小还与它所包含内含子的数目有关。基因大小还与它所包含内含子的数目有关。从低等真核生物到高等真核生物的从低等真核生物到高等真核生物的mRNAmRNA和其基因和其基因的平均大小略有增加,平均外显子数目的明显增的平均大小略有增加,平均外显子数目的明显增加是真核生物基因的一种标志。加是真核生物基因的一种标志。真核生物基因组的真核生物基因组的C值(值(C-value):指):指一种生物的单倍体生物的单倍体基因组中的基因组中的DNA总量,以总量,以pg表示。表示。不同物种的C值差异很大,最小的支原体只有 106bp,而最大的如某些显花植物和两栖动物可达 1011bp。随着生物的进化,
14、生物体的结构和功能越来越复杂,其C值就越大,例如真菌和高等植物同属于真核生物,但后者的C值却大得多。高等生物一般C 值高于低等生物,但有例外。即C值反常现象。两栖类比哺乳类高。真核生物含有大量的重复DNA是原因。C C值矛盾(值矛盾(C value paradoxC value paradox)是指真核生)是指真核生物中物中 DNADNA含量的反常现象。含量的反常现象。主要表现为:主要表现为:C C值不随生物的进化程度和复杂性而增加;值不随生物的进化程度和复杂性而增加;亲缘关系密切的生物亲缘关系密切的生物C C值相差甚大;值相差甚大;高等真核生物具有比用于遗传高得多的高等真核生物具有比用于遗传
15、高得多的C C值。值。第五节第五节 重叠基因重叠基因 一、原核生物的重叠基因一、原核生物的重叠基因 这些重叠在一起的基因表达时使用了不同的阅读框,因此,虽然DNA序列相同,但表达的蛋白质不同。重叠基因及基因内基因的现象反映了原核生物利用有限的遗传资源表达更多生物功能的能力。二、真核生物的重叠基因二、真核生物的重叠基因 通常情况下真核生物基因组中很少有重基因。在一些基因中,选择性的基因表达模式引起了外显子连接途径的转变。所以一个特定的外显子可选择性地与不同的外显子连接形成信使RNA,在一段区域以一种途径表达时作为外显子,而以另一种途径表达时作为内含子。说明一段DNA序列通常可以多种方式发挥作用。
16、在这种选择性产生的两种蛋白质当中,一部分序列相同而其他部分可能不同。第六节第六节 基因组基因组基因组是指细胞或生物体中,一套完整单体的基因组是指细胞或生物体中,一套完整单体的遗传物质的总和。遗传物质的总和。一、原核生物的染色体基因组一、原核生物的染色体基因组是指其环状或线状的双链是指其环状或线状的双链DNA分子所含有的全分子所含有的全部基因。部基因。Ecoli染色体基因组是指存在于 Ecoli染色体上的全部基因。其双链环状的 DNA分子约含 42 106bp,含 4 000个基因。1.1.细菌的染色体基因组通常仅由一条环状双链细菌的染色体基因组通常仅由一条环状双链DNADNA分子组成。分子组成。细菌的染色体相对聚集在一起,形成一个较为致密的区域,称细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(为类核(nucleoidnucleoid)。)。类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋。染色体DNA通常与细胞膜相连,在DNA链上与DNA复制、转录有关的信号区域与细胞膜优先结合,如大肠杆菌染色体DNA的复制起点(OriC)、复制终