高通量测序,名词解释.docx

上传人:王** 文档编号:1058196 上传时间:2024-03-22 格式:DOCX 页数:9 大小:27.20KB
下载 相关 举报
高通量测序,名词解释.docx_第1页
第1页 / 共9页
高通量测序,名词解释.docx_第2页
第2页 / 共9页
高通量测序,名词解释.docx_第3页
第3页 / 共9页
高通量测序,名词解释.docx_第4页
第4页 / 共9页
高通量测序,名词解释.docx_第5页
第5页 / 共9页
高通量测序,名词解释.docx_第6页
第6页 / 共9页
高通量测序,名词解释.docx_第7页
第7页 / 共9页
高通量测序,名词解释.docx_第8页
第8页 / 共9页
高通量测序,名词解释.docx_第9页
第9页 / 共9页
亲,该文档总共9页,全部预览完了,如果喜欢就下载吧!
资源描述

《高通量测序,名词解释.docx》由会员分享,可在线阅读,更多相关《高通量测序,名词解释.docx(9页珍藏版)》请在优知文库上搜索。

1、高通量测序根基知识汇总一代测序技术:即传统的Sanger测序法,Sanger法是根据核昔酸在待定序列模板上的引物点开场,随机在某一个特定的碱基处终止,并且在每个碱基后面进展荧光标记,产生以A、T、C、G完毕的四组不同长度的一系列核昔酸,每一次序列测定由一套四个单独的反响构成,每个反响含有所有四种脱氧核昔酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核甘三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-0H基团,使延长的寡聚核昔酸选择性地在G、A、T或C处终止,使反响得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核甘酸上,可通过高分辨率变性凝胶电泳别离大小

2、不同的片段,通过检测得到DNA碱基序列。二代测序技术:nextgenerationsequencing(NGS又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进展序列测定,从而使得对一个物种的转录组和基因组进展细致全貌的分析成为可能所以又被称为深度测序Deepsequencing)NGS主要的平台有Roche(4548i454+),Illumina(HiSeq2000/2500、GAnx、MiSeq),ABISOLiD等。基因:Gene,是遗传的物质根基,是DNA或RNA分子上具有遗传信息的特定核甘酸序列。基因通过复制把遗传信息传递给下T弋,使后代出现与

3、亲代相似的性状。DNA:Deoxyribonucleicacid,脱氧核糖核酸,T脱氧核甘酸分子由三局部组成:含氮碱基、脱氧核糖、磷酸。脱氧核糖核酸通过+5-磷酸二酯键按一定的顺序彼此相连构成长链,即DNA链,DNA链上特定的核昔酸序列包含有生物的遗传信息,是绝大局部生物遗传信息的载体。RNA:RibonucleicAcid,核糖核酸,一个核糖核甘酸分子由碱基,核糖和磷酸构成。核糖核甘酸经磷酯键缩合而成长链状分子称之为RNA链。RNA是存在于生物细胞以及局部病毒、类病毒中的遗传信息载体。不同种类的RNA链长不同,行使各式各样的生物功能,如参与蛋白质生物合成的RNA有信使RNAx转移RNA和核糖

4、体RNA等。16SrDNA:是沉降系数,是反映生物大分子在离心场中向下沉降速度的一个指标,值越高,说明分子越大。QNA(ribosomeDNAJ指的是原核生物基因组中编码核糖体RNACrRNAJ分子对应的DNA序列,16SrDNA是原核生物编码核糖体小亚基16SrRNA的基因。细菌rRNA核糖体RNA按沉降系数分为3种,分别为5S、16S和23SrRNA。16SrDNA是细菌染色体上编码16SrRNA相对应的DNA序列,存在于所有细菌染色体基因中。16SrRNA普遍存在于原核生物中。16SrRNA分子,其大小约154ObP,既含有高度保守的序列区域,又有中度保守和高度变化的序列区域,其可变区序

5、列因细菌不同而异,恒定区序列基本保守,所以可利用恒定区序列设计引物,将16SrDNA片段扩增出来,通过高通量测序利用可变区序列的差异来对不同菌属、菌种的细菌进展分类鉴定。cDNAcomplementaryDNA,互补脱氧核糖核酸,与RNA链互补的单链DNA,以RNA为模板,在反转录酶的作用下所合成的DNA0SmallRNA:生物体内一类高度保守的重要的功能分子,其大小在18-3Ont,包括microRNAxsiRNAxsnRNAxSnORNA和PiRNA(piwi-interactingRNA)等,它的主要功能是诱导基因沉默,调控细胞生长、发育、基因转录和翻译等生物学过程。以miRNA为例介绍

6、它们的功能TniRNA与RNA诱导沉默复合体RNAinducedsilencingcomplex,RISC)结合,并将此复合体与其互补的mRNA序列结合,根据靶序列与miRNA的互补程度,从而导致靶序列降解或干扰靶序列蛋白质的翻译过程。SD区域:Segmentduplication,串联重复是由序列相近的一些DNA片段串联组成。串联重复在人类基因多样性的灵长类基因中发挥重要作用。Genotypeandphenotype:基因型与表型,基因型是指某一生物个体全部基因组合的总称;表型,又称性状,是基因型和环境共同作用的结果。基因组:Genome,单倍体细胞核、细胞器线粒体、叶绿体或病毒粒子所含的全

7、部DNA分子或RNA分子。全基因组以。“。测序:又称从头测序,它不依赖于任何现有的序列资料,而直接对某个物种的基因组进展测序,然后利用生物信息学分析手段对序列进展拼接、组装,从而获得该物种的基因组序列图谱。全基因组重测序:对已有参考序列(ReferenceSequence)物种的不同个体进展基因组测序,并以此为根基进展个体或群体水平的遗传差异性分析。全基因组重测序能够发现大量的单核昔酸多态性位点(SNP)s拷贝数变异C。PyNUmberVariation,CNV、插入缺失失Del,Insertion/DeletiOn)、构造变异(StructureVariation,SVJ等变异类型,以准确快

8、速的方法将单个参考基因组信息上升为群体遗传特征。转录组:Transcriptome,是指特定生长阶段某组织或细胞内所有转录产物的集合;狭义上指所有mRNA的集合。转录组测序:对某组织在某一功能状态下所能转录出来的所有RNA进展测序,获得特定状态下的该物种的几乎所有转录本序列信息。通常转录组测序是指对mRNA进展测序获得相关序列的过程。其根据所研究物种是否有参考基因组序列分为转录组曲。心测序无参考基因组序列和转录组重测序有参考基因组序列。外显子组:Exome,人类基因组全部外显子区域的集合称为外显子组,是基因中重要的编码蛋白的局部,并涵盖了与个体表型相关的大局部的功能性变异。外显子组测序:是指利

9、用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进展高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究基因的SNP.InDel等具有较大的优势。目标区域测序垃用相关试剂盒对基因组上感兴趣的目标区域进展捕获富集后进展大规模测序,一般需要根据目标区域专门定制捕获芯片。宏基因组:Metagenome,指特定生活环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因。目前主要指环境样品中的细菌和真菌的基因组总和。宏基因组16SrRNA测序:可以对特定环境下的细菌和古细菌群体的微生物种类和风度进展有效的鉴定。对不同地点、不同条件下的多个样本16SrRNA的P

10、CR产物平行测序,可以比较不同样本间的微生物组成及成分差异,进而说明物种丰度、种群结果等生态学信息。表观遗传学:Epigenetics,是指在基因组DNA序列没有改变的情况下,基因的表达调控和性状发生了可遗传的变化。表观遗传的现象很多的有DNA甲基化DNAmethylation)f基因组印记genomicimpriting),母体效应maternaleffects),基因沉默genesilencing),核仁显性,休座子激活和RNA编辑(RNAediting)等。全基因组甲基化测序:DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二核昔酸的胞嗑嚏5,碳位共价键结合一个甲基基团。DN

11、A甲基化已经成为表观遗传学和表观基因组学的重要研究内容。甲基化是基因表达的主要调控方式之一,研究染色体DNA甲基化情况是了解基因调控的重要手段。对已经有参考基因组的物种的基因组DNA用标准亚硫酸氢盐Bisulfite处理后,未甲基化的胞口密陡C会脱氨基形成尿口密陡U,经PCR扩增,U替换为胸腺嘴咤T,而发生甲基化的胞D密碇C保持不变。将处理组与参考基因组序列进展比对,可发现甲基化位点并对甲基化情况进展定量分析的方法叫做全基因组甲基化测序。ChIp-Seq:ChromatinImmunoprecipitationsequencing,即染色质免疫共沉淀-测序技术,即通过染色质免疫共沉淀技术特异性

12、地富集目的蛋白结合的DNA片段。对富集得到的DNA片段进展纯化与文库构建,然后进展高通量测序,从而得到全基因组范围内可以与目的蛋白相互作用的DNA片段的方法叫做ChIP-Seqo数字表达谓:DigitaIGeneExpressionProfile,利用新一代高通量测序技术和高性能计算分析技术,能够全面、经济、快速地检测某一物种特定组织在特定状态下的基因表达情况,即运用特定的酶对mRNA距polyAtail21-25nt的位置进展酶切,所获得的带PolyA尾的序列(Tag)通过高通量测序,该tag被测得的次数即是对应基因的表达值。数字基因表达谱已被广泛应用于根基科学研究、医学研究和药物研发等领域

13、。特点是经济,但获得的数据量有限。假设想获得转录本的更多信息的话,一般都采用转录组测序的方法来测序。SBS:sequencingbysynthesis,边合成边测序反响,是指在DNA聚合酶的作用下延伸碱基所进展的测序。Run:指高通量测序平台单次上机测序反响。1.ane也叫ChanneI,单泳道,每条泳道包含2列column,每列分布有多个小区(tile),如图L不同的测序平台FIOWCHl中所含的Lane不一样如IHiSeq2000是2个flowcell,每个flowcell中含有8个lane;HiSeq2500是包含2个miniflowCeII快速运行模式和2个highoutputflow

14、cell,两个模式不能同时运行,其中每个miniflowcell包含2个Iane,每个highoutputflowcell中包含8个lane;Miseq系统的flowcell仅含有1个laneTile:小区,每条Lane中有2列tile,合计120个小区。每个小区上分布数目繁多的簇结合位点,如图I0Cluster:簇,在Illumina测序平台中会采用桥式PCR方式生产DNA簇,每个DNA簇才能产生亮度到达CCD可以分辨的荧光点。Index标签在川IImina平台的多重测序MultiplexedSeqllenCing过程中会使用Index来区分样品,并在常规测序完成后,针对Index局部额外进

15、展7个循环的测序,通过Index的识别,可以在1条Lane中区分12种不同的样品。Barcode:与Index同义,多指在RocheGSFLX454测序平台的16SPCR产物的测序过程中接头序列所包含的的用来区分不同样本的序列。PF%:PF%是指符合测序质量标准的簇的百分比,与测序的通量相关联。Fasta:一种序列存储格式。一个序列文件假设以FASTA格式存储,那么每一条序列的第一行以开头,而跟随的是序列的ID号即唯一的标识符及对该序列的描述信息;第二行开场是序列内容,序列短于61nt的,那么一行排列完;序列长于61nt的,那么每行存储61nt,最后剩下小于61nt的,在最后一行排列完;第二条

16、序列另起一行,仍然由和序列的ID号开场,以此类推。Fastq:Fastq是Solexa测序技术中一种反映测序序列的碱基质量的文件格式。第一行以符号开头,后面紧跟一个序列的描述信息;第二行是该序列的内容;第三行以+符号开头,后面可以是该序列的描述信息,也可省略;而第四行是第二行中的序列内容每个碱基所对应的测序质量值。Read:高通量测序平台产生的序列标签就称为readso基因组组装:进展基因组或转录组de/709测序时,物种基因组经构建不同的文库测序所得的片段需经过生物信息学手段对其进展整理拼接,并通过一定的标准如N50)对后续组装结果进展质量评估等,最终获得高准确度的基因组序列的过程。基因组测序深度:测序得到的总碱基数与待测基因组大小的比值。如测一个物种的全基因组的重测序,基因组大小约为5G,测序获得100G的数据量,那么测序深度为20

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 农林牧渔

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!