基因芯片原理及数据分析01.ppt

上传人:王** 文档编号:697231 上传时间:2023-12-13 格式:PPT 页数:46 大小:1.06MB
下载 相关 举报
基因芯片原理及数据分析01.ppt_第1页
第1页 / 共46页
基因芯片原理及数据分析01.ppt_第2页
第2页 / 共46页
基因芯片原理及数据分析01.ppt_第3页
第3页 / 共46页
基因芯片原理及数据分析01.ppt_第4页
第4页 / 共46页
基因芯片原理及数据分析01.ppt_第5页
第5页 / 共46页
基因芯片原理及数据分析01.ppt_第6页
第6页 / 共46页
基因芯片原理及数据分析01.ppt_第7页
第7页 / 共46页
基因芯片原理及数据分析01.ppt_第8页
第8页 / 共46页
基因芯片原理及数据分析01.ppt_第9页
第9页 / 共46页
基因芯片原理及数据分析01.ppt_第10页
第10页 / 共46页
亲,该文档总共46页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基因芯片原理及数据分析01.ppt》由会员分享,可在线阅读,更多相关《基因芯片原理及数据分析01.ppt(46页珍藏版)》请在优知文库上搜索。

1、基因芯片原理及数据分析参考教材和资料基因芯片数据分析与处理李瑶 化学工业出版社 2006年生物芯片分析 美M.谢纳 著 科学出版社DNA芯片技术的方法与应用 马文丽 郑文岭 广东科技出版社生物芯片技术 邢婉丽 程京 清华大学出版社生物芯片技术 陈忠斌 化学工业出版社基因芯片与功能基因组 李瑶 化学工业出版社Google,ncbi,endnote:网络资源,文章(Paper)相关关键词microarray,gene chip,gene expression内容基因芯片技术(概念、制作过程、应用等)基因芯片数据分析一般流程和主要内容课程目的基因芯片分析流程生物学问题实验设计图像采集和处理(图像分析

2、)芯片实验预处理和标准化聚类分析差异表达基因分析判别分析基因网络分析生物学解释和验证基因芯片数据分析基因芯片的产生 人类基因组计划完成,人类基因组研究的重心逐渐进入后基因组时代(Postgenome Era)向基因的功能及基因的多样性倾斜,基因芯片正是迎合这一需要产生的 基因芯片技术在不同学科和技术的基础上发展起来的。基因芯片技术基因芯片的技术发展历史基因芯片技术vBased on Southern BIot Technology(Edward Southern,1975,J.Mol.Biol.)v1990:first high-density Nylon filter Arrays(Lenn

3、on/Lehrach,1991,Trends Genet.,Review)v1995:cDNA-Microarrays described by Schena et al,Sciencev1996:Affymetrix Genechip Technology described by Lockhart et al,Nat.Biotechnol 基因芯片的概念v基因芯片基因芯片(Gene chip)(Gene chip)指对数以千记的指对数以千记的DNA片段同时进片段同时进行处理分析的技术,诸如基因组行处理分析的技术,诸如基因组DNA突变谱和突变谱和 mRNA表表达谱的检测等。达谱的检测等。该技

4、术系指将大量该技术系指将大量探针探针分子固定于分子固定于支持支持物物上后与标记的上后与标记的样品分子样品分子进行杂交,通过检测每个探针分进行杂交,通过检测每个探针分子的杂交子的杂交信号强度信号强度进而进而进行大量的基因表达及监测等方面进行大量的基因表达及监测等方面研究的最新革命性技术。研究的最新革命性技术。v探针:所谓基因探针只是一段人工合成的探针:所谓基因探针只是一段人工合成的碱基序列碱基序列,在探,在探针上连接一些可检测的物质,根据碱基互补的原理,利用针上连接一些可检测的物质,根据碱基互补的原理,利用基因探针到基因混合物中识别特定基因。它将大量探针分基因探针到基因混合物中识别特定基因。它将

5、大量探针分子固定于支持物上,然后与标记的样品进行杂交,通过检子固定于支持物上,然后与标记的样品进行杂交,通过检测杂交信号的强度及分布来进行分析。测杂交信号的强度及分布来进行分析。基因芯片示例图片基因芯片示例图片基因芯片技术基因芯片原型基因芯片技术基因芯片的制作、检测基因芯片技术基因芯片的其他称呼v通常用计算机硅芯片作为固相支持物,所以基因芯通常用计算机硅芯片作为固相支持物,所以基因芯片片(gene chip)又称又称DNA芯片芯片,DNA微阵列微阵列(DNA microarray)。DNA芯片为生物芯片芯片为生物芯片(biochip)的一的一种,基因芯片是生物芯片中应用最广泛、技术最成种,基因

6、芯片是生物芯片中应用最广泛、技术最成熟的一种熟的一种,它来源于计算机芯片它来源于计算机芯片.一块基因芯片相当一块基因芯片相当于一个集成处理器于一个集成处理器,其中的每个探针相当于一个探头其中的每个探针相当于一个探头,能对相关及大量信息实现同时、自动和快速的采集、能对相关及大量信息实现同时、自动和快速的采集、传输、分析和处理传输、分析和处理,做出相应的检测和诊断做出相应的检测和诊断.基因芯片技术什么是生物芯片(Biochips)?生物芯片是将大量生物识别分子按预先设置的排列固定于一种载体(如硅片、玻片及高聚物载体等)表面,利用生物分子的特意性亲和反应,如核酸杂交反应,抗原抗体反应等来分子各种生物

7、分子存在的量的一种技术。生物芯片包括:生物芯片包括:DNA芯片芯片蛋白质芯片蛋白质芯片组织芯片组织芯片其它芯片其它芯片基因芯片技术基因芯片分类v根据功能根据功能基因表达谱芯片基因表达谱芯片DNADNA测序芯片测序芯片疾病监测的诊断类芯片疾病监测的诊断类芯片。v根据探针类型根据探针类型CdnaCdna寡核苷酸寡核苷酸基因芯片技术基因芯片分类v按制备方式按制备方式原位合成:指根据预先设计的点阵序列在每个位点通过有机合成的方式直接聚合得到所要求的探针分子。聚合之后芯片片基的制作即告结束。-Affymetrix公司研制 安捷伦公司点样法(1)首先是探针库的制备,根据基因芯片的分析目标从相关的基因数据库

8、中选取特异的序列进行PCR扩增或直接人工合成寡核苷酸序列,(2)然后通过计算机控制的三坐标工作平台用特殊的针头和微喷头分别把不同的探针溶液逐点分配在玻璃、尼龙以及其它固相基片表面的不同位点上,通过物理和化学的方法使之固定 该方法各技术环节均较成熟,且灵活性大,适合于研究单位根据需要自行制备点阵规模适中的基因芯片 斯坦福大学基因芯片技术基因芯片的优点v基因芯片的最大优点在于其高通量。传统方法检测众多基因要经历多次实验而且自动化程度低,因而每次实验之间是存在系统误差的。基因芯片可以克服这个缺点,众多基因的探针的标记、杂交等过程是在一次实验过程中完成的,而且自动化程度高,数据客观可靠。基因芯片技术基

9、因芯片的缺点 基因芯片的缺点在于其不能对待检测基因在多细胞类型组织中的精确定位进行判断。另外很多蛋白质调节其功能不主要是依赖其是否表达或表达量高低,而是依赖蛋白质磷酸化-去磷酸化等方式。在这种情况下,用核酸类生物芯片就没有什么意义了,蛋白类芯片可能会有所作为的。从数据分析的角度,高维,小样本,高噪。基因芯片技术基因芯片的应用v发育相同的遗传物质,不同的细胞形状、大小、功能等 全基因组表达谱研究-分子调控v疾病研究不同疾病导致不同的基因表达异常 比较正常组织和疾病组织的表达谱差异-疾病发生的分子基础-预防和治疗v药物发现很多药物通过与特定的药靶结合,抑制蛋白质的功能,影响基因的表达 比较病人疾病

10、发生的过程和用药过程基因表达的变化情况-药物发现、毒理研究和临床药效研究-降低成本、缩短研发周期、降低药物的毒副作用等v遗传筛查和诊断人类基因的多态性-个性化诊疗基因芯片数据分析流程生物学问题实验设计图像采集和处理(图像分析)芯片实验预处理和标准化聚类分析差异表达基因分析判别分析基因网络分析生物学解释和验证基因芯片数据分析基因芯片图像的处理v划格v分割v信息提取杂交后数据的获得v两张图的获得:对双色cDNA芯片经激光扫描仪扫描后,Cy3(参照样本)、CY5(实验样本)v对每个点四个数据的获得红色前景荧光强度 Rf 红色背景荧光强度 Rb绿色前景荧光强度 Gf 绿色背景荧光强度 Gb对荧光强度可

11、以用相应信号像素强度的平均值,中位值,众数值获得v背景校正后红色荧光强度R=Rf-Rb 绿色荧光强度G=Gf-GbvM和A点的对数差异表达比M=log2(R/G):样本相对于参照样本的相对表达强度点的对数强度=1/2(log2RG)=1/2(log2R+log2G):点的整体亮度 备注:对Affymetrix采用的短的寡核苷酸芯片,采用单色荧光标记,则表达值为实验组合对照组两张芯片的信号比值数据v数据表示:常用矩阵表示,即行列表示v含义v主要基因芯片数据库smd,Geo(www.ncbi,nih.gov/geo),EBI ArrayExpressOutline得到矩阵后?芯片数据:众多基因的时

12、空表达情况v基因表达模式-聚类v差异表达基因筛选(疾病相关基因筛选)v疾病类型识别v网络分析:通过芯片数据找出基因之间的相互作用v基因注释v其他基因芯片数据分析流程生物学问题实验设计图像采集和处理(图像分析)芯片实验预处理和标准化聚类分析差异表达基因分析判别分析基因网络分析生物学解释和验证基因芯片数据分析v基因芯片数据的预处理是一个十分关键的步骤,通过数据过滤获取需要的数据、数据转换满足正态分布的分析要求、缺失值的估计弥补不完整的数据、数据归一化纠正系统误差等处理为后续分析工作做准备,预处理分析的重要性并不亚于基因芯片的后续分析,它将直接影响后续分析是否能得到预期的结果,Arraytools预

13、处理和归一化v背景的校正v弱信号的处理v数据的对数转换v重复数据的合并v异常值和缺失值得处理v数据的归一化一、背景的校正v原因:点的荧光强度是背景荧光和标记DNA产生的荧光的共同作用,减去背景荧光强度才能真正反映基因的真实转录水平v方法局部背景校正亚栅格背景校正分组背景校正空白点背景校正对照点背景校正二、弱信号的处理v原因(背景):很多点信号强度很弱,但是并不是低质量的点,不能删除。v弱信号点的分类:1)噪声引起,尤其当前景信号强度接近背景信号强度,背景校正后,红绿光的荧光强度波动较大 2)重要信息点:可能少量的表达就起到重要的作用弱信号的处理方法分离噪声和有价值意义的弱信号点v1)重复芯片试

14、验,观察弱信号点的稳定性,但成本高,提高分析的复杂性;v2)找到一个适当的信号强度阈值,低于该值的点删掉简单信号强度阈值信噪比通过背景、空白点、阴性对照点确定弱信号的阈值信号强度的累积分布函数确定阈值三、数据的对数转换对换原因v生物学上易于理解v使数据的分布满足对称性和近似正态分布、满足常用的统计分析方法v使用的方便性四、重复数据的合并v重复的必要性:减少变异,增强稳定性,便于统计分析v重复的类型点的重复:注意合理布局芯片的重复:技术重复:RNA制备重复、标记重复、杂交重复生物学重复v重复数据的合并计算重复值的集中趋势指标五、异常值和缺失值的处理v异常值的产生芯片的缺陷点像素强度达到饱和点像素

15、强度非常小v异常值的处理删掉,微阵列获取软件标记,数据预处理阶段去除v缺失值的产生:异常值去除缺失值的处理v处理的必要性:一些统计学方法要求数据的完整性,比如奇异值分解,某些基因的聚类分析v处理的方法删掉缺失值得整条记录(所在行和列,即删掉基因和相关的样本)便于操作,但是会丢失大量有价值的信息数据填充使用重复数据点利用基因的相关性使用重复数据点v条件:缺失数据发生在含有重复测量点v方法:利用未缺失的重复数据点的集中趋势指标估计单张芯片上的重复点技术重复:可以用其他进行技术重复的芯片上集中趋势来估计生物学重复:需要谨慎,尽量使用同质的样品估计,例如癌症组织的某个样品的某个基因的缺失,不能用正常组

16、织样本利用基因的相关性v预测模型的建立应变量:需要填充的变量自变量:其他变量(不能有缺失值)v方法行均数、中位数、0等简单填充使用回归模型对每个变量的缺失数据进行迭代性的预测奇异值分解(特征选择、特征提取)有一个适当完整的基因数据集没有或者难于找到一个完整的基因数据集 K-近邻法K-近邻法v方法(假定某个基因在某个指标上有缺失值)计算缺失值的基因和其他基因的相似性指标和距离指标(要估计的指标不参与计算)该基因的K个最近邻:找出与该基因最相似的K个基因计算这K个基因在该指标上的均数或者加权均数 K一般取10-20之间(Troyanskaya等分析发现的结果)六、数据的归一化v原因:系统误差的存在,使得同一芯片上和不同芯片间基因表达水平的直接比较无法实现,需要消除它点样头芯片的空间位置影响Cy3和Cy5的因素v随机变异:随机因素引起,无法控制v系统变异:系统变异u样品的生物学变异:研究的目的u系统误差:Cy3和Cy5等荧光标记物的物理化学性质扫描仪的属性设置对荧光强度测量的影响两种荧光标记物在标记效率上的差异不同点样头的差异芯片的空间位置的不同使得测量结果不能反映生物学差异,使得同一芯片上

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!