1.  > 蛋白质组学

蛋白质组学中的聚类分析-蛋白质组学数据

蛋白质组学中的聚类分析-蛋白质组学数据

大家好,今天小编关注到一个比较有意思的话题,就是关于蛋白质组学中的聚类分析的问题,于是小编就整理了4个相关介绍蛋白质组学中的聚类分析的解答,让我们一起看看吧。

  1. 基因表达数据的聚类分析方法
  2. 蛋白富集分析是那个类别?
  3. 蛋白质组学定量 Normalization 方法之一
  4. K-means聚类分析案例(一)

1、基因表达数据的聚类分析方法

分析基因表达数据的第一步是 在经典数据挖掘中对基因或样本进行聚类 。 可以根据基因在所有条件下的表达模式对基因进行聚类,并且可以使用所有基因的基因表达模式对样本进行聚类。

R语言中hclust函数的默认方法为最长距离法(complete-linkage)。以上的聚类过程即称之为 层级聚类 。

分析表达数据,(1)通过一系列的检测将待测的一组基因的变异标准化,然后成对比较线性协方差。(2)通过把用最紧密关联的谱来放基因进行样本聚类,例如用简单的层级聚类(hierarchical clustering)方法。

自从基因芯片技术产生以来,大量的生物数据需要分析,这些数据大多规格化之后以矩阵的形式表示和存储,俗称 DNA 微阵列矩阵或基因表达数据矩阵。一般的聚类是根据数据的全部属性将数据聚类,这种聚类方式称为传统聚类。

前不久我接触了这样一个分析,给定基因表达矩阵后,通过 自组织映射(Self-organizing map,SOM) 技术识别其中的高表达基因集,以便和功能建立关联。下文将该方法简称为SOM聚类分析,因为它就是一种基于神经网络的聚类算法。

2、蛋白富集分析是那个类别?

基因本体论富集分析(Gene 0ntology Enrichment Analysis) : 这是最常用的富集分析类型,用于验基因集合中基因本体论(GO)目的富集情况。这可以帮助研究者了解基因集合中的基因在生物学过程、分子功能和细胞组成方面的共同特征。

蛋白质或者基因可以通过ID对应或者序列注释的方法找到与之对应的GO号,而GO号可对于到Term,即功能类别或者细胞定位。 功能富集分析: 功能富集需要有一个参考数据集,通过该项分析可以找出在统计上显著富集的GO Term。

通俗来说:富集分析是基于一个先验的知识图谱将输入内容进行聚类分析,得到聚类后结果。

基因表达分析:基因表达分析是通过比较不同样本的基因表达水平,发现基因的表达模式、关键基因、调控机制等。基因表达分析包括差异分析、聚类分析、生存分析等方法。

3、蛋白质组学定量 Normalization 方法之一

间接测定法:蛋白质与某些酸性或碱性色素分子结合形成不溶性的盐沉淀。用分光光度计测定未结合的色素,以每克样品结合色素的量来表示蛋白质含量的多少。

质谱法:通过测量蛋白质的质量来研究其特性,包括串联质谱技术(MS/MS)用于确定蛋白质的氨基酸序列和翻译后修饰等信息。蛋白质互作网络分析:研究蛋白质间的相互作用,揭示蛋白质在细胞内不同通路中的相互作用和功能。

蛋白质组学的研究方法有蛋白质鉴定、翻译后修饰、蛋白质功能确定、蛋白质靶向定量技术。蛋白质鉴定:可以利用一维电泳和二维电泳并结合Western等技术,利用蛋白质芯片和抗体芯片及免疫共沉淀等技术对蛋白质进行鉴定研究。

蛋白组学的研究方法如下:蛋白质组学的发展既是技术所推动的也是受技术限制的。蛋白质组学研究成功与否,很大程度上取决于其技术方法水平的高低。蛋白质研究技术远比基因技术复杂和困难。

就是需要靶向蛋白质组学技术了!以前,蛋白质组学技术主要用于发现新的未知物,比如肽段、蛋白复合物、蛋白的翻译后修饰等。这部分的应用很广,技术门槛比较低,方法比较通用。

4、K-means聚类分析案例(一)

kmeans()函数能够在数据矩阵上执行k均值聚类。protein数据矩阵被当作一个对象传入该函数,该对象必须是数值型矩阵。centers=3代表初始化簇中心数量。因为簇的数量由一个数字指定,nstart=10定义了随机被选择的中心数。

k-means的k就是最终聚集的簇数,这个要你事先自己指定。

基于一份航空公司的数据,数据包含信息有客户基本信息、乘机信息、以及积分信息等详细数据,大约6万多条数据,依据末次飞行时间LAST_FLIGHT_DATE,以2031为结束时间,选取宽度为2年的时间段作为分析观测窗口。

从分析角度上看,聚类分析可分为两种,一种是按样本(或个案)聚类,此类聚类的代表是K-means聚类方法;另外一种是按变量(或标题)聚类,此类聚类的代表是分层聚类(系统聚类)。

关于蛋白质组学中的聚类分析和蛋白质组学数据的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 蛋白质组学中的聚类分析的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于蛋白质组学数据、蛋白质组学中的聚类分析的信息别忘了在本站进行查找喔。

[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:3801085100#qq.com,#换成@即可,我们会予以删除相关文章,保证您的权利。 转载请注明出处:http://www.mxzdyx.cnhttp://www.mxzdyx.cn/wxby/2227.html