蛋白质组学数据处理入门-蛋白质组信息学

大家好，今天小编关注到一个比较有意思的话题，就是关于蛋白质组学数据处理入门的问题，于是小编就整理了1个相关介绍蛋白质组学数据处理入门的解答，让我们一起看看吧。

蛋白质组学中对缺失值的处理

1、蛋白质组学中对缺失值的处理

DDA label-free一般较多，10%-50% 的缺失值。过滤标准不定，如一个蛋白中三个重复，2个有值，建议保留，1个有值，严格一点考虑过滤掉。不建议用均值、中位值或最小值来进行填充。常用方法：KNN，Sequential KNN，MI，RandomForest， Impseq等，所有方法都是基于现有的数据来进行填充的。

全局校正（global adjustment）标准化是蛋白质组学中常用的方法之一，它将log化的intensity数据的中心转换成一个常数，这个常数可以是mean、median或者其它数学测量指标。比如Zscore就是将数据中心的mean转换成常数0，且standard variation为1的标准化方法。

随后，对基因表达矩阵进行标准化处理，并处理缺失值后，执行聚类分析，将具有相似的时间表达模式的基因聚在一类。如上过程基于基因表达值进行了聚类，对于每个簇中的基因，具有相似的时间表达特征。

介质过滤介质过滤是指以石英砂或无烟煤等为介质，使水在重力或压力下通过由这些介质构成的床层，而水中的的颗粒污染物质则被介质阻截，从而达到与水分离的过程。粒状介质过滤基于“过滤－澄清”的工作过程去除水中的颗粒、悬浮物和胶体。

到此，以上就是小编对于蛋白质组学数据处理入门的问题就介绍到这了，希望介绍关于蛋白质组学数据处理入门的1点解答对大家有用。

[免责声明]本文来源于网络，不代表本站立场，如转载内容涉及版权等问题，请联系邮箱:3801085100#qq.com，#换成@即可，我们会予以删除相关文章，保证您的权利。转载请注明出处：http://www.mxzdyx.cnhttp://www.mxzdyx.cn/wxby/10324.html

1、蛋白质组学中对缺失值的处理

相关推荐