蛋白质组学数据处理入门-蛋白质组信息学
大家好,今天小编关注到一个比较有意思的话题,就是关于蛋白质组学数据处理入门的问题,于是小编就整理了1个相关介绍蛋白质组学数据处理入门的解答,让我们一起看看吧。
1、蛋白质组学中对缺失值的处理
DDA label-free一般较多,10%-50% 的缺失值。过滤标准不定,如一个蛋白中三个重复,2个有值,建议保留,1个有值,严格一点考虑过滤掉。不建议用均值、中位值或最小值来进行填充。常用方法:KNN,Sequential KNN,MI,RandomForest, Impseq等,所有方法都是基于现有的数据来进行填充的。
全局校正(global adjustment)标准化是蛋白质组学中常用的方法之一,它将log化的intensity数据的中心转换成一个常数,这个常数可以是mean、median或者其它数学测量指标。比如Zscore就是将数据中心的mean转换成常数0,且standard variation为1的标准化方法。
随后,对基因表达矩阵进行标准化处理,并处理缺失值后,执行聚类分析,将具有相似的时间表达模式的基因聚在一类。如上过程基于基因表达值进行了聚类,对于每个簇中的基因,具有相似的时间表达特征。
介质过滤 介质过滤是指以石英砂或无烟煤等为介质,使水在重力或压力下通过由这些介质构成的床层,而水中的的颗粒污染物质则被介质阻截,从而达到与水分离的过程。粒状介质过滤基于“过滤-澄清”的工作过程去除水中的颗粒、悬浮物和胶体。
到此,以上就是小编对于蛋白质组学数据处理入门的问题就介绍到这了,希望介绍关于蛋白质组学数据处理入门的1点解答对大家有用。
[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:3801085100#qq.com,#换成@即可,我们会予以删除相关文章,保证您的权利。 转载请注明出处:http://www.mxzdyx.cnhttp://www.mxzdyx.cn/wxby/10324.html