反向传播神经网络的蛋白质质谱高通量分析方法研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11719/com.app.chem20141001

反向传播神经网络的蛋白质质谱高通量分析方法研究

引用
肿瘤是一种多基因参与、多步骤发展、内外环境交互作用下形成的复杂疾病,临床研究显示,对恶性肿瘤而言早期诊断的意义远大于现有的任何一种治疗方案,因此,如何提高肿瘤的诊断率,尤其是早期诊断率已被公认为是改善其疗效和预后的关键.由于蛋白质而并非核酸才是生命活动的具体执行者和体现者,因此,对有关肿瘤的蛋白质质谱数据进行深入研究、挖掘和分析,以期实现肿瘤的早发现,早治疗,在当前显得尤为重要与迫切.因此,本文基于反向传播神经网络对蛋白质质谱数据进行了分析.首先,对蛋白质质谱数据进行了标准化处理,由于蛋白质质谱数据在每个质荷比上的丰度值可能存在较大差异,为防止参与特征提取的各丰度值由于其非均衡性带来的不利影响,因此,在对高维丰度值进行特征提取前,需要对每个丰度值进行标准化处理.又由于质谱数据维数较高,利用主成分分析对数据进行了降维处理,主成分分析属于代数特征分析方法,是模式识别领域中一种经典的特征抽取和降维方法.主成分分析在最小协方差意义下给出了模式样本的最优表示,其优点是消除了模式样本之间的相关性以及实现了模式样本的维数压缩.然后利用反向传播神经网络训练了降维后的数据并进行分类识别.反向传播神经网络的学习规则分为两个阶段:第一阶段(模式顺传播)输入信息从输入层经隐含层逐层计算各单元的输出值,第二阶段(误差逆传播)将输出误差逐层向前算出隐层各单元的误差,并用此误差来修正前层权值.在训练的过程中,即网络的连接权值和闭值被逐步调整,在训练结束之后,网络从输入样本中获得信息并存贮在连接权值和闭值中,根据这些参数和实际样本输入,就可以得到所需要的预测值.本文以卵巢癌质谱数据集为例,通过3个实验来验证本文方法在肿瘤早期发现上的有效性.卵巢癌质谱数据集包含两类,即正常与异常两类.正常类中包含91个样本,每个样本包含两种数据,即质荷比数据以及其对应的丰度值;异常类中包含162个样本,每个样本也包含质荷比数据以及其对应的丰度值两种数据.在实验1中,从正常类的质谱数据中选取10个样本作为训练样本,5个样本作为测试样本;从异常类的质谱数据中也选取10个样本作为训练样本,5个样本作为测试样本,实验结果显示随着投影轴数的增加,本文方法的识别率总趋势也在不断地提高,最终达到了100%的识别率.这是由于不仅质谱数据集的规模较小,而且在反向传播神经网络中,训练样本数较之测试样本数较多,反向传播网络得到了很好的训练.在实验2中,从正常类的质谱数据中选取30个样本作为训练样本,30个样本作为测试样本;从异常类的质谱数据中也选取30个样本作为训练样本,30个样本作为测试样本,实验结果显示在训练样本与测试样本数都是60个的情况下,随着投影轴数的增加,其识别率的变化趋势.尤其在15个投影轴下,其识别率最高,在此之后,识别率会随着投影轴数的增加而有所降低.在实验3中,从正常类与异常类的质谱数据中各选取前一半样本作为训练样本,后一半样本作为测试样本;在整个卵巢癌质谱数据集上的分类实验结果显示了本文方法在在整个卵巢癌质谱数据集下的识别率,可以看出其识别率是比较高的,且算法是稳定的.这也验证了本文方法在蛋白质质谱高通量分析中的有效性,为蛋白质质谱高通量分析提供了新的方法与支撑.

肿瘤早期诊断、反向传播神经网络、主成分分析、蛋白质质谱分析

31

Q71;TQ015.9;O6-39(生物大分子的结构和功能)

2015-01-09(万方平台首次上网日期,不代表论文的发表时间)

共4页

1153-1156

相关文献
评论
暂无封面信息
查看本期封面目录

计算机与应用化学

1001-4160

11-3763/TP

31

2014,31(10)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn