10.16451/j.cnki.issn1003-6059.201610007
基于粗粒化的流感病毒蛋白进化树构建
在127065条血凝素、神经氨酸酶流感病毒蛋白基础上,提出基于粗粒化的病毒蛋白进化树的构建方法。首先基于病毒蛋白序列特征,给出序列间相似性度量,提取流感病毒系统层次递阶结构,并定义层次聚类指标,确定最佳聚类数。然后基于距离中心最近的原则提取流感病毒系统代表。最后采用距离度量构造流感病毒进化树。实验表明,相同流感病毒具有宿主相同、时间跨度较小、爆发地点相近,更倾向于处于相同分支的特点,这与已有的文献吻合,因此该方法有利于挖掘病毒变异轨迹。
流感病毒、进化树、粗粒化、结构聚类、大数据处理
29
TP391;O29(计算技术、计算机技术)
国家自然科学基金项目11371174;国际科技合作研究项目No.2011DFR70500资助Supported by National Natural Science Foundation of China11371174;International Science and Technology Cooperation Program of China2011DFR70500
2016-11-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
936-942