10.3969/j.issn.1672-6987.2013.03.018
一种学术网络平台研究技术趋势发现方法
学术web平台蕴含着巨大的信息,通过统计分析提取这些信息,以便从海量非结构化数据世界中挖掘出新颖的、潜在的有用模式,正在成为数据分析处理的研究方向.针对已分大类的学术网页描述提取词汇链,创新提出最大相关方法对其进行扩充形成新的特征词是发现专业研究新趋势的有效手段.通过评价实验发现对词汇链拓展的最大相关方法比TF-IDF方法、最大熵方法、词汇链方式提取的特征词或短语更能有效地反映该研究方向相关趋势.
学术网络平台、共现特征词、最大关联度、特征提取
34
TP391.1(计算技术、计算机技术)
国家高技术研究发展计划863计划项目2011AA100702
2013-08-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
305-308,314