10.16208/j.issn1000-7024.2017.06.025
融合多特征的越南语新闻文本词汇链构建方法
为帮助读者更快掌握新闻文本的主旨,确定篇章结构,使用维基百科语义资源库,基于文档链接信息图和分类结构图两大特征计算候选词的路径信息和节点深度以及文档分类信息,利用语关相似度和语似相关度进行初步词汇链的构建,结合越南语特征,提出5个特征项对初建词汇链优化加权处理,实现词汇链最终构建.实验结果表明,对比使用HowNet、WordNet语料库的方法,该方法在准确率和召回率上有显著提高.
维基百科、词汇链构建、语义相似度、语义相关度、融合多特征
38
TP391(计算技术、计算机技术)
国家自然科学基金项目61562049
2017-07-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
1536-1540