10.3969/j.issn.1001-8867.2007.06.010
基于领域本体和概念向量的中文文本相似性测度研究
文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐.OCVSM是一种基于领域本体和概念向量相似性测度的方法.该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度.实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断.
相似性测度、领域本体、概念向量、文本处理
33
G354(情报学、情报工作)
总装备部"基于知识本体和数据挖掘的智能推荐关键技术与系统构建研究"项目项目编号 2006QB1066;南京理工大学2005~2006年度青年教师科研基金研究成果
2009-03-06(万方平台首次上网日期,不代表论文的发表时间)
共7页
51-57