10.3969/j.issn.1003-0077.2006.06.009
基于语义分析的作者身份识别方法研究
作者身份识别是一项应用广泛的研究,身份识别的关键问题是从作品中提取出代表语体风格的识别特征,并根据这些风格特征,评估作品与作品之间的风格相似度.传统的身份识别方法,主要考察作者遣词造句、段落组织等各种代表文体风格的特征,其中基于标点符号和最常见功能词频数的分析方法受到较为普遍的认同.本文依据文体学理论,利用HowNet知识库,提出一种新的基于词汇语义分析的相似度评估方法,有效利用了功能词以外的其他词汇,达到了较好的身份识别性能.
计算机应用、中文信息处理、身份识别、语义分析、文档相似度
20
TP391(计算技术、计算机技术)
2006-12-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
61-68