10.3969/j.issn.1000-3428.2011.09.002
基于语句节奏特征的作者身份识别研究
提出一种新的写作风格相似度评估方法,利用不同作者写作时在文章语句节奏控制方面的特点,鉴别作者的写作风格,从而达到作者身份识别的目的.该方法构建节奏特征矩阵模型来描述文本的语句节奏,利用点积相似度算法以及改进的KL距离算法来度量节奏特征矩阵之间的差异.实验表明,该方法在文学作品的作者识别方面具有较高的准确率.
文本挖掘、作者身份识别、文本相似度、节奏特征、多维矩阵
37
TP311.13(计算技术、计算机技术)
国家"863"计划基金资助项目"科学数据网格及科研应用系统"2006AA01A120;中国科学院信息化基金资助项目"e-Science虚拟科研平台研究与开发"INFO-115-D01;CNIC青年基金资助项目"基于Web的传感器监控管理系统"CNIC_QN_09005
2011-08-04(万方平台首次上网日期,不代表论文的发表时间)
共3页
4-5,8