10.3969/j.issn.1672-9722.2007.10.008
VSM中用语片为特征项计算文本相似度
定义了骨架语片的概念.用互信息量作为衡量两个词语间相关程度的参考值,借助依存关系、基本语法将满足相关度阈值的两个词组合成骨架语片.用骨架语片做特征项,用空间向量模型表示文本语义,用语片的出现频度做语片权重,用余弦法计算文本间语义相似度.应用于试卷主观题自动评分,实验证实这种方法结果具有令人满意的正确度.
空间向量模型、相关度、骨架语片、互信息、相似度
35
TP391(计算技术、计算机技术)
2007-12-17(万方平台首次上网日期,不代表论文的发表时间)
共3页
24-25,34