10.3969/j.issn.1000-7024.2014.04.049
自由文本中汉语缩略语的自动抽取
以汉语为对象,提出了一种从自由文本中自动抽取缩略语的方法.分析缩略语与完整形式的词性结构,提出词性模板匹配方法,获取候选缩略语与候选完整形式;根据二者之间的字面关联和共现特性,构造若干约束规则,实现候选缩略语的配对.分析缩略语与完整形式的内在关联、外部语义和外部统计3类特征,构造决策树模型,将缩略语对的判别转换为缩略语与完整形式是否匹配的二元分类问题.相比前人研究,该方法在准确率和通用性方面均有提升,其中准确率达到了72.1%.
缩略语、完整形式、自动抽取、词性模板、决策树
35
TP391.1(计算技术、计算机技术)
国家自然科学基金项目61171159、61271304;北京市教委科技发展计划重点基金项目暨北京市自然科学基金B类重点基金项目KZ201311232037
2014-05-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
1372-1378