基于语言特性的中文领域术语抽取算法
提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.
术语抽取、领域耦合性、领域相关性、领域一致性
30
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目60863011;国家教育部高等学校博士学科点专项科研基金资助课题20050007023
2010-05-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
307-310