基于语言特性的中文领域术语抽取算法

引用

摘要：

提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.

关键词：术语抽取、领域耦合性、领域相关性、领域一致性

所属期刊栏目：30

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目60863011;国家教育部高等学校博士学科点专项科研基金资助课题20050007023

在线出版日期：2010-05-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：307-310

英文信息展示

期刊专题