10.3969/j.issn.1000-565X.2011.07.024
基于分隔符和上下文术语的领域现象术语抽取
领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.该方法首先用基于上下文的方法抽取得到分隔符集,然后结合分隔符集和上下文术语用改进的NC -value算法进行候选领域现象术语抽取,最后在候选领域现象术语中过滤掉名词性术语,进而得到最终结果.实验表明,文中方法对领域现象术语的抽取效果优于基于词频的方法和基于分隔符的方法.
术语抽取、分隔符、复合词、NC-value算法
39
TP391.43(计算技术、计算机技术)
国家自然科学基金资助项目61003065
2011-12-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
146-149,155