10.3969/j.issn.1000-3428.2012.20.039
面向词义消歧的条件随机场模型库构建
以条件随机场(CRF)作为构建词义消歧模型库的概率模型,利用CRF分别训练高频义项和低频义项标点句语料,应用生成的模型文件进行消歧实验.通过分析标注结果中的概率值确定阈值,以区分标注正确项和错误项.使用表现较好的模型文件和相应阈值构建面向词义消歧的条件随机场模型库.实验结果证明,对低频义项建模的词义消歧效果优于对高频义项进行建模,可以达到80%以上的正确率,并且可以获得较高的召回率.
多义词、词义消歧、条件随机场、高频义项、低频义项
38
TP311(计算技术、计算机技术)
国家自然科学基金资助项目60873013,61070119;北京大学计算语言学教育部重点实验室开放课题基金资助项目KLCL-1005;北京市属市管高等学校人才强教计划基金资助项目PHR201007131
2012-12-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
152-155,159