10.3969/j.issn.1000-3428.2011.15.052
基于条件随机场的中文时间短语识别
传统时间短语识别方法存在中文文本时间短语边界定位不准确和长距离依赖的问题.为此,提出一种基于条件随机场(CRFs)的时间短语识别方法.采用基于机器学习的方法识别时间短语,分析中文文本中时间短语的词法、句法和上下文信息等语言学特征,将时间短语分为日期型和事件型2种类型,并半自动构建3个常用词表作为外部特征.在此基础上,引入能整合不同层面特征的CRFs方法,将识别问题转化为序列标注问题.实验结果表明,该方法在日期型时间短语和事件型时间短语识别上分别取得95.70%和85.75%的F1值,识别效果较好.
中文时间短语、时间短语识别、条件随机场、时间信息处理
37
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60975033;上海市重点学科建设基金资助项目J50103;上海大学研究生创新基金资助项目SHUCX091041,SHUCX102174
2012-01-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
164-167