10.3969/j.issn.1001-3695.2017.04.005
中文时间关键词识别研究
时态信息广泛应用在自然语言处理、信息检索等领域,而时间关键词识别更是时态信息应用的关键,其直接影响到时态信息的使用.时间信息在文本或句中形式多样性、位置随意性以及边界不确定性等特点成为时间关键词识别任务中的难点.为了解决中文时间关键词的识别问题,通过分析文本语句结构并结合语法结构树提出短语划分方法,将文本转换成短语集从而确定短语边界;在此基础上提出短语向量化表示法,以此构建向量空间;最后,引入谱聚类的聚类思想,将识别问题转换为聚类问题.实验证明,运用该方法进行中文时态关键词识别具有较好的效果.
时间关键词、时间关键词识别、谱聚类
34
TP391.1(计算技术、计算机技术)
广东省自然科学基金资助项目S2011040004281,S2013010014457
2017-06-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
981-985