中文微博实体链接研究
针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务,使用CCF提供的新浪微博数据作为训练和测试数据,利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具,提出一种实体链接的方法.该方法应用改进的拼音编辑距离算法和后缀词表匹配法,提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法.在2013年CCF中文微博实体链接评测任务中正确结果的准确率为0.8838,在10个参赛队伍中名列第3位.表明该方法有效并可以适应文本中的噪声.
微博实体链接、改进的拼音编辑距离、后缀词表匹配法、实体消歧
50
TP391(计算技术、计算机技术)
国家自然科学基金61170111,61202043,61262058;中国科学院自动化所复杂系统管理与控制重点实验室开放课题20110102;中央高校基本科研业务费专项基金SWJTU11ZT08
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
73-78