10.3969/j.issn.1003-0077.2015.05.016
基于多源知识和Ranking SVM的中文微博命名实体链接
命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用.该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种组合特征,利用Ranking SVM对候选实体集合进行排序,从而得到目标实体.在NLP&CC2014①中文微博实体链接评测数据集上进行了实验,获得了89.40%的平均准确率,与NLP&CC2014中文微博实体链接评测取得最好成绩的系统相比,本文的系统具有一定的优势.
命名实体、中文微博实体链接、同义词词典、百科资源、Ranking SVM、语义特征
29
TP391(计算技术、计算机技术)
国家社会科学基金14BYY096;国家自然科学基金61402419,61272221;国家高技术研究发展863计划2012AA011101;国家重点基础研究发展计划973课题2014CB340504
2016-01-14(万方平台首次上网日期,不代表论文的发表时间)
共8页
117-124