10.16208/j.issn1000-7024.2020.09.018
基于词向量和条件随机场的中文命名实体分类
针对中文命名实体识别及分类问题,提出一种基于词向量聚类和条件随机场的方法.分析语料语言特点并选取统计特征,构建特征模板识别测试语料中的命名实体;利用词向量包含丰富语义信息这一特点,将训练集中的实体词向量聚类成一个个簇;通过比较每一个簇与已识别的测试集命名实体之间的相似度距离,实现中文命名实体的分类.实验结果表明,在该方法下所分8个类别中,命名实体分类的F1值最高达到93.04%,F1值的平均值达到了83.82%.
命名实体识别、条件随机场、词向量、聚类、命名实体分类
41
TP391(计算技术、计算机技术)
国家自然科学基金项目;国家重点研发计划基金项目
2020-10-14(万方平台首次上网日期,不代表论文的发表时间)
共8页
2515-2522