10.3969/j.issn.1001-0548.2016.05.022
基于上下文相关的未知实体词识别方法
现有的未知实体词识别方法主要针对人名、地名、机构名等具有特定结构的实体词进行识别,而随着电子商务和社交网络的快速发展,出现了大量结构不确定的专有领域未知实体词。针对该问题,提出两种基于上下文相关的未知词识别算法,通过计算词(字)和词(字)之间的上下文相关性,得到其潜在组合的支持度,并通过过滤模块过滤掉错误的组合,实现具有非确定型结构的未知实体词识别。实验表明,该算法具有较高的准确率,并且可以通过调整参数适应不同的应用场景。
关联规则、上下文相关、未知词识别、词义消歧
45
TP181(自动化基础理论)
国家自然科学基金61250110543;中央高校基本科研业务费ZYGX2013J079, ZYGX2014Z012, ZYGX2011J067;四川省科技项目2012RZ0002,2013TD0006
2016-10-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
839-844