10.3969/j.issn.1003-0077.2010.01.013
基于用户查询日志的命名实体挖掘
针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题.已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘.然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际上命名实体往往可能从属于多个类别.该文通过引入一个弱指导话题模型,利用少量的人工指导信息,很好地解决了实体的类别模糊性,提高了挖掘的有效性.实验表明该文提出的方法在实体挖掘性能上显著优于已有的方法.
计算机应用、中文信息处理、分开命名实体、用户查询日志、话题模型
24
TP391(计算技术、计算机技术)
2010-04-06(万方平台首次上网日期,不代表论文的发表时间)
共7页
71-76,116