DOI：10.3772/j.issn.1000-0135.2011.08.010

基于互联网的商业机构名识别研究

引用

摘要：

互联网已经成为企业和组织获取竞争对手情报的主要来源之一.建立基于Web的竞争对手情报自动获取系统已成为企业的迫切需求.在竞争对手情报自动获取系统中,商业机构名的识别是基础,它为竞争对手的标识和进一步情报抽取提供了依据.本文提出了一种基于互联网的商业机构名识别新方法.该方法考虑了商业机构名与其上下文之间的语义关联性,通过语义标注和隐马尔可夫模型相结合的方法进行商业机构名识别.我们以互联网上的真实中文网页为数据集对提出的识别算法进行了性能评估,并从召回率、准确率和F指标三个方面与CHMM(基于层叠隐马尔可夫模型的机构名识别算法)、MEM(基于最大熵模型的机构名识别算法)以及SVM(基于支持向量机的机构名识别算法)进行了对比.实验结果表明,本文提出的算法改善了商业机构名识别效果,并且具有很好的普适性.

关键词：竞争情报、互联网、商业机构、隐马尔可夫模型

所属期刊栏目：30

分类号：TP3;TH1

资助基金：国家自然科学基金项目"Web环境下本体和实体驱动的企业竞争情报获取机制研究"编号70803001;模式识别国家重点实验室开放课题编号20090029;中国科技大学青年创新基金

在线出版日期：2011-11-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：851-860

英文信息展示

期刊专题