DOI：10.3969/j.issn.1000-1220.2007.11.033

中文文本的信息自动抽取和相似检索机制

引用

摘要：

目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.

关键词：信息抽取、语义模板、概念扩充、模糊语义

所属期刊栏目：28

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金60373095;60673039

在线出版日期：2007-12-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：2074-2079

英文信息展示

期刊专题