10.3969/j.issn.1000-1220.2007.11.033
中文文本的信息自动抽取和相似检索机制
目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.
信息抽取、语义模板、概念扩充、模糊语义
28
TP391(计算技术、计算机技术)
国家自然科学基金60373095;60673039
2007-12-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
2074-2079