基于语料库的潜语义信息度量
为关键词定义了与主题或语义相关联的信息度量.首先获取基于主题的语料库,然后建立语料库的潜语义向量空间模型,通过该模型定义关键词的信息度量.由此可以计算任意文档包含该主题的信息量,定义文档对主题的隶属度.设定文档对主题隶属度阈值,从而判断文档是否属于该主题类.实验表明,与主题或语义关联的信息度量可以克服搜索中"词匹配"的不足,达到"语义匹配"的搜索.
潜语义、信息度量、度量分布、隶属度
29
TP301(计算技术、计算机技术)
上海市科学技术委员会科技攻关项目055115001;上海工程技术大学大学生创新项目cx082100
2009-10-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
2450-2453,2467