10.3969/j.issn.1000-1220.2001.02.031
隐含语义索引及其在中文文本处理中的应用研究
信息检索本质上是语义检索,而传统信息检索系统都是基于独立词索引,因此检索效果并不理想.隐含语义索引是一种新型的信息检索模型,它通过奇异值分解,将词向量和文档向量投影到一个低雏空间,消减了词和文档之间的语义模糊度,使得文档之间的语义关系更为明晰.实验和理论结果证实了隐含语义索引能够取得更好的检索效果.本文论述了隐含语义索引的理论基础,研究了隐含语义索引在中文文本处理中的应用,包括中文文本检索、中文文本分类和中文文本聚类等.
信息检索、隐含语义索引、奇异值分解、中文文本处理
22
TP319(计算技术、计算机技术)
国家自然科学基金69933010;国家高技术研究发展计划863计划863-306-ZT04-02-2
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
239-243