10.16652/j.issn.1004-373x.2019.16.015
文本信息检索系统的设计与实现
随着信息化的发展,互联网上出现了越来越多的文档信息,如何根据用户的需要从海量的文档中快速获取相关信息成为了研究的热点.采用Python编程语言、Django Web应用框架、UWSGI Web服务器、Nignx代理服务器,基于Tex-tRank关键词提取算法、倒排索引结构、Jaccard相似度计算以及MySQL数据库技术构建了汉英文本信息检索系统.该系统包含文本注册、文本检索和文本注销三个模块,可实现千万量级文本数量上的快速注册和快速检索功能,为构建舆情分析系统提供服务,并可根据人们特定的需求,扩展文本检索服务.
信息检索、算法介绍、倒排索引、检索系统构建、快速注册、快速检索
42
TN911.2-34;TP391
国家自然科学基金资助项目61762084;国家自然科学基金资助项目61662077;国家自然科学基金资助项目61462083;国家自然科学基金资助项目61331011;新疆多语种信息技术实验室开放课题2016D03023
2019-08-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
62-66