10.16208/j.issn10000-7024.2017.08.053
新闻出版行业标准碎片化标引的研究与实现
当前新闻出版行业对标准文献的标引工作都是采集标准的结构化信息进行标引,不对标准的具体内容部分标引,导致用户查询时无法快速定位到标准内容,为此提出针对标准的“碎片化”标引方案.根据标准的特点存储标准的结构及内容,建立新闻出版行业词库,以此为基础进行分词,采用统计加权算法,考虑词频、词性、词长、位置加权因子进行自动标引.实验结果表明,该方案实现了新闻出版行业标准的碎片化标引,提高了检索的效率和质量.
新闻出版、标准、碎片化、自动标引、词库
38
TP391(计算技术、计算机技术)
2017-10-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
2281-2286