10.3772/j.issn.1000-0135.2020.11.010
科技情报用户画像标签生成与推荐
科技管理部门是科技情报的重要用户,如何主动地了解科技管理部门的情报需求,成为大数据时代快速地提供精准情报服务的重要内容,而用户画像的方法为这项工作提供了可能.通过多源数据的采集与分析,为情报用户打标签,用标签来刻画用户特征与需求,并实施推荐.基于上述目的,本文采用自然语言处理的相关方法生成标签,在文本中抽取出关键词,采用直接抽取、词对匹配、主题词抽取、基于TF-IDF的生成方案、组合词生成方案共五种方法.标签生成后,根据词林表中的词间关系分析标签之间的关联和相似度.然后采用协同过滤、基于常识、标签关联等推荐算法为不同的用户推荐标签,并建立了初步的用户画像.通过研究与实证发现,利用这一套方法能够有效勾勒出科技管理部门的情报需求特征,对于科技情报工作而言,推荐的内容也具备一定的启示性.
科技情报、用户画像、标签生成、推荐算法
39
国家社会科学基金项目"基于多源数据融合的情报用户需求探测研究"17BTQ066
2020-12-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
1214-1222