10.3969/j.issn.1005-6033.2022.08.012
基于CART决策树的活跃读者群体预测模型研究
国家图书馆作为国家级公益性文化机构,拥有海量的馆藏资源和庞大的用户群体,多年来在资源建设、读者行为等方面积累了丰富的数据,基于这些重要数据进行科学预测非常有意义.从已有的读者信息和借阅数据中获取到与读者活跃度相关的所有特征,利用CART决策树构建了未来活跃读者群体的预测模型,并通过调参和剪枝等手段得到模型的最高得分.结果表明:读者ID、读者年龄、所借单册的分类号和出版社是影响读者活跃度的主要因子.该模型在5万条以上大样本数据量上呈现较好的预测能力,并通过交叉验证可以稳定模型的平均准确程度,避免了训练样本的随机性.
图书馆、活跃读者、CART决策树、预测模型
7
G252.0(图书馆学、图书馆事业)
国家重点研发计划2019YFC1521404
2022-11-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
71-77