按需印刷平台中的相似搜索研究
目的 研究按需印刷平台中的相似搜索效率问题.方法 利用用户与产品之间的"购买"关系构建"用户-产品"关系,基于P-Rank提出一种高效的相似搜索方法POD-Rank,用于从"用户-产品"关系中发现相似产品.POD-Rank相似搜索过程依据"用户-产品"关系离线计算用户相似性,并利用用户相似性在线计算产品相似性,而后进一步提出优化的在线查询处理算法,以降低查询处理的时间开销.结果 POD-Rank的计算时间开销和存储开销显著低于P-Rank,而且能够快速响应查询请求.结论 POD-Rank的相似性计算开销为P-Rank的0.03%,存储开销为P-Rank的0.06%,计算效果与P-Rank接近,能够满足按需印刷平台中大规模产品数据处理的需求.
按需印刷、P-Rank、相似搜索、"用户-产品"关系图
36
TS801.8(印刷工业)
上海市教委科研创新项目15ZZ074;上海高校青年教师培养资助计划ZZSLG14021;上海出版传媒研究院招标课题SAYB1410;上海理工大学博士启动基金1D-14-309-001
2016-01-08(万方平台首次上网日期,不代表论文的发表时间)
135-139