10.13266/j.issn.0252-3116.2021.09.009
基于日志挖掘的学术搜索困难度量方法研究
[目的/意义]用户检索中经常面临不同程度的信息搜寻困难,为更好地理解用户需求、改进检索系统,需要一种简洁有效的方法度量信息搜寻的困难程度.[方法/过程]将用户为查询而付出的行为及时间代价作为其信息搜寻困难的体现.按照用户在会话中的行为模式划分会话类型,将查询需求被满足且代价最小的会话类型作为比较基准,用基准会话的代价衡量其他会话类型的困难程度.为优化代价的表达模型,对搜寻代价的行为指标进行相关性检验,用因子分析选择独立性、区分度好的行为特征进行建模.以国家科技图书文献中心(NSTL)日志和搜狗日志为数据集比较学术搜索与通用搜索环境,以及不同会话类型所代表的探索过程中,用户的信息搜寻困难度.[结果/结论]在本文所度量的两种搜索系统中,用户面临的信息搜寻困难度分别为2.30和1.57,学术搜索中的困难高于通用搜索.在两种体现学术探索过程的会话中,困难度分别为2.35和4.13.本文提出的方法可以用简单的数值来概括具有多种影响因素的搜索困难,并能用于不同类型会话和搜索环境,丰富了检索系统的评估手段.
信息搜索困难、搜索困难度量、搜索代价、学术搜索、会话类型
65
G25(图书馆学、图书馆事业)
2021-06-07(万方平台首次上网日期,不代表论文的发表时间)
共10页
79-88