基于查询表达式特征的时态意图识别研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11925/infotech.2096-3467.2018.0550

基于查询表达式特征的时态意图识别研究

引用
[目的]针对时态意图识别问题,探讨可抽取查询表达式特征的有效性及采用不同类别分类算法的识别准确度,为后续相关研究提供一定的借鉴.[方法]按查询表达式特征与时间的关联性,将其归类为时间无关特征、潜在时间特征、显式时间特征.在此基础上,分别采用有监督分类算法及半监督分类算法,探讨采用不同特征组合的有效性及不同分类算法的识别准确度.[结果]在抽取的三类查询表达式特征中,仅使用显式时间特征的平均分类准确率最高,且“查询是否包含年份”这一特征为强特征;使用不同分类算法的识别准确度相差不大;时态意图识别结果优于已有参与时态意图分类子任务(TQIC)测评的成果,平均分类准确率为81.14%.[局限]限于数据集的获取途径,仅对300条查询的时态意图识别效果进行验证;仅考虑已有的查询表达式特征,未提出用于时态意图识别的新特征.[结论]查询表达式特征中与时间关联性高的特征能提高时态意图识别准确度,而基于统计的特征(如查询词长度)对时态意图识别分类准确度的提升效果不明显.

时态意图、有监督分类、半监督分类、特征抽取

3

G354(情报学、情报工作)

国家社会科学基金青年项目“融合用户个性化与实时性意图的查询推荐模型研究”项目15 CT Q019的研究成果之一

2019-05-23(万方平台首次上网日期,不代表论文的发表时间)

共10页

66-75

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

3

2019,3(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn