依存句法模板下的商品特征标签抽取研究
[目的]面向在线商品评论,通过探索“产品特征-观点”对应关系的识别方法,抽取商品特征标签,凝练评论精华.在网络资讯良莠混杂的环境下,帮助用户有效获得有价值的资讯.[方法]引入依存语法关系,对评论模板实现自动分类、过滤、泛化并形成模板库.基于模板库和外部词典提取特征标签,同时确立候选标签的筛选过滤机制.[结果]面向真实的网络评论集,本文方法的性能优于单纯过滤与泛化的抽取方法.F值最优达到56.5%,调整参数后,准确率达到65%.[局限]需要在特征抽取前依据评论语句质量进行前期过滤,考虑特征词库的自动化获取,在模板形成过程中,还需添加更多的句法关系,进一步提高特征标签的抽取准确度.[结论]单纯依据句法模板频率进行模板过滤的方法有提升空间.特征抽取过程考虑模板的长度特征,设定抽取窗口,对特征标签进行筛选、合并特征能获取更好的抽取结果.
评论挖掘、标签抽取、依存句法分析
TP391(计算技术、计算机技术)
本文系广东省哲学社会科学“十二五”规划2013年度项目“基于情境和用户感知的知识推荐机制研究”项目编号:CDI3CTS01的研究成果之一.
2015-01-13(万方平台首次上网日期,不代表论文的发表时间)
44-50