酒店在线评论数据的特征挖掘
论文以酒店在线评论数据为研究对象,对酒店在线评论数据的特征挖掘进行了研究.论文首先从酒店在线评论数据的获取出发,经过数据清洗、词性分析、特征抽取、指标确定、特征筛选、特征确定、特征校验几个环节,实现了酒店在线评论数据特征挖掘的目的.论文以词频为基础,融合了词性分析、聚类分析等方法,利用词频数(TF)、词频率(TF1)、词频权重(TTW)、评论频率(DF)、逆文档频率(IDF)和TF 1-IDF等指标对候选特征词进行降维,得出酒店在线评论数据的特征,并对特征词进行校验,完成了酒店在线评论数据的特征挖掘的过程.论文将为以评论为依据的客户分类、酒店分类、智能推荐奠定基础.
酒店、在线点评、数据获取、特征抽取、特征挖掘、聚类分析、分类、智能推荐
13
TP391(计算技术、计算机技术)
国家自然科学基金项目61320106006,61532006,61772083
2018-11-30(万方平台首次上网日期,不代表论文的发表时间)
共9页
1006-1014