Word2vec和支持向量机的POI自动分类方法
针对兴趣点(POI)数据名称文本特征稀疏以及语义关系简单所导致的POI数据管理困难等问题,该文提出一种基于词向量计算工具Word2vec和支持向量机的POI分类方法.首先对POI名称进行分词、去停用词等预处理;然后通过Word2vec模型生成词向量,并引入词频-逆文档频率(TF-IDF)权重进行加权求和实现名称文本的向量表示;最后,在对支持向量机分类器训练的基础上,实现POI数据自动分类.为了验证方法的有效性,该文选取百度地图的6类POI数据进行试验,结果表明,该文方法在6个类别中总体正确率达到94.43%,优于目前常用的机器学习分类方法.
POI分类、Word2vec、支持向量机、TF-IDF
47
TP391.1(计算技术、计算机技术)
中国测绘科学研究院基本科研业务费项目;自然资源部专项项目;国家自然科学基金
2022-09-27(万方平台首次上网日期,不代表论文的发表时间)
共9页
195-203