10.13700/j.bh.1001-5965.2020.0402
基于fastText算法的行业分类技术
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础.根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型.首先,构建行业分类关键词库,通过特征词库进行分词和权重计算.然后,构建分类器模型,实现中文行业的自动分类.最后,实验选取了80000个包含企业经营范围、企业信息、舆论信息的测试文档,结果表明,所提模型结果高于Bayes、决策树、KN N等分类算法,取得了较好的应用效果.
自然语言处理、行业分类、fastText算法、关键词、语法模型
48
TP391.1(计算技术、计算机技术)
2022-03-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
193-198