词向量文本挖掘技术在建筑设施管理应用研究
该文挖掘是自然语言处理技术(NLP)在人工智能应用领域的一个重要落地场景.文章以建筑设施运维工单短文本分类器构建为背景,分析了具有稀疏特征的短文本分类技术难点,提出了基于Word2vec算法模型构建建筑运维工单文本词向量特征,通过有监督机器学习模型将强关联规则加入短文本分类器训练过程中,通过短文本词向量特征改善,优化短文本分类准确率、召回率和F1值.通过验证,建筑运维工单专业自动分类识别成功率达89%,为分析建筑运维服务诉求提供数据依据和基础.
词向量;短文本挖掘;非结构化数据;建筑数据管理
17
TP311(计算技术、计算机技术)
2021-12-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
22-25