基于Python技术的半监督文本语义分类方法研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1006-9348.2023.07.095

基于Python技术的半监督文本语义分类方法研究

引用
针对传统方法存在的语义标注准确度不高,语义分类查全率较低以及语义特征提取能力不佳的问题,研究基于Python技术的半监督文本语义分类方法.利用Python编程技术通过调用接口和扩展库建立自动标注下的半监督文本语义分类模型,通过自动标注手段将初始文本标注后划分为训练文本和测试文本.经过文本预处理后,利用改进的CHI算法展开文本语义特征提取和归一化处理并输入到监督分类器内,使用支持向量机算法完成文本语义分类.实验结果表明,上述方法文本语义标注准确度高于 95%,标注精度高;词频曲线与实际词频曲线重合度较高,特征提取能力强;拟合误差低,受非线性问题影响小,且平均查全率为97.21%,说明所提方法的文本语义分类能力较好.

半监督、文本语义、支持向量机、自动标注、特征提取

40

TP181(自动化基础理论)

分布式数据库隐私信息增量式更新方法仿真2017ZY0725

2023-08-15(万方平台首次上网日期,不代表论文的发表时间)

共5页

496-500

相关文献
评论
暂无封面信息
查看本期封面目录

计算机仿真

1006-9348

11-3724/TP

40

2023,40(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn