融合类别先验Mixup数据增强的罪名预测方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.16383/j.aas.c200908

融合类别先验Mixup数据增强的罪名预测方法

引用
罪名预测是人工智能技术应用于司法领域的代表性任务.该任务根据案情描述和事实预测被告人被判的罪名.由于各类罪名样本数量高度不平衡,分类模型训练时分类器易偏向高频罪名类别,从而导致低频罪名预测性能不佳.针对罪名预测类别不平衡问题,提出融合类别先验Mixup数据增强策略的罪名预测模型,改进低频罪名预测效果.该模型利用双向长短期记忆网络与结构化自注意力机制学习文本向量表示,在此基础上,通过Mixup数据增强策略在向量表示空间中合成伪样本,并利用类别先验使合成样本的标签偏向低频罪名类别,以此来扩增低频罪名训练样本.实验结果表明,与现有方法相比,该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升,低频罪名预测的宏F1值提升达到13.5%.

类别先验Mixup、罪名预测、类别不平衡分类、低频罪名

48

TP391;TP181;U491

云南省基础研究计划项目;国家重点研发计划;国家重点研发计划;国家重点研发计划;国家自然科学基金

2022-08-30(万方平台首次上网日期,不代表论文的发表时间)

共11页

2097-2107

相关文献
评论
暂无封面信息
查看本期封面目录

自动化学报

0254-4156

11-2109/TP

48

2022,48(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn