基于无监督方法的电力文本专业词汇识别研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.12158/j.2096-3203.2020.06.023

基于无监督方法的电力文本专业词汇识别研究

引用
电力专业词汇识别是面向变电运检文档进行深入语言理解和知识图谱构建等智能应用的基础.领域无关识别方法的效果不能令人满意,为此文中根据电力领域词汇的语言学特征提出一种面向电力领域的无监督专业词汇发现方法.首先以通用词典对电力文档语料分词,然后根据电力专业词汇的特征设置不同大小的滑动窗口,将之前分词结果的多种组合作为候选词;进一步计算邻接变化度、信息熵、点态互信息以及词频等4种候选词统计量;最后基于综合语言学特征和成词边界3种语法规则对候选词进行筛选形成专业电力新词.在公开数据集上与基线方法进行了对比实验,实验结果验证了文中提出方法的有效性.

领域词典、无监督学习、新词识别、滑动窗口、统计特征

39

TM930.9;TP391

国家电网有限公司总部科技项目5200-2019182-55A-0-0-00

2021-03-26(万方平台首次上网日期,不代表论文的发表时间)

共7页

159-165

相关文献
评论
暂无封面信息
查看本期封面目录

电力工程技术

1009-0665

32-1866/TM

39

2020,39(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn