10.3969/j.issn.1006-9348.2021.12.001
基于神经网络的预警领域分词仿真算法
分词是中文信息处理的第一步,但由于预警信息的领域性较强,直接将现有分词方法应用于预警领域,算法效率和分词结果的准确性都急剧下降.采用神经网络领域纠正器框架,在通用粗分阶段引入权重信息,改进了双字哈希词典的构造方法,有效降低了最大匹配分词算法的迭代次数.在领域纠正阶段,构建合法预警人工分词语料,利用双向GRU模型设计神经网络预警领域纠正器,提高领域适应性.仿真证明了算法在有效提高分词速度的同时,取得了更加优秀的准确率、召回率和P值,能够满足预警信息快速、准确切分的需求.
中文分词;神经网络;领域纠正;权重词典
38
TP391(计算技术、计算机技术)
国家自然科学基金;江苏省自然科学基金;江苏省气象局青年基金
2022-01-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
1-6,38