10.13413/j.cnki.jdxblxb.2020023
基于CRF和多元规则的层次化句法分析
针对句法分析中细粒度和粗粒度组块识别模型的冲突问题,为解决句法分析中词语搭配规则多、减少搭配优先级变动的影响,提出一种结合条件随机场(CRF)和多元规则的层次化句法分析模型.先利用CRF算法识别细粒度语句的组块标记序列,然后结合统计和多元规则识别粗粒度组块,在识别出的组块中层层引入不同优先级的二元、三元规则.该模型实现了同时进行细粒度和粗粒度组块的识别,可更好地服务于句法分析.在Chinese TreeBank 8.0(CTB8.0)语料上采用5-折交叉验证,结果表明,相比于仅使用二元、三元规则及使用CRF+二元规则的句法分析,该模型的正确率分别约提高12%,3%,5%,验证了该模型有效性和稳定性.
层次句法分析、条件随机场、多元规则、组块识别
58
TP391(计算技术、计算机技术)
国家自然科学基金批准号:61761025
2020-11-30(万方平台首次上网日期,不代表论文的发表时间)
共9页
1452-1460