10.16208/j.issn1000-7024.2018.12.046
基于深度学习的简历信息实体抽取方法
针对传统的简历信息实体抽取方法泛化能力差、难以维护的问题,提出一种基于深层神经网络的简历信息实体抽取方法.经过数据清洗、分词等预处理将非结构化的简历文本信息处理为词序列,通过由Word2Vec在大规模语料库以无监督方式训练得到的词向量表,将每个词映射为低维实数向量,由双向LSTM层融合待标注词所处的语境信息,输出所有可能标签序列的分值给CRF层,由其引入前后标签之间的约束求解最优标签序列,以随机梯度下降法训练该模型,辅以Dropout防止过拟合.实验结果表明,该方法提升了相应的解析标注性能,提高了泛化能力.
简历抽取、信息实体、序列标注、长短期记忆、条件随机场
39
TP391(计算技术、计算机技术)
国家自然科学基金项目61371096;深圳市科技计划基金项目JCYJ20170307151743672
2019-03-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
3873-3878