10.3969/j.issn.1003-0077.2019.03.013
基于多特征Bi-LSTM-CRF的影评人名识别研究
近年来电影行业蓬勃发展,相关的信息抽取和分析技术日益受到行业内的重视,其中对电影主创人物的分析尤为重要.而电影评论作为观影群体的主要反馈信息,具有重要的分析价值.如何从影评中自动抽取主创人名成为重要的基础工作.然而评论中观众对人物的称谓方式多样复杂,而且新电影的影评中往往存在大量人名未登录词,传统方法难以有效识别.针对影评的这些特点,该文提出一种基于多特征Bi-LSTM-CRF的影评人名识别方法.该方法通过利用外部人名语料和未标注影评提取字符级的特征,并采用Bi-LSTM-CRF模型进行人名字符序列标注.实验结果表明,该方法能够有效识别影评中的复杂称谓和人名未登录词,从而有效地抽取影评中的人名实体.
影评、LSTM、CRF、多特征、人名识别
33
TP391(计算技术、计算机技术)
国家自然科学基金61572145;广东省教育厅基础研究重大项目及应用研究重大项目2017KZDXM031
2019-04-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
94-101