10.16208/j.issn1000-7024.2018.06.024
用于短文本关键词抽取的主题翻译模型
为进一步改善短文本关键词抽取的效果,提出一种TTKE (topical translation for keyphrase extraction)主题翻译模型.结合主题模型与统计机器翻译模型的优势,通过长文本辅助短文本进行主题发现,学习特定主题下词语与关键词的对齐概率,为给定短文本进行关键词抽取.在真实数据集上进行实验,实验结果表明,该模型能够有效提高短文本关键词抽取的效果.
关键词抽取、短文本、长文本、主题翻译模型、主题发现、对齐概率
39
TP391.1(计算技术、计算机技术)
国家自然科学基金项目61540050;贵州省重大应用基础研究基金项目黔科合JZ字[2014] 2001;贵州省科技重大专项计划基金项目黔科合重大专项字[2017] 3002
2018-07-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
1633-1638