10.3778/j.issn.1673-9418.2003022
融合词和文档嵌入的关键词抽取算法
各类应用领域的文本数据日益增多,如何从这些海量数据中迅速准确地提取核心内容,已成为关键词抽取的主要任务.提出一种基于词和文档嵌入的关键词抽取方法,通过计算单词与文档在同一维度上的向量表示,得出每个单词与文档之间的语义相似度,将其作为无向图中每个单词节点的初始权重.接着使用带语义偏向的随机游走策略,计算出每个单词以及候选词的分值.最后选取得分较高的前N个候选词作为最终关键词.在公开数据集上的实验结果表明,该算法在准确率、召回率、F值上均超过现有的主流关键词抽取方法,极大提高了关键词自动抽取的效率.
抽取、图排序、词嵌入、文档嵌入、语义信息
15
TP391.1(计算技术、计算机技术)
国家自然科学基金;安徽省高校自然科学研究项目;合肥师范学院校级科研项目;高校优秀青年人才项目
2021-02-05(万方平台首次上网日期,不代表论文的发表时间)
共11页
294-304