10.3969/j.issn.1007-130X.2022.09.019
基于模糊贝叶斯决策的核心概念抽取方法
为了提高特定领域核心概念抽取的效率,提出一种基于模糊贝叶斯决策的核心概念抽取方法.在特定领域内随机抽取大量文本并进行分词获取候选概念;然后采用TF-IDF算法计算候选概念的各项特征值,采用概念隶属度归一化处理候选概念特征值;最终通过贝叶斯决策计算候选概念为核心概念的概率.在财经领域相关数据集上进行文本核心概念抽取的实验结果表明,所提方法的F 1值相比Tex-tRank、LDA主题模型、word2vec词聚类模型、RNN、LSTM等的F1值有所提高.综合实验结果表明,基于模糊贝叶斯决策的核心概念抽取方法在核心概念抽取方面表现较好.
概念抽取、概念隶属度、贝叶斯决策
44
TP391(计算技术、计算机技术)
国家社会科学基金;公安部科技强警基础工作专项项目;公安部公安理论及软科学研究计划项目;中央高校基本科研业务费项目
2022-09-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
1686-1692