10.13682/j.issn.2095-6533.2017.01.018
一种多策略的中文领域本体概念抽取方法
为了提高中文领域本体概念抽取的准确率和召回率,提出一种多策略的中文领域本体概念抽取方法.该方法使用模式匹配法改进原有的单字合并法,经词性过滤和缺陷检测筛选出概念集组成用户词典,并送入概念抽取系统进行二次分词获得候选概念集;利用词频-逆向文本频率(TFIDF)方法和信息熵融合得到TFIDFE方法,计算概念权重以获得领域概念集.实验结果表明,该方法在领域术语抽取的准确率、召回率和F值上均有较好的效果.
本体学习、概念学习、单字合并法、TFIDFE、信息熵
22
TP391.1(计算技术、计算机技术)
陕西省自然科学基金资助项目2012JM8044;陕西省教育厅科学研究计划资助项目12JK0733;西安邮电大学研究生创新基金资助项目114-602080055;陕西省社会科学基金资助项目2016N008
2017-05-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
94-98