10.3969/j.issn.1673-629X.2008.12.060
基于本体相似度的中文科研论文信息抽取
随着大量的科研论文出现在互联网上,从中精确地抽取论文头部信息和引文信息显得十分重要.提出了基于本体相似度的信息抽取方法,该方法的关键在于用本体相似度判定某个行本体是正例还是反例,然后通过主动学习选择最有可能包含抽取信息的行本体集,再充分利用本体的语义推理能力找到正确的片断.从论文中提取头部信息和引文信息为进一步的语义检索和语义存储奠定基础.测试数据集的实验结果显示该方法比其他方法具有较高的准确率.
信息抽取、本体相似度、语义推理、主动学习
18
TP18(自动化基础理论)
安徽省自然科学基金重点资助项目2004KJ053ZD
2009-02-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
203-206