10.3772/j.issn.1000-0135.2022.09.009
科技文献内容语义识别研究综述
科技文献内容的语义识别是将蕴含在文本中的科研要素显式地揭示出来.它属于细粒度文本挖掘,是获取和利用知识的基础.本文梳理科技文献内容的语义识别相关研究,为后续研究提供参考.首先概括现有的文献内容语义标注模型,然后围绕章节、句子、词汇三种识别粒度,梳理科技文献内容语义识别问题的研究发展,总结识别方法、评测手段以及典型应用,并据此提出现存问题及未来发展方向.本文探讨了五个方面的问题:①人们关注文献内容中哪些语义类型;②选取什么粒度的文本单元作为识别对象;③识别方法分为哪些类型;④如何评测识别结果;⑤语义识别有哪些典型应用.本文发现目前还存在语义类型标准不一、优质文献数据集欠缺、研究关注点不平衡、识别方法存在局限等问题,需要在后续研究中探寻解决方法.
科技文献内容挖掘、语义类型、章节结构功能识别、语步识别、词汇语义识别
41
TP393.03;G64;H146.3
国家社会科学基金21BTQ065
2022-10-21(万方平台首次上网日期,不代表论文的发表时间)
共12页
991-1002