10.11968/tsyqb.1003-6938.2020089
数字人文视野下的古汉语实体歧义研究
实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑.以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论.文章以《春秋经传引得》为文本语料,考察了语料中同名异指和异名同指两大类人名实体歧义,根据古文实体歧义消解的特殊性,提出两类歧义的消解方法和思路.研究基于实体语境和时间知识,构建了消歧规则并以先秦古汉语为实例进行了验证.上述方法在其他古汉语语料中的适用性值得进一步探究,基于消歧后的语料,文章呈现了先秦人物的基本全貌,表明了本研究的价值所在.
古文信息处理、实体歧义、古文智能处理、古文数字人文
TP393.1(计算技术、计算机技术)
本文系国家社科基金重大项目"基于《汉学引得丛刊》的典籍知识库构建及人文计算研究";国家自科基金面上项目"基于典籍引得的句法级汉英平行语料库构建及人文计算研究";江苏省社科基金青年项目"人文计算视角下的先秦人物知识获取及分析研究"
2020-12-04(万方平台首次上网日期,不代表论文的发表时间)
共10页
115-124