18世纪德语历史文献的数据挖掘:以主题模型为例
主题模型是新近开发出来的研究方法,对于拓展数字人文的研究路径非常有价值。LDA 是主题模型算法之一,将它运用到“德语文献档案”收录的1700-1800年间的文献,在归纳、分析文本的主题后,对主题模型方法的有效性进行评判。主题模型的演算结果让我们对18世纪德意志精神世界有了更加立体的认知:18世纪的作者具有强烈的历史意识,对知识体系的构建异常积极,小说受追捧与公共领域的兴起密切相关,宗教启蒙是时代主题。这些结果表明,启蒙运动具备多重面相。在历史研究中需要将以主题模型为代表的远距离阅读与细读有机结合起来,才能够得到更具说服力的研究成果。主题模型作为一种文本挖掘的方法,仍然存在改进的空间,而这种进步需要人文学者与计算专家的通力合作。这也是数字人文继续发展的必由之路。
数字史学、主题模型、德意志、启蒙运动、远距离阅读
TP3;R44
国家社科基金青年项目“18世纪德意志的民众启蒙”项目号11CSS011的阶段性成果。本文写作得到了哈佛大学 CBDB中心王宏甦,徐力恒两位学友的帮助。南京大学历史学院舒小昀对本文提出了建设性的修改意见。
2017-03-22(万方平台首次上网日期,不代表论文的发表时间)
共11页
206-216