王兆鹏 郑永晓 刘京臣︱借器之势,出道之新--“(3)
她主持开发了《宋人与宋诗地理信息系统》。可惜她英年早逝,令人叹惋!
■王兆鹏 人文学者普遍关心,数字人文究竟有哪些功能,或者说它能解决什么问题?
■王兆鹏 每个时代作家群的社会流动、不同时代作品之间的互文关系,人工很难全面了解其详情,而用数字人文技术的文本挖掘功能就可以发现和解决。
■刘京臣 在近现代文学研究领域,报纸、期刊的流行,使得文献数量数倍于古代。随着西学东渐和中西文化碰撞,各类文学观念、思想观念往往经过一段时期的潜藏突然流行开来。对这些观念、思想流变的研究,传统作法是选取代表人物的代表作品、代表言论进行分析。这既缺乏大规模的实证依据,而所谓代表人物、代表作品也往往是后知后觉的产物,并不一定符合当时的实际。结合传统词源学、语义学和大数据技术,完全可以清晰地显示某个观念的诞生、潜隐、突变、流行、淡出的过程。
■王兆鹏 我曾经统计过《梁启超全集》中的相关语词,发现他早期使用的人称代词都是“吾”,后期多用“我”。如果对梁启超用语进行全面的历时性分析,那么就可以看出20世纪初期有关观念和用语的变化轨迹。
■郑永晓 目前的数字人文研究,虽长于宏观研究,但也能解决微观问题。例如,人物关系挖掘就是目前数字人文研究领域一个颇具特色的分支,可以利用信息抽取方法对人物进行社会网络关系挖掘,可以对多个关联作品的人物关系进行分析,这在小说研究中颇为实用。
二、 国内外数字人文研究的实绩与进展
■王兆鹏 近年来,国外数字人文研究取得了哪些实绩?做了哪些项目?建了哪些平台呢?
■刘京臣 国外跟我们中国文化有关的数字人文研究项目,比较引人注目的有三个:《中国历代人物传记资料库》(CBDB)、《中国历史地理信息系统》(CHGIS)和《古籍半自动标记平台》(MARKUS)。
中国历代人物传记资料库
中国历史地理信息系统
古籍半自动标记平台
■郑永晓 《中国历代人物传记资料库》由哈佛大学费正清中国研究中心、台湾“中研院”历史语言研究所与北京大学中国古代史研究中心共同建设,旨在系统收录中国历史上所有重要的传记资料,并免费供学界使用。从方法论的角度看,它主要涉及三个方面:一是群体传记学,力图通过一群历史人物生平的集体性研究探讨其共同的背景特征;二是社会网络分析(SNA),近三十年来已逐渐成为人文社科研究的一种新范式;三是地理信息系统(GIS),借助ArcGIS、MapInfo、Google Earth等软件将《中国历代人物传记资料库》与《中国历史地理信息系统》的数据整合在一起,可以帮助研究者在大量传记数据中归纳出一定的模式。《中国历代人物传记资料库》实现了数据、平台、方法论与工具的有机整合,颇具引领和示范意义。
■刘京臣 《中国历史地理信息系统》由哈佛大学、复旦大学共同研发,试图建立一套可靠、开放的基础地理信息数据库。《古籍半自动标记平台》由荷兰莱顿大学魏希德(Hilde de Weerdt)教授与何浩洋博士设计开发,是一个纯线上文本标记工具。通过自动或人工标记,使用者可以为文本标记出人名、地名、年号、职官等关键词。这些经过特征标记的文本,会成为其他数字人文研究的数据来源。与《中国历代人物传记资料库》相比,《古籍半自动标记平台》是一个文本标记平台,自身没有数据,需要使用者提供数据。
■王兆鹏 这些年,我国的数字人文研究也取得了很大进展。
■郑永晓 从研究机构来看,国内成立了一些数字人文研究中心。2011年,武汉大学成立了大陆首家高校数字人文研究中心。
文章来源:《档案学研究》 网址: http://www.daxyjzz.cn/zonghexinwen/2020/1110/347.html
上一篇:云南大学硕士专业介绍:档案学
下一篇:江苏无锡7名辅警售卖万余条车辆档案信息获刑