王兆鹏 郑永晓 刘京臣︱借器之势,出道之新--“(6)
■王兆鹏 其实,你们俩在这方面的成果也很突出。永晓的《以GIS为例看信息技术在古典文学研究中的应用》(载《重庆教育学院学报》2006年第5期)、《情感计算应用于古典诗词研究刍议》(载《科研信息化技术与应用》2012年第4期)、《〈佩文韵府〉与康熙后期唐宋诗之争》(载《文学遗产》2017年第3期)等论文,都是有益的尝试。特别是利用大数据的思维方式和方法研究《佩文韵府》,颇具方法论的启示意义。京臣的《振笔欲增西域记--GIS视阈中〈万里荷戈集〉研究》(载《重庆师范大学学报》2015年第6期)、《大数据视阈中的文学地理学研究--以〈入蜀记〉〈北行日录〉等行录笔记为中心》(载《文学评论》2017年第1期)、《他者视阈中的数字方志建设--以燕行录中的蓟州为中心》(载《中国地方志》2017年第5期)等论文,都是围绕GIS进行数字人文研究的成功之作,为古典文学研究具体运用数字人文的理念和方法开示了门径,提供了范例。
三、 古典文学研究应用数字人文的前景
■王兆鹏 咱们前面回顾了海内外数字人文研究的进展,下面来展望一下古典文学研究领域进一步深入开展的愿景吧。我们可以从两个方面来谈,一是基础建设,二是理论研究。数字人文的基础工程是数据和平台,我们从事古代文学研究需要哪些数据,应该建设哪些平台呢?
■刘京臣 请王老师先说说这方面的思考。
■郑永晓 平台建设方面,您有什么构想?
■王兆鹏 我希望国内各大型数字化文献资源库能升级换代为关系型结构化数据库,并且有一个平台,能把各自独立分散的数据资源用搜索引擎将其汇聚串联起来,成为一个超大型的文献资源数据集成平台。我们中南民族大学数字人文资源研究中心正在努力把《唐宋文学编年地图平台》扩建成《唐宋文学知识图谱平台》。第一步是将唐宋时期的全部文学作品、野史笔记、历史典籍、地理方志和文学批评史料、选本资料、20世纪海内外唐宋文史研究论著目录,进行集成和标引,开发成关系型结构化数据库。数据库可以提供上面所说的作家、作品和历史地理三大系列数据。我们的目标是,以目前的文学编年地图为基础,建构唐宋文学的知识图谱,还原唐宋文学的历史场景。第二步,是将平台的知识图谱向前后延伸,形成贯穿古今的中国文学知识图谱。
■刘京臣 平台数据的功能有哪些改进呢?
■王兆鹏 平台数据是一键生成、个性定制,使用更加便捷,可以满足不同用户的个性需求。用户查询到的数据或相关资料,一键就可以生成下载。目前众多的文献资源库,检索到的资料需要我们一条条地拷贝下载,很费时间。比如,我们在《文渊阁〈四库全书〉电子版》里检索到有关苏轼的资料两千条,需要点击拷贝两千次。而我们开发的结构化数据库,今后只要一键就可以下载全部资料数据,下载的数据包含原始文献,都是分类打包的。下载的这些资料,可以保存到平台为用户提供的个人云盘中,不必重新拷贝到个人电脑硬盘里。
平台还可以满足个性化的定制服务。用户需要什么样的数据,平台可以针对性地提供其所需的数据。我们希望用户及时地将需求和建议反馈给我们,我们会不断完善数据库,以满足用户的不同需求。我们的平台,将来不再是中国文学研究的辅助性平台,而是刚需性平台。它既可以语义检索、时空定位、关联生成,又可以统计分析、可视化呈现。无论是做数据统计还是文本分析,是文献考据还是理论阐释,都离不开这个平台。
■郑永晓 从文学地图到文学图谱,确实是很宏大而切实的跨越。期待文学图谱平台早日建成。
■王兆鹏 知识图谱的部分功能已经实现,用户可以随时上网去试用体验,我们是免费开放的,目前的网址是 学者应该参与数据库的开发。现有文献资源库,基本上都是商业公司的产品。在开发过程中,学者的参与度很低。
文章来源:《档案学研究》 网址: http://www.daxyjzz.cn/zonghexinwen/2020/1110/347.html
上一篇:云南大学硕士专业介绍:档案学
下一篇:江苏无锡7名辅警售卖万余条车辆档案信息获刑