王兆鹏 郑永晓 刘京臣︱借器之势,出道之新--“(7)
虽然文献资源库可以帮助学者查询资料,但不能统计分析。要完成从数字化资源库到结构化数据库的转换,需要利用数据挖掘对文本进行加工,这种加工必须按照预设的规则进行,需要学者的深度参与,甚至需要学者对相关数据进行人工标记。数据挖掘可以通过技术来实现,但挖掘什么样的数据,什么样的数据有用,必须有古代文学研究的专家参与设计。专业领域的需求只有相关专家最为了解。钱钟书先生在20世纪80年代支持中国社会科学院建立计算机室时曾说:“实践证明,能帮助人的电脑需要人的更多帮助。”这句话即使在今天仍不过时。
■王兆鹏 下面我们再讨论一下,怎样运用数据和结构化数据库对古代文学进行分析和阐释。
■郑永晓 可以利用编年系地数据对作家群进行空间分析。如果文学编年地图平台囊括了自先秦至近现代以来的数万个作家的综合信息数据,包括其族群、行迹、交游、创作、作品传播等信息,当我们设定某个时间点启动系统进行分析时,就可以观察到所有活跃作家的迁徙移动信息。例如元军攻陷临安后的二三十年间,以关汉卿、白朴、马致远为代表的北方作家向杭州迁移,同时杭州本土作家,或作为遗民追怀宋室,或降元谋求新的出路。族群迁徙、文化碰撞、南北交流在这几十年间跌宕起伏、异彩纷呈。如果有这一时段的人口和作家历史地理信息数据库,我们一定可以发现传统研究方法易于忽略的细节和作家流动的趋势。
■王兆鹏 中国文化中心的三次大南移--永嘉之乱、安史之乱、靖康之乱后,北方士人向南方迁徙的时间、经行地、目的地、过程、路线等真实图景,也可以通过大数据来完整呈现。
■刘京臣 还可从时间和空间两个维度研究某个地方本土作家、流寓作家的唱和、交游情况,探讨文学史中重要时间、地点、事件、人物关系,揭示文学思潮、文学观念变化的关键节点和演进规律。
■王兆鹏 可找一两个具体时段为突破口,比如北宋神宗元丰年间乌台诗案后,包括苏轼在内的许多文士受到牵连贬谪,这些文士的贬谪地分布在哪些地方,各自走什么路线到达贬所,沿途和在贬所各有哪些创作,都可以通过文学编年地图予以可视化呈现。他们贬谪后的命运、生活、心态和创作各有哪些变化,也可以用数据来呈现和分析,由此再现当时的文学图景。哲宗亲政后的绍圣、元符年间,元佑党人纷纷遭贬,到了徽宗崇宁年间,更立元佑党人碑,三百多位元佑党人及其子孙遭受更严酷的迫害。这段时期政坛大变局、文坛大动荡的具体场景,如今可以用大数据来考察分析和可视化呈现。
■王兆鹏 我补充一句,“搜韵网”搜罗的古典诗词已达八十多万首,可以利用这个网站进行数据提取和分析。
■刘京臣 还可以跟计算机专家合作,利用语义分析技术,通过修辞手法的统计和分析,深度解析作家的艺术风格。
■郑永晓 也可以利用文本数据挖掘技术,开展文学影响史、接受史的研究。京臣所著《盛唐中唐诗对宋词影响研究》(中国社会科学出版社2014年版)就是一个很好的尝试。把唐诗和宋词通过计算机进行形式和语义方面的匹配,可以发现二者之间的内在联系。通过作品研究前后文学史之间的联系,较之单纯梳理相关记载、言辞要可靠得多。这种方式既可以研究不同文体之间的影响,也可以考察不同时代作家之间的影响与接受情况。
刘京臣:《盛唐中唐诗对宋词影响研究》,中国社会科学出版社2014年版
■王兆鹏 是的,可以研究唐诗对宋词的影响,也可以研究宋诗对宋词的影响、唐宋词对金元明清词的影响等等。一个作家的接受,不是单向的,而是多向的。比如,辛弃疾的一首词,既融化有唐宋诗词中的语句,也融化有前代经史子集中的语句。可以一个诗人或词人为视点,用大数据来分析、呈现其接受前人和影响后人的具体情形。
文章来源:《档案学研究》 网址: http://www.daxyjzz.cn/zonghexinwen/2020/1110/347.html
上一篇:云南大学硕士专业介绍:档案学
下一篇:江苏无锡7名辅警售卖万余条车辆档案信息获刑