数据科学及其对信息科学的影响(11)
3 数据科学与领域知识之间的内在联系
数据科学的出现正在对包括信息科学在内的领域知识产生着深远影响。信息科学领域的专家学者应抓住大数据及数据科学带来的机遇与挑战,不断提升所属学科的科学地位,对社会生产与经济发展作出更多贡献。
3.1 数据科学中的领域知识
数据科学与生俱来与领域知识之间相互包含和无缝集成的特点。根据Conway[25]给出的数据科学韦恩图(The Data Science Venn Diagram),数据科学处于数学与统计知识、黑客精神与技能以及领域实务知识等三大领域的交叉之处,如图2所示。值得一提的是,图2中的“黑客(Hacker)”并不是指“骇客(Cracker)”,“黑客精神”是指“大胆创新、喜欢挑战、勇于创新、追求完美和不断进取”的积极精神[6]。
图2 数据科学的理论基础(修改自Drew Conway的数据科学韦恩图[25])
数据科学的起源与发展既吸收领域知识的已有理论,又进一步拓展了其研究视野和研究责任。以情报学的经典理论——DIKW(Data, Information, Knowledge, and Wisdom,数据/信息/知识/智慧模型)模型[26]为例,此模型不仅在数据科学中广泛应用,而且演化成为DIKUW模型(Data, Information, Knowledge, Understanding, and Wisdom,数据/信息/知识/理解/智慧模型)[27],开始强调数据理解(Understanding)的重要性,改变了传统情报学理论的主要关注点。
3.2 领域知识中的数据科学
大数据时代的到来推动了从物理世界(Physical world)到数据世界(Data World)的映射进程,将原本分散在信息论、控制论和系统论等底层理论中的“数据问题”从各自学科之中独立出来,逐渐聚焦成为一门新兴学科——数据科学。因此,数据科学对领域知识的最大影响在于将进一步抽象基础科学(如信息论、控制论和系统论等)中的“数据问题”,在领域知识与其理论基础之间出现一门新科学,使二者的研究责任与研究边界将进一步明确。也就是说,信息学、图书情报学、经济学、新闻学、社会学等上层理论将共享一个理论基础——数据科学,而不再直接面对信息论、控制论和系统论等底层理论,如图3所示。
3.3 数据科学与领域知识协同
数据科学与领域知识将相互借鉴并协同发展。数据科学中出现了不同于传统科学研究的新方法论,并将广泛应用于领域知识中,甚至在具体领域中演化出特定的方法。比较有代表性的是三个(图4):
一是图灵奖获得者Jim Gray提出的科学研究第四范式——数据密集型科学发现(the Fourth Paradigm: Data-Intensive Scientific Discovery)[8],科学家将不一定亲自收集数据,更加重视的是从大数据中发现所需数据的能力;
二是在大数据时代,随着经验主义(Empiricism)的兴起[28]“基于数据解决问题”的新方法论的出现改变了以“基于知识解决问题”的传统理性主义(Rationalism)[29]方法论,并二者之间形成了互补优势;
三是科学研究中的“数据驱动(Data-driven)”特征将越来越明显[30],与目标驱动、模型驱动、假设驱动以及决策驱动等传统范式并存,科学研究将变得更为动态、客观和敏捷。
图3 数据科学将成为信息科学的新理论基础
图4 传统思维模式与大数据思维模式的对比
4 数据科学对信息科学的影响
数据科学对信息科学产生的影响主要涉及信息科学的理论基础、学科定位、数据认知、研究范式和研究重点,如表2所示。
表2 传统环境下的信息科学与大数据环境下的信息科学的对比传统环境下的信息科学 大数据环境下的信息科学理论基础“老三论” 数据科学学科定位专业信息工作者与专业中的信息工作者的角色定位不明确专业信息工作者与专业中的信息工作者的角色定位较为明确数据认知按一种“资源”来对待 按一种“资产”来对待研究范式知识范式 数据范式研究重点业务数据化 数据业务化
4.1 理论基础:从“老三论”到数据科学
数据科学给信息科学带来的第一个重要影响是理论基础的改变。通常认为,信息科学的理论基础是“老三论”——信息论、控制论和系统论。但是,数据科学的兴起将原本分布在上述不同学科中的“数据问题”得到进一步抽象,逐渐从母体学科中独立出来,并聚焦到数据科学之中。因此,在一定程度上数据科学替代传统科学,即将成为信息科学的新理论基础,如图5所示。
图5 信息科学理论基础的变化
文章来源:《档案学研究》 网址: http://www.daxyjzz.cn/qikandaodu/2021/0107/390.html
上一篇:绿色档案馆照明节能综述
下一篇:专业认证背景下档案学专业应用型人才培养研究