数据科学及其对信息科学的影响(6)
(1)对信息共享的认识:在传统信息科学中,如何促进信息共享是一种重要研究目的,倾向于认为信息共享中价值不会发生变化。例如,情报学领域的学者经常借用George Bernard Shaw的那句关于观点(信息)交换与苹果交换的对比的名言[34]来解释信息/数据的共享性。但是,在大数据时代,数据和信息的这种无损共享思想将发生改变。数据将是一种重要资产,在其共享过程中价值水平和含金量将发生重要变化(下降或提升)。因此,当人们认识到数据的“资产”属性之后,数据共享行为将从“无损共享”转变为“有损共享”,数据资产的拥有者变得不愿意无偿共享自己的数据,数据需求方也不愿意购买已经共享给他人的数据。
(2)对信息定价的认识:如何解决信息的定价问题一直是信息科学领域尚未解决的难题,众多专家学者曾从不同角度进行了多项研究,但均未得到有效解决方案。但是,大数据时代的到来为解决这一问题提供了新的机遇,数据定价变得容易起来——虽然一条小数据很难定价,但是有小数据组成的大数据很容易定价。其根本原因在于大数据具有价值密度较低的特征。以贵阳大数据交易所为例,该交易所采用竞价和议价方式实现大数据的定价,并累积交易额突破1亿元[35]。
(3)对信息法律的研究:由于数据的“资源化”认识,信息法律领域一直难以取得有突破性研究。最为典型的是个人隐私问题一直是信息科学领域的热门研究问题,但尚未得到共识,也没有在国家层面出台个人隐私保护法。追本溯源,其根本原因在于人们并没有把数据当作“资产”来看待,其所有权和利用权的研究仍为空白。因此,大数据时代的到来将引发信息立法的深入研究与广泛实践。
4.4 研究范式:从知识范式到数据范式
从总体看,近代科学研究范式都属于“知识范式”,即从“大量实践(数据)”中总结和提炼出一般性知识(定理、模式、模型、函数等)之后,用知识去解决(或解释)问题。然而,数据科学中兴起了另一种研究范式——数据范式,即根据问题找“数据”,并直接用数据(不需要把“数据”转换成“知识”的前提下)解决问题。例如,数据科学领域常用的机器学习中目标函数的学习可以是隐含的,通常无法明确表示目标函数。因此,在大数据时代,数据也成为一种重要力量。
表5给出了“知识范式”和“数据范式”的区别与联系。“知识范式”中的“知识”是解决问题的根本依据,当遇到一个新的问题时,首先想到的是用什么样的“知识”来解决,其主观性比较大,最终结果因人而异。与此不同的是“数据范式”中提倡的是直接用“数据”解决问题,不苛求数据的知识化过程。可见,数据范式更像是经验主义,强调的是经验和经历。在数据范式中,很多问题的解决过程往往转换成“简单的快速查询”问题,而不再是“复杂的逻辑推理”过程。CAP理论[36]和BASE原则[37]的提出代表了人类研究范式的这一变化。再如,很多学者曾讨论过一个重要话题——“大数据时代需要的是更多数据还是更好的模型(more data or better model)”,也反映出了数据范式的兴起。
表5 知识范式与数据范式的对比知识范式 数据范式解决问题的依据是否将数据转换为知识之后或用知识解释数据之后才能解决问题理论根源研究挑战知识 数据是 否理论完美主义 经验主义如何实现复杂推理 如何实现快速查询
其实,“知识范式”和“数据范式”的背后分别对应两个完全不同的主义——理性主义和经验主义。前者遵循的是“数据——知识——智慧”的模式,而后者对应的是“数据——智慧”的模式,即直接基于数据(尚未提炼成知识的前提下)产生智慧(解决实际问题)。也就是说,大数据将成为当今社会的智慧类应用(如智慧城市、智慧医疗、智慧校园等)和敏捷类应用(如敏捷软件开发、敏捷组织等)的主要源泉,“智慧=大数据”以及“敏捷=大数据”将成为社会新共识。
4.5 研究重点:从业务数据化到数据业务化
如何实现“业务数据化”是传统信息科学的重要研究课题。所谓的“业务数据化”是指将企业或组织业务活动以数据方式记录下来,所关注的是数据价值链的前端。以情报学为例,传统研究更多关注的是数据的获取、组织、存储和检索问题,而如何基于数据实现敏捷业务的研究仍未空白。与“业务数据化”不同的是,“数据业务化”是指如何基于数据定义和再造敏捷业务,属于数据价值链的后端。二者的区别与联系如图6所示。
文章来源:《档案学研究》 网址: http://www.daxyjzz.cn/qikandaodu/2021/0107/390.html
上一篇:绿色档案馆照明节能综述
下一篇:专业认证背景下档案学专业应用型人才培养研究