首页  IAS 新闻
IAS 新闻  

讲座回顾 | 孙建军:大数据时代人文社会科学研究方法变革

Time:2021-12-19 Hits:10

20211216日,高研院邀请南京大学信息管理学院孙建军教授做主题为“大数据时代人文社会科学研究方法变革”的专题讲座。本次活动是高研院“名家讲坛·南大学者”系列讲座第八讲、人文基金讲座第189期,也是南京大学120周年校庆系列学术活动。本次讲座邀请了高研院兼职研究员、哲学系宋立宏教授担任主持,来自不同院系的数十名同学和老师参加了讲座。

进入二十一世纪以来,以大数据、人工智能、移动互联网等为代表的新一轮科技革命已经深刻地改变了传统的知识生产、组织和传播方式,也对人文社会科学研究的选题、方法和思维提出了新的要求。在本次讲座开始时,孙建军老师首先回顾了前不久在南京大学召开的第三届中国数字人文大会的情况,并引用了武汉大学马费成教授、清华大学罗家德教授和南京大学周宪教授三位学者对于大数据背景下人文社会科学在研究范式转型、方法论革新和学科观念变革等方面的思考。孙老师通过对“元宇宙热”、2021年度人类社会发展十大科学问题等现象的分析指出,在数字技术不断发展的当下,能否带来人文社科领域研究方法的革新?在大数据时代里,如何能在海量的数据中发现问题和价值?怎么利用新的研究方式和研究模式探讨问题?这些才是我们需要重点关注和思考的核心问题。我们需要在事实、数据和信息层面实现跨层级链接,从而达到从知识到智慧的递进。


随后,孙老师着重从数据驱动研究范式的兴起与审思、相关研究的前沿课题两个方面展开论述,并对大数据时代人文社科研究的未来发展做了展望。在大数据研究范式的兴起问题上,孙老师介绍了科学研究四种范式的发展历程,指出了数据、技术和应用三者之间的密切关联。在我们生活中的很多应用场景乃至社会治理和国家大政方针的制定与实施中,这些都离不开数据的支持,更需要系统观念和系统范式的指引。孙老师认为,目前的人文社会科学研究正在经历从定性、定量、仿真向基于大数据的研究的转型,这一新的研究范式具有不同以往的鲜明特征:它以海量数据为基础,以不同于传统研究的方式获取结论,凭借着相对完全且丰富的数据集和分析工具,这种范式为人文社科学者大规模协作提供了可能,同时,这种范式还具有跨学科的显著特征。他列举了运用大数据方法来从事经济学研究和人文研究的具体案例,分析了这种范式转型在重塑人文社科目标、推动理论研究发展、促进学科融合、提升人文社会科学“科学性”等方面的积极影响;同时也对这种范式的兴起提出审思,对其中人文关怀不足、消灭个性化特征、忽视整体性与思辨性、数据的安全与信息控制等问题提出了警示。孙老师提醒我们要理性地看待研究方式的变革,谨慎应对大数据带来的数据真实性和可靠性等挑战。

接下来,孙老师专门列举了大数据驱动的人文社科研究的四个前沿领域。其一是利用互联网非介入式的方法来解读行为科学。孙老师逐一列举了传统的介入式研究、介入式和非介入式对比的研究、从两种不同途径研究“幸福感”、智能手机传感方法研究以及利用影像数据来探究人类行为等众多案例,来说明互联网大数据使得我们今天在人文社会科学研究中对“隐性”行为的挖掘已经成为可能。孙老师还专门列举了他亲身参与的疫情期间“舆情对于民众出行行为的影响”的研究案例,他和团队成员借助媒介依赖理论(media-system dependency),在收集分析大量数据的基础上,得出了“疫情公开有利于提升民众信心”的结论。通过对以上案例的分析,孙老师提醒我们要去思考如何获得新的技能、培养新的思维模式以适应大数据时代行为科学研究,以及如何利用大数据的优势“挑战”行为科学领域的既定方法和道德规范,这些都是大数据时代行为科学研究的重要问题。

大数据研究的另一个前沿领域是数字人文领域。孙老师简要介绍了国内外数字人文研究的发展情况,并专门介绍了大数据在古籍文本平台、判断古典文学作品作者(文学指纹)、分析中国山水画中“留白”的演变规律、建立可视化历史地理信息系统、利用VR/AR虚拟技术实现古迹和历史场景的再现以及艺术品、建筑的数字化数据采集和非遗保护等众多课题中的应用现状和未来前景。孙老师还特别介绍了南京大学的跨学科团队新近完成的南京大屠杀史料集语料出版的情况,借助了数字化技术和大数据的处理,使得原先隐藏在史料中的人物关系、事件关联等问题得以逐渐呈现和清晰起来。

 

大数据时代下的机器学习与因果关系也是大数据研究的又一前沿领域。在孙老师看来,大数据分析固然使我们对相关性更感兴趣,但其实对于源头的探寻更加重要,这就需要对因果关系予以关注,更需要把相关性与因果分析结合起来。孙老师引用了2021年诺贝尔经济学奖得主Joshua D. AngristGuido W. Imbens的“Rubin因果模型”及其对于因果关系分析的方法论贡献,以及由图灵奖得主、贝叶斯网络之父朱迪亚·珀尔(Judea Pearl)所提出的“从数据革命到因果革命”的范式偏移的趋势。孙老师分析了机器学习在因果推断中应用的三个方面,还专门介绍了南京大学大气、建筑、地海等多个学科合作的关于气候变化对中国传统建筑屋顶的影响的研究

第四个大数据驱动的人文社科研究的新兴领域是社会预测研究。孙老师认为,大数据与机器学习以其海量的信息基础、强大的计算能力和对模型复杂度与准确度的大力提升为社会预测带来了新的转机。孙老师介绍了霍夫曼(Hofman J. M.)等学者2017年以来对于社会科学研究中预测问题的思考,以及我校社会学院陈云松等学者对于定量社会研究在社会预测方面对于范式突破意义的判断。他对大数据引导的社会预测的新范式做了具体描述,并阐述了其中的价值和意义。孙老师专门列举了Facebook对于用户上传和转发照片的影响力分析,并以我校商学院郑江淮等学者所做的全球人才流动规律与创新效应等具体个案,剖析了如何从研究学者的学术成长轨迹拓展到研究知识的转移和扩散,乃至引申和借鉴到政府政策措施的演化,以及对于社会经济发展的预测等。大数据驱动的社会预测研究的发展表明社会科学研究正在走向智能化和多学科化,同时也具有了现实性和社会导向性的价值。

 

尽管大数据为我们当下的人文社科研究在题材选择、方法论和思想深度层面都提供了丰富的可能性和启发性,但孙老师提醒我们仍然需要面对一些存在的问题、认识的误区和潜藏的风险。其中之一就是大数据研究要面向真实的世界,要着力于提升影响力。孙老师认为数据驱动的人文社科研究既来源于真实世界,也要服务于真实世界,数据驱动研究的关键就是不能以构建一座“空中花园”为行动的终点,而要针对复杂性和多样性并存的中国情境,走出“象牙塔”做到顶天立地。孙老师特别强调的另一点是要重视相关思维、计算思维、工程思维、跨界思维、时空思维、三元世界思维等多元思维的运用,注重数据驱动和情境驱动的融合,用领域知识和场景特征等将数据驱动这个“黑箱”打开。此外,孙老师还特别指出了数据互证逻辑的重要性,他介绍了国际学术界对于心理学研究中“可重复性危机”(Reproducibility Crisis)的讨论,并提出能否引入以数据互证为基础的多元互证体系的构想。最后,针对数据驱动的“唯技术论”偏向,孙老师提出了将技术理性与人文价值融合的建议,要致力于构建更长的知识链、探寻跨学科理论、方法、数据等多维度的关系网络,促进跨学科知识的融合与创新。讲座的最后,孙老师、宋老师与听众们还就数据的抓取和处理、数据的碎片化和模糊化、数据安全与隐私保护、技术壁垒与数据的文化意义及美学价值等问题进行了讨论。


CopyRight © 2010 IAS Inc . All rights reserved. 您是第  1000 位访问者