12月27日,新加坡南洋理工大学心理学副教授邱林应邀在江安校区文科楼一区526会议室为必赢官网师生作题为《大数据与计算社会科学》的讲座,由必赢官网陈侠副教授与宋雯讲师主持。
邱林副教授结合研究案例说明大数据为大规模研究人类行为提供了前所未有的机会,且越来越多地用于揭示个体差异和群体动态。
邱林副教授首先以2009年发表在Nature上的研究为例,指出数据驱动的缺陷。该研究显示,谷歌搜索的关键词可以预测流感趋势,且比国家流行病控制中心得到的数据更快更准。但在2014年,Lazer等指出算法只能预测季节性流感,无法预测突发性流感,其原因在于该算法完全依赖机器学习(Machine Learning)。通过此案例,他强调大数据研究中运用理论指导研究设计的重要性。随后,邱林副教授指出理论驱动的研究同样存在问题。首先,理论驱动的研究一般无法精准预测;其次,很难得出具有新意的研究结果;再次,理论驱动常因关注理论问题而忽视了现实生活中的实际问题。因此,邱老师认为,在大数据研究中应将数据驱动与理论驱动结合,以弥补两者的不足。研究者则应同时具备数据敏感与理论洞察的能力,从而更好地进行大数据研究。
邱林副教授以谷歌搜索预测焦虑感为例切入,说明大数据测量的效度问题。他指出,处于焦虑状态的用户和对焦虑的信息感兴趣的用户均有可能使用谷歌搜索有关焦虑的信息,因此,无法单纯依靠谷歌搜索预测用户的焦虑问题。其后,他以文化节日怎样影响种族和谐关系的研究为例,分析并强调大数据研究中小数据的作用。他指出,小数据研究可以解决一些大数据中无法涉及的问题,因此,在研究中可以采用大数据与小数据相结合的方法,从而确保研究结果谨慎可靠。
邱林副教授认为,在进行大数据研究时,应考虑数据在时间与空间等维度上的差异性。他以朋友圈与幸福感关系的研究为例,说明纵向数据可以更丰富地显示一个人的心理状态变化。此外,邱林副教授举例指出,日本是“紧文化”社会,社会规范较强,情绪表达受到压抑;而泰国属于“松文化”社会,情绪表达更为开放。因此,当同在社交媒体上使用“难过”一词,日本人和泰国人所表达的情绪强度可能极为不同。由此他建议,在分析网络数据时,应注意数据在空间维度上的差异性。
讲座现场
互动环节,邱老师与必赢官网学子交流对话,并解答了同学们提出的问题。他在讲座总结中说,社会科学正在经历一场历史性的变化,大数据为当前研究提供了很好的机会,但研究者在进行大数据研究时,要保持“谨慎的乐观”态度:数据驱动与理论驱动结合;大数据与小数据相结合;根据实际情况纵向与多层次分析数据;多渠道多类型获取数据使实验更加严谨。
互动环节学生提问
陈侠副教授听完讲座后表示,此次两场讲座的意义在于帮助文新学子们思考,应当如何面对传统与经典的新闻传播学学科范式不断受到来自其他学科与新技术的冲击。两场讲座分别从世界主义与环保主义、大数据与计算社会科学的角度,启发同学们结合社会文化心理学视角,反思诸如“世界主义”的人文概念如何与实证的量化研究相结合,完成一项科学、规范的跨学科研究;继而,邀请同学们思考当“大数据”的时代大潮汹涌而来时,我们如何避免被大潮席卷、陷入“唯技术论”的工具理性主义,讲座列举了前沿研究文献的案例,提供同学们深刻体会如何在研究中谨慎地平衡“理论驱动”与“数据驱动”,乐观地融合“大数据”与“小数据”的方法路径。值得一提的是,此次讲座幕后的学生工作团队(顾娜娜、宋柳君、李沁怡、廖毅)整理了预约参加讲座的同学的多元学科背景信息,这让邱林副教授联想到了近期发表在《自然》(Nature)的一篇应用“大数据”的研究:该研究基于自1900年至2017年间发表在《自然》的8.8万篇论文,分析其得到Web of Science收录期刊文献的共引模式,揭示出了不同学科之间越来越紧密地交叉融合的大趋势(原文以Nature’s reach: narrow work has broad impact为标题发表于2019年11月06日的《自然》评论)。她相信,这也正是每一位年轻学子所面对的未来。以更为积极、开放的心态投入跨学科的学习、研究和实践,是新时代对同学们的召唤!
同学们纷纷表示受益匪浅,分享了他们的讲座心得。
19级新闻学专业硕士研究生李同学说,这次讲座中,邱老师用自己所做的研究项目,向我们直观展示了数据在研究中的潜力。大数据技术不仅让我们得以拥有更多的数据,还拓宽了我们分析数据的视野维度。在肯定大数据技术带给社会科学研究的新思维、新方法的同时,邱老师仍保持了一名研究者的谨慎与反思。对于研究的未来,究竟是定位于数据驱动还是理论驱动?邱老师指出,数据技术是一种力量,至于要用这种力量来驱动整个学术研究的方向,研究者还是应该保持谨慎的乐观。这次讲座给了我很大的启发,希望自己能在未来练就对数据的敏感,对理论的洞察,于技术的浪潮之中找到研究实践的方向。
18级网络与新媒体专业本科生兰同学说,就像邱老师讲的那样,如今社会科学领域的研究已经不局限在我们所熟悉的质性研究范围了,而是将社会心理学等人文社科研究与诸如大数据、社交媒体用户数据分析相结合,以此探究人们认知的节律性。不过,我们仍然需要保持“谨慎的乐观”,不论是数据驱动,还是理论驱动,都存在着自身的局限。总之,社会科学的“数据化”对于人文研究意义非凡。
19级新闻与传播专业硕士研究生陈同学说,今天是大数据的时代,由于大数据技术的不断发展,为大规模的社会科学研究创造了机遇。在邱老师举例的研究里面,他们分别收集了新加坡和美国几十万人在推特上发表的几百万条内容,通过计算机大数据对其进行分析。以此说明数据驱动、理论驱动、测量效度、纵向多层次分析和数据集成等社会科学家在使用大数据时经常会面临的问题,最后提出了对应的解决方法。邱老师作为计算机和心理学跨学科研究的学者,在他的研究中传递了理性和感性的融合,让我获益良多。
17级网络与新媒体专业本科生常同学说,大数据,一个方兴未艾的社会科学研究工具。很遗憾,囿于视野和具体操作技术的原因,我一直未能真正近距离接触它。这导致我和这个前沿的研究工具之间一直存在着不小的“鸿沟”。邱老师的讲座中从认知节律、金钱与幸福、知识图谱到节假日与种族和谐,他用直观丰富的案例层次性地递进,让我对大数据与计算社会科学的关系有了更深刻的认识。结合邱老师举的案例和讲解,我认为,如果在今后有机会接触大数据研究,我或许必须置于高优先级的问题是——大数据是我的发现工具还是验证工具?在这一问题下,还要带着“谨慎的乐观”,将“Big和Small”、“Big和Full”的关系思考贯彻始终。
【主讲人简介】
邱林,新加坡南洋理工大学心理学副教授,美国西北大学博士。研究方向包括社会心理学、网络心理学和计算社会科学等,研究成果多发表在《心理科学》、《人格与社会心理学公报》、《人格研究期刊》、《人类行为计算机》、《计算社会科学期刊》、《网络心理学》、《行为与社会网络》等顶级期刊。目前任《计算社会科学杂志》副主编和《亚洲社会心理学杂志》副主编。
采写:黄捷、蔡亚纯、曾琦
摄影:蔡亚纯
编辑:黄捷
责编 :操慧、陈侠