当前位置:无忧公文网 >范文大全 > 征文 > 计算社会科学:社会科学与信息科学的共同机遇

计算社会科学:社会科学与信息科学的共同机遇

时间:2022-03-22 09:31:30 浏览次数:

zoޛ)j馟i=^8m5MiYgz(KzčIhh(jبlȚ政治选举结果、宏观经济形势的预测,以及对突发事件的预警等[27]。这类网络情感分析工具能够实时地测量网络大众情绪,不仅为传统情绪心理学理论研究注入活力,增强了社会科学的实用价值,而且还支撑扩展了信息科学中传统的文本情感分析技术。譬如,同时兼具信息科学和心理学背景的学者Johan Bollen等人,基于心境量表(Profile of Mood States,POMS)开发了网络情绪分类标准及其测量工具,并分析了2008年美国微博客网站Twitter.tom上高达几百万条微博条目(tweets)中情绪表达信息,发现Twitter微博条目中的“镇定(calm)”类情绪词汇量的每日变化趋势,可以成功预测2~6天后美国道琼斯工业指数的升降,预测准确率达到87%[28]。目前针对网络论坛、博客、社交网络的情感倾向性研究已有很多,而由于微博客应用的快速发展,基于微博客平台的情感倾向性研究有快速增长乃至爆发的趋势。研究者可基于微博客平台,针对某些重大社会事件,进行网民情感倾向监测和分析,从而准确把握社会大众态度和情绪的变化过程,这对民意问询、公共管理决策等都具有重要应用价值。

(二)经典心理学假设在网络大数据层面上的验证

心理学是研究人类心理和行为的科学,自诞生以来已建立和发展起庞大的理论假设库。这些假设通常要经过问卷调查、实验设计、统计分析等一系列研究程序和方法进行验证,其中往往存在非代表性取样、研究情境不真实等问题,因此传统心理学研究方法论存在一定缺陷。然而,计算社会心理学研究能收集和分析实时更新的海量人类信息数据,这些数据具有大范围、真实和完全描述的特征,能够显著有效地解决非代表性取样问题,并避免实验条件真实性的拷问。因此,在大数据技术时代背景下,可采用信息科学技术或计算社会科学新研究范式,对已有的可计算心理学理论假设进行逐一检验和发展。譬如,美国心理学家Markey夫妇通过分析美国大选期间搜索引擎网站Google.com上各州的色情类词汇搜索量波动趋势,发现如果某政党“票仓州”所支持的参选者最终确实获胜,选举之后该州的色情类词汇搜索量会快速上升,并显著高于其它州。该搜索行为现象验证了进化心理学中经典的“挑战假说(challenge hypothesis)”[29]。Golder和Macy则通过分析2008年2月至2010年1月之间Twitter.com上正向情绪类词汇和负向情绪类词汇出现频率的波动趋势,结果发现正向情绪随季节变化而变化,未发现支持日照绝对时长与正向情绪之间存在显著相关的证据,但验证了情绪心理学中有关情绪与季节、生物节律问关联的“阶段转换假说(phase—shift hypothesis)”[30]

(三)海量信息中的社会心理新规律发现

现代互联网络技术的迅速发展给人类活动带来了深远影响,用户可以使用BBS、博客、社交网络、微博客等多种工具或方式将自己当下的观点、状态和情绪表达出来;同时随着信息科学技术的不断成熟,使研究者可轻松获得这些海量的网上信息,并从中发现隐藏的、有价值的人类社会心理新知识。譬如,美国心理学家曾发现,利用谷歌网站应用软件“谷歌趋势(Google Trends)”记录的网民对于自杀、自残、抑郁类词汇的搜索量数据,发现其与现实中的大众自杀、自残数据呈显著统计相关关系:在成人群体中呈显著负相关,在青少年群体中呈显著正相关[31]。再比如,通过对新浪微博海量信息的分析,中国社会心理学家周欣悦教授及其团队初步发现,自然灾害之后公众对于“公平”的关注会下降,具体表现在公平类词汇的每日词频变化趋势:在地震后的5~6天会有一个词频低谷,而在大约20天后会有一个高峰。

值得注意的是,以上这些可被归类为计算社会心理学研究的成果,有很多是由信息科学家与社会学家、经济学家甚至政治学家合作发起,计算社会心理学的巨大学术价值还未被广大社会心理学家充分意识。在未来,信息科学与社会心理学的相互交流和促进,将是计算社会科学的重要发展方向。

四、问题与挑战

随着互联网络的迅速普及以及随之而来的信息数字化、生活网络化浪潮,给社会科学研究带来了新的挑战。同时,互联网络海量数据提取、挖掘和分析技术的相对成熟,也给社会科学带来了方法论革新机遇。计算社会科学或社会计算已逐步获得国内外学术界的重视。我国学者于2004年提出开展社会计算研究的倡议[32-33],之后许多学者纷纷投身其中,目前,开展相关研究的单位主要包括中科院自动化所、中科院计算技术研究所、天津大学、哈尔滨工业大学和中国人民大学等。计算社会科学正在以前所未有的广度、深度和尺度影响着我们收集、整理、分析海量人类行为数据的能力,为社会科学研究提供了全新的工具和视角。与此同时,它在发展过程中也面临着一些亟待解决的问题。

第一,数据收集和存储中的问题。首先,计算社会科学在数据收集上存在着隐私权隐患。在互联网络中,用户存放了大量个人隐私,如个人信息、人际关系、共享信息等。不合理地使用这些隐私数据将会给公众生活带来不良影响,因此,部分网络数据是无法公开提供给学术界使用的[34]。另外。当今的信息技术虽然能实现对大规模人类行为的全面实时记录,但在数据存储方面却仍然面临着巨大数据如何存储和管理的技术难题,当前的计算机系统还无法完全满足这一需求。

第二,传统社会科学研究思维不适用于大数据时代。计算社会科学的主要研究对象是互联网新兴计算平台下实时收集、更新的海量人类数据,传统社会科学研究方法和理论不再适用于这些数据的分析和规律总结工作。无论是相关关系亦或是因果关系,经典的社会科学研究都要求在实证之前明确相应理论假设,实证操作才能以此作为指导原则,去证实或证伪假设。但是在茫茫大数据之中,基于先期有限的前提假设寻找特定变量间的关系,无异于大海捞针。因此,计算社会科学领域亟需新的适于大数据分析的方法论思想及其具体技术。计算社会科学方法论研究者们也在不断努力,譬如Reshef等人于2011年在《科学》杂志上发表文章,介绍了一种在海量数据集中发现潜在重要关系的新统计方法“最大信息熵非参探索”(maximal information—based nonparametric explo—ration,MINE)。这种方法能对变量间不同类型关系进行快速评估,发现大尺度网络范围内的关系类型,利用这种方法研究者无需对其寻找的关系有所了解或设立前期假设,就可以检测由多种因素驱动的复杂模式。作者还将MINE方法与其它方法进行了比较,结果发现MINE更适合于做快速的数据关系探索,这将有助于计算社会科学领域的大幅发展[35]

第三,学术复合型人才缺乏。计算社会科学是信息科学和社会科学的交叉学科,现在明显缺乏具备跨学科思维与实践能力的研究人才。针对于此,需要信息技术界和社会科学界两者学术培养资源的有效整合,但由于学术队伍组织背景各异,学科认同传统不同,如何使信息科学学者和社会科学学者之间彼此配合,共同培养跨学科的学术复合型人才,也是亟待探索的问题。另外,国内的教育培养体系里文理科之间区隔非常明显,学生偏科现象严重,计算社会科学人才的成功培养也将遇到国内教育培养体制沉疴的阻碍。

计算社会科学为社会科学基础研究提供了新的发展契机,同时还可为社会、经济、安全等重要应用领域提供决策支撑。作为一门新兴交叉学科,计算社会科学的发展需要信息科学和社会科学领域学者之间更为密切的联系与交流。本文作者在此吁请广大社会科学学者,尤其是社会心理学者,积极与信息科学家展开合作,贡献自身专业知识,主动投身于已然到来的计算社会科学研究大潮之中。

推荐访问: 社会科学 机遇 科学 计算 信息