请选择 进入手机版 | 继续访问电脑版

清华大学社会网络研究中心

 找回密码
 立即注册
搜索

新浪微博大数据研究

2011-12-21 15:39| 发布者: admin| 查看: 1480| 评论: 0

摘要: 新浪微博大数据研究 现有的研究议题包括: (1)社会焦点事件的公众情感倾向性分析 情感是人类认知研究中的核心问题,受到了国内外学术界的广泛关注。人们在社交网络空间中的行为直接反映了在真实世界中的活动和 ...

                                                    新浪微博大数据研究

    现有的研究议题包括:

   1社会焦点事件的公众情感倾向性分析

          情感是人类认知研究中的核心问题,受到了国内外学术界的广泛关注。人们在社交网络空间中的行为直接反映了在真实世界中的活动和情感。这促使情感作为传统意义上的主观心理学概念,在网络空间和人类社会中显现出一致性,成为影响人类个体、社会及网络社会活动的重要因素。

 面向社交网络数据的情感建模,其关键技术在于如何解决情感范畴与社交网络行为的有机融合。课题组利用网络关系分析用户情感。随着图像社交网络的流行,如FlickrInstagram,社交网络中的图像成为承载用户情感表达的重要载体。例如,人们习惯用鲜艳的颜色表达他们的喜悦之情,用昏暗的颜色表达他们的悲伤之情。统计数据显示,Flickr中超过38%的图像在分享时即被发布者打上了正向或负向的情感标签(Tags)。这些情感标签一方面说明图像是传载用户情感的重要媒体,另一方面也为我们借助图像研究社交网络中的情感计算提供了数据标注(Ground Truth)。我们以社交网络海量图像为研究对象,首先挖掘与情感认知相关的颜色、形状、构图等视觉特征,建立底层图像属性与高层情感语义之间的关联模型。然后提出混合高斯模型就视觉特征及隐含情感的关联关系进行建模。

    2面向事件分析的社会网络结构演化机理研究

 从社会影响力的角度探讨社会网络结构的演化机理。社会影响力是社会网络动态演化的基础因素。从心理学的角度研究社会影响力的建模方法,着重探讨个体从众心理度量、人与人之间的从众心理以及个体对群体的从众现象,分别给出度量模型。

    3)基于CGSS2008)的微博情感倾向抽样调查方法修正

 通过数据挖掘的方法收集民众在日常上网中发表的对于时事、政策的言论是了解舆情的有效途径之一。与传统的问卷调查相比,该方法拥有更快速、更真实、更及时、样本量更大等诸多优点。由于样本量巨大,用人力对网络言论进行甄别、分类往往是不现实的,于是研究者们发展出了各种方法利用计算机对网络言论中的语义进行识别。

 以微博为例,基于微博内容的语义分析可大致分为面向事实的文本挖掘与面向观点的文本挖掘两类。前者包括热点话题探测(杨亮、林原、林鸿飞,2012)、主题抽取、垃圾信息处理、自动摘要等几类,目的在于归纳微博内容的基本语音;而后者则是从用户发布的微博信息中挖掘出其讨论的主题与对该主题的情感偏好,发布者对于该话题的情绪是正面的还是负面的。本研究的主要目的在于找到更准确、方便的方式了解民众态度,因此主要关注面向观点的文本挖掘,即民众对于不同话题的情感偏好。

 中国综合社会调查是中国第一个全国性的综合、连续、大型社会调查项目。调查涵盖从2003年起的全国125个县(区),500个街道(乡、镇),1000个居(村)委会,10000户家庭中的个人。通过定期、系统的收集中国人与中国社会各方面的数据,总结社会变迁的长期趋势,探讨现实社会中的各项议题。目前,CGSS与互联网相结合的研究多为以CGSS数据为基础,探讨其他变量与网络行为之间的相互影响。如陈云松(2013)在研究中发现互联网的日常使用对于城市居民的非制度化政治参与有促进作用。在本研究中,我们将按照2008年(下同)CGSS数据中的若干人口学特征(如性别、年龄、教育程度等)比例来对微博用户数据进行筛选抽样,使筛选出的微博用户在这些特征的比例上与CGSS数据保持一致,再利用筛选出的用户的微博言论探究民众对于某一主题或政策的情感倾向。最后,我们会从CGSS问卷中挑选出较为类似的问题,以便对网络情感倾向进行校对,确定网络数据的判断是否准确。如果对于若干个话题,网络数据所得出的情感倾向与CGSS统计结果均较为一致,那么我们就找到了一种更为快捷的了解中国人与中国社会的方法。


鲜花

握手

雷人

路过

鸡蛋

相关分类

Archiver|手机版|清华大学社会网络研究中心 ( 京ICP备12018026号-1 京公网安备11010802011958 )

GMT+8, 2017-10-22 05:03 , Processed in 0.067110 second(s), 10 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部