2020-04-10

情绪栖息地(2)

爱好美剧的朋友们肯定对以下的警告十分熟悉:“ 你有权保持沉默,但你所说的每一句话都可以在法庭上作为指控你的不利证据...”。一般影片中警察一边给嫌疑人上手铐,一边要喋喋不休的在耳边宣布这条“米兰达警告(Miranda Warning)”。美国的宪法(和大多数海洋法系)给予犯罪嫌疑人“不被强迫自证其罪的权利”。

在读一些大数据论文的时候,常常就莫名想起这条警告。因为在论文的讨论部分,甚至在介绍部分,许多作者就防御性地写到:“我们承认我们采用的海量(车迹/手机/移动/刷卡/照片/twitter...)数据存在一定的大数据固有偏性,但由于数据量巨大,还是很有现实代表性。退一步讲,我们的仅仅对我们的数据负责,但同时结论给真实世界问题提供了重要的参考”。这其实就是在说,“审稿人女士/先生,你我都知道你如果问起大数据的偏性,我后面所有的结论都会打个问号。这让我们彼此都尴尬,这明明是大数据的原罪,这个问题上你可不能让我自证其罪”。于是,自己先来一条 “米兰达辩护”。

在我们的情绪研究中,这个大数据偏性的问题,是个很突出的问题。现实中温文尔雅的人,在网络中可能是憋着一股邪火;现实中横冲直撞的人,网络中可能爱细嗅蔷薇... 更可怕的是,在情绪的表达上,这似乎不是一个可以互相抵消的随机误差,而是系统性的偏性:你看那些美女自拍,多是一张张明媚的笑脸,或真或假的秋波电眼... 男人们更愿意从斜下方向上自拍,显得伟岸冷酷;大多数女子们更喜欢从上向下自拍,显得温柔娇小... (来符合男权社会对其的幻想,我实在忍不住加上这一句。)我们想要从各种带有地理标记的照片中提取人们的面部表情,分析其情绪,然后如果一个区域的情绪存在共性,那末这种共性就成为这个区域,或曰场所的情绪特征。如果大家都在不同的地方假笑... 那么我们得到的岂不是也只是一堆虚假的情绪嘛!这研究还怎么做嘛!

在之前的文章中,“米兰达辩护词”我也写过——“既然人们在哪儿都假笑,反正我关心的是情绪在空间上的模式,那些假笑只会让全人类都显得更欢乐一些,并不会干扰我们的研究结论,所以——走自己的路,让别人笑去吧!”。 但——搞不清楚是谁在假笑?笑得又有多假?让我们路走得心里发毛。于是我们开始了一个有趣的验证性研究。

我们划定了一个时间和空间范围为例,或者说定义了一个场所——武汉大学的一个校园,然后在一定时间内,同步在线上和线下监测关于这个校园的所有情绪信息。在线上,我们24小时监听微博平台上传的带有地理位置的照片。只要照片是在我们圈定的校园里拍摄的,马上爬下来看看有没有人物。一旦有人,那先看有没有清晰的人脸,一旦有脸,马上分析情绪:

多么甜蜜的一对儿
然后我们马上删除原始照片,保留这些情绪数据(We do privacy right!), 存进数据库作为这个场所的线上情绪数据。这是比较无趣的一部分。

有趣的另一部分是,我们在校园里设置了一堆摄像头,遍及公共道路和绿化带各处,为了采集这个场所的“线下情绪”。插入声明,摄像头的安装通过了学校保卫处的审查,拍摄到的所有照片立刻在计算成情绪数据后永久删除(Your privacy is finger licking safe!)。然后在一段时间后,线上线下采集同步停止,开始进行比较。

果然,线上线下收集照片里的人口学特征都不同。线下是男多女六四开;线上照片里是女性多多了。也是,一般的大老爷们有什么好看的,就算一男一女出去,也是男给女的照相的多。线下场所成人占多数,而线上年龄要明显年轻化。再比二者的情绪差异——除了人们在线上故意夸张了开心的情绪,人们在线上有意展示的自己或别人,都或多或少隐藏了其他的情绪:伤心,厌恶,愤怒,惊讶和恐惧。
smiles sold online (在线卖笑)
你看看,社交行为也塑造了我们的情绪展示行为。除了社交性开心以外,其他几种情绪似乎对社交起不到积极作用,因此受到了抑制。其中愤怒情绪受到了最多的抑制。但在线下数据中,由于不知道身边摄像头的存在,人们还是会或多或少展示出其他的情绪。这也基本在我们的预料之中。但其实我们最想问的是,究竟是男是女,是老是少,在真实和虚拟世界中,表达情绪的差异最大?

没有评论:

发表评论