2022年,埃隆·马斯克与Twitter的收购大戏,一度成为互联网行业最热门的话题。5月14日,马斯克曾宣布暂时搁置交易,因为他想进一步了解Twitter存在的垃圾邮件和虚假账号问题。在6月初获得了一些数据后,马斯克的团队又在6月下旬要求Twitter提供更多数据以完成对平台内机器人账号情况的评估。
不少评论认为这是一种压价的手段,但马斯克指出的问题,确实是长期萦绕在Twitter平台的一片阴影。而这次收购也将“社交媒体机器人”(social media bot)再度引向人们的视野。
社交媒体bot是个常言常新的话题。自诞生以来,它的角色与功能一直在延展和演变,人们对它的态度也从一味的排斥,到将其纳入正常的网络账号讨论范围中,呈现出复杂化趋势。
那么,到底什么是社交媒体bot?本期全媒派(ID:quanmeipai)将回顾社交媒体bot的发展,讨论它们的出现对当下社交媒体生态产生了哪些影响?
图片来源:视觉中国
撰文 | 王焕超
编辑 | 石迪
从“模仿游戏”到“泡沫制造机”
1950年,计算机科学家艾伦·图灵发表《计算机与智能》一文,这篇人工智能领域的奠基之作,讨论了机器的对话水平测试问题。
图灵用“模仿游戏”这个词,定义了一种测试机器“智能程度”的实验:由人类作为裁判,他把问题输入计算机,并由计算机和另一个人类做出回答,而裁判必须确定哪一个回答是人类的。这就是著名的图灵测试。
自图灵测试提出以来,能够模仿人类行为就成为计算机程序开发的关键目标。在这样的目标驱动下,最早一批聊天机器人被制造出来,它们依托于数据库,并基于文本或语音与人类进行对话。
20世纪60年代被推出的ELIZA,是世界上最早的聊天机器人,它使用简单的基于规则的系统,使用数据库中的预定义语句,能够根据人类所说的话来创建回答。
聊天机器人是社交媒体机器人的原型,前者为后者的出现探索了相对成熟的技术基础和运作原理。因此,随着21世纪社交媒体广泛兴起,社交媒体机器人(下文统一称“社交媒体bot”)马上开始现身并发挥作用。
从定义来说,社交媒体bot是指参与社交媒体互动的自动化程序,这些程序的行为部分自主或完全自主,通常会模仿正常用户的行为方式。
美国网络和基础设施分析办公室(OCIA)对社交媒体bot的定义是:“体量不同的程序,在功能、性能和设计等方面存在差异;通常应用于社交媒体平台,在模拟人类行为的同时执行各类有用或恶意的任务。这些程序使用人工智能、大数据分析和其他程序或数据库,来模仿合法用户发布内容。”[1]
对于社交媒体bot,学术领域很早就有所关注。比如Yazan Boshmaf等学者在2011年的研究,是最早阐释社交媒体bot的学术论文之一。
研究认为,社交媒体bot有这些特征:可以模仿人类行为,类似于聊天机器人;以“机器人网”的形式分组出现;背后由人类驱动、指挥;能够点赞或发送好友请求,或者通过转发现有内容,或在互联网上抓取预定义关键词并生成内容,进而在社交媒体上发布。[2]
除了关注社交媒体bot及其影响,还有一系列相关研究,关注从技术层面来加强对社交媒体bot账号的识别。
而从社会认知角度来看,更为关键节点是在2016年的美国总统选举和英国脱欧等事件中,社交媒体bot被媒体广泛报道,进而被大众熟知。
2016年11月,美国大选分出胜负。但根据美国当地媒体的报道,竞选双方的网上“支持者”中均有不少是机器人。根据统计,在2016年美国总统大选讨论中活跃的Twitter用户,有15%是机器人,至少有40万个机器人发布了380万条推文,约占总量19%[3]。
同年6月,英国举行了脱欧公投,在公投的推进过程中,社交媒体上爆发了激烈的讨论。英国《独立报》认为,社交媒体bot在脱欧公投中发挥了重要的战略作用[4]。
由于时空差异性,不管是当时的美国大选还是英国脱欧,都离现在的我们比较远。大部分人对社交媒体bot的切身感知,还是源于日常的社交媒体使用经验:那些随处可见的广告机器人、发布诡异内容的僵尸账号、关注列表里不知来源的关注者等等。
尽管社交媒体bot中也有许多正面用途的存在,但是它们中的大部分,通常是以负面形象走进网友视线的。
营造数据上的虚假繁荣
在社交媒体时代,粉丝数和互动数,常常被认为是影响力的象征,而影响力又与变现能力紧密挂钩。以Twitter为例,一个拥有十万粉丝的KOL一条推文的平均收入大致为2000美元,而拥有百万粉丝的KOL一条推文收入会赚到20000美元。
在这样的利益驱动下,社交媒体bot的主要作用之一,就是刷量,从而营造出一种虚假繁荣的状态。点赞、评论、转发、关注,凡是能用数据量化的,都是bot的用武之地。
《纽约时报》曾发布一篇题为The Follower Factory的深度报道,报道调查了僵尸粉贩卖公司Devumi。Devumi拥有20多万名客户,包括真人秀明星、职业运动员、喜剧演员、TED演讲者、牧师和模特。
大多数情况下,账号所有者会自己购买僵尸粉,除此之外,员工、经纪人、公关公司、家人或是朋友也会担任购买者角色,每个假账号仅需花费几分钱甚至更少。在短短几年内,Devumi至少向3.9万名客户出售了大约2亿个Twitter关注,获利超600万美元。[5]
通过影响舆论来影响重要事件
因为数量庞大且行动统一,社交媒体bot可以营造一种舆论假象,即一条信息或某种观点,无论真实性如何,都受到许多人的欢迎和认可。
借助这一点,社交媒体bot就能影响重要事件进程,例如金融市场,通过大规模发布捏造的公司正面或负面消息,从而影响股价。
助推非法广告宣传
大多数用户刷社交媒体时,应该都在评论区遇到过一些用色情图片为非法网站引流的广告机器人,这是社交媒体bot的另一个关键作用:发布非法广告。这些广告往往与博彩、色情等行业有关,并可能进一步引向钓鱼攻击和网络诈骗,无法通过正常广告渠道的审核,只能借助机器人的渠道来散播。
图片来源:视觉中国
随着社交媒体不断发展,社交媒体bot的比例也在急剧上升。2015年,亚利桑那州立大学的Morstatter和Carley等学者的研究认为,Twitter中至少有7%帐号是社交机器人。而2017年的另一项研究发现,多达4800万的Twitter账号是机器人,占总用户的15%。[6]
而此前Twitter高管在国会作证时表示,只有5%的Twitter账号是由机器人操作的。关于虚假账号的比例,也是马斯克和Twitter迟迟无法达成一致的原因之一。
当然,社交媒体bot不只是Twitter一家的特色,其他社交媒体的情况同样严重。2021年,一项研究统计,Instagram平台上只有55%的个人资料是拥有合法账号的真实人物[7]。2017年11月,根据Facebook向投资者透露,该平台上的虚假账号可能超过6000万。
bot有没有好坏之分?
社交媒体bot往往有这样一些特性:每天大量发布内容、头像通常是图案而非真实用户照片、关注数远高于被关注数、不切实际的回复速度、发布内容相同且重复等等。
初期,用户还能够根据这些特性来分辨哪些是bot,哪些是真人,但随着技术能力的提升,社交媒体bot的仿真程度越来越高,因而也带来更高的识别难度,普通用户往往没有这个辨别力。
显而易见的事实是,不管是内容生态还是用户体验方面,社交媒体bot都给社交媒体带来了许多负面影响,而且还容易产生法律风险。
出于这一点,打击社交媒体bot成为一场持久而艰难的战争。许多工作通常是平台本身做的,比如Twitter、Instagram、Facebook等,都曾借助大规模算法检测来识别机器人账号,并进行封禁,但为了避免被灰产利用,打击策略通常保密。
还有一些检测措施来自平台外部,比如美国印第安纳大学推出的Bostometer(前身为BotOrNot),就是最著名的机器人账号检测工具。这是一项公共网络服务,通过检查Twitter账号的行为活动,根据多项评判指标赋予该账号一个分数。
在此类检测中,“蜜罐账号”的方式常常会被使用,即发布明显的荒谬内容,吸引机器人账号转发,这样就能快速识别社交媒体bot。不过,由于社交媒体bot的进化迅速,检测方法必须不断更新,否则将很快失效。
当然,对于社交媒体bot,“技术中性论”的原则依然值得考虑:技术是中性的,决定它们如何使用的是背后的人。
尽管社交媒体bot往往与“假新闻”“仇恨言论”“刷量”“灌水”等负面词汇联系在一起,但是也不乏正面的例子,比如自动抓取、聚合来自各种来源内容的bot:Twitter上每日更新天气情况、或者发布简单新闻提要的机器人等等,它们随处可见,不乏关注者,并且已经成为社交媒体内容生态的重要组成部分。
为了让这类bot的功能更丰富,Twitter此前曾宣布将实现一定程度的自动化,以使其API可以被免费调用。现在,Twitter上的bot账户,已经能够提供报时、地震警告、股市新闻、火车延误信息等丰富的服务型资讯内容。
这样的bot账号在国内社交媒体也很常见,比如“冷知识bot”“老照片bot”这样的关注垂直话题的bot,又或者是“周杰伦_bot”这类同步明星偶像动态的机器人。
不过,相比起天气预告机器人,后面这些账号严格来说已经不算是社交媒体bot,背后多是由真人运营的,内容来源也非自动抓取,更多是粉丝投稿。
围绕着机器人账号本身的观察,也成为一道独特的景观。它们所发布的内容,大多基于数据库已有信息存储或是对平台现有内容的抓取,并通过进一步拼接合成而生成,但由于技术成熟度不高,这些内容多数逻辑混乱,并存在语序错乱、标题错用等问题。
然而,把这些经不起推敲的文字去语境化,有时能得到具有别样文字美感的“僵尸文学”。
此前全媒派的一篇文章对此有所讨论,并将僵尸文学划分为“僵味情诗”“僵生哲理”“心灵僵汤”“意识流”等几种类型。“在这种看似无序的文字碎片中,时而也会出现超现实趣味的‘意外之喜’”。
美国一家科技公司甚至推出了Twitter的“僵尸”克隆版社区:Botnet。在社区中,用户的账号是唯一的真实的社交账号,而其他用户是痴迷于夸赞用户的社交媒介bot。无论用户发布什么内容,都有数以万计的“僵尸账号”给用户点赞、评论。[8]
还有一种社交媒体bot类型,成为许多品牌和公司的宠儿,即具有查询和自动回复功能来进行客服服务的bot,它们可以提供快速响应和全天候在线服务,来满足消费者的需求。
总而言之,尽管社交媒体bot因为负面的使用方式而被关注,但它们也有相对正面的用途。技术是中性的,如何使用,要看背后的人。
人和bot共存,是必然吗?
社交媒体时代,也是一个万事万物都可以被数据化的时代。一个人的影响力和知名度可被量化,与关注者等数字紧密挂钩;而影响力又代表着各种变现能力:带货、接广告、做代言……
当原来越多的人意识到“数据-影响力-变现”链条的存在时,社交媒体bot及其背后的整个行业就涌现而出。
假粉丝、假点赞和自动评论,催生出耀眼的、巨大的虚假泡沫。品牌方为动辄百万计的关注数字,支付了高额刊例价和大量代言费,但却很少接触到对应数量的目标受众。一项由CBS News报道的数据显示,2019年全年,企业因“影响力欺诈”预计损失至少达13亿美元[9]。
受害者不仅仅只有企业,如前文所说,社交媒体bot还会被用于操纵舆论,也是电信欺诈等非法活动的主要宣传手段,所以受害者可能是我们每一个人。
即便负面影响如此之大,但是社交媒体bot却迟迟未能清除,反而愈发猖獗,除了巨大的利益诱惑之外,其实还涉及相当复杂的原因,平台层面的犹豫不决就是其一。
近几年,许多社交媒体平台采取了更加严格地打击机器人账号的措施,问题是,不管是更严格的注册门槛,还是大规模的算法打击,都有误伤真实用户的可能性。
同时,社交媒体往往要以数据的增长与否作为衡量平台发展的依据,如用户数、日常互动数、点击数等,而这些数字也是广告主付出广告费的理由所在。
而社交媒体bot恰恰能提供这些方面的虚假繁荣,换句话说,社交媒体bot营造出的数据,不仅是渴望虚假影响力的“大V”们所追求的,一定程度上也是社交媒体平台自身所需要的。
图片来源:视觉中国
所以,尽管机器人账号的存在会持续伤害社交媒体的生态,但打击它们却需要平台自身极大的决心和长期主义精神,显然并非所有平台都是长期主义的信奉者。
2016年,Incapsula的一项研究得出结论:世界上一半以上的互联网流量是由机器人产生的。这些机器人中有近30%被确定为“坏机器人”[10]。
社交媒体bot存在的更深层原因,就是对数据的推崇。启蒙运动以来,科学与理性成为一种新的“拜物教”,步入现代社会,量化和数据成为了这一“拜物教”所追求的新锚点。
我们陷入到一种对于数字的狂热追求之中,而社交媒体bot的存在,正是能够维持这种狂热的人为动力之一。只要对于数据的推崇始终存在,社交媒体bot或许永远都不会消失。
社交媒体bot亦是一种隐喻。它是技术蔓延到各个领域的结果之一,先是生产与生活,是大机器、手机、汽车、飞机,我们已习以为常,并习惯享受技术所创造的便利,而现在到了思想与交流领域,我们才开始觉得这可能是一个问题。
随着技术进一步发展与应用,我们可能也会觉得,与社交媒体bot共处是一件再正常不过的事情。
在The Rise of Social Bots这篇论文结尾处,作者Ferrara这样预测:在社交媒体的未来,机器与机器的互动会是常态的方向,人类将在一个主要由机器人组成的世界中航行[11]。现在这种趋势其实在逐渐显现,很大程度上,如何分辨正常用户与机器人,然后继续自己的网络冲浪之旅,已经成为当下社交媒体用户的必备能力。
或许有一天,不止是社交媒体,现实世界也成为了一半由bot、另一半由真实人类构成的虚实交织的世界,那现在的社交媒体bot,或许是为我们提供了一种提前演练的机会吧。
【今日互动】
你在互联网上遇到过哪些社交媒体bot呢?对于它们的存在,你持什么样的态度?欢迎在评论区和我们交流~