豆瓣怎么评分 评分越来越高,是国剧崛起还是评分“通胀”?
2023年刚过去一个月,已出炉三部高分剧。根据统计,自2019年以来,每年的新剧均分都相较2019年之前有上涨。根据纵向对比与分析,豆瓣评分或出现“通货膨胀”现象。
有两个结构性原因:一是豆瓣用户群体发生改变,二是剧方与粉丝的宣发与刷分手段影响了整个评分环境。除了影响总体评分的因素外,豆瓣评分还受个别因素影响,如“鼓励分”“情绪分”,但这类影响暂时只会影响到特定作品。
值得注意的是这样的态度是否会让评分环境进一步恶化。2023年刚刚过去一个月,已经出炉了三部豆瓣高分国产电视剧《狂飙》(8.7)《去有风的地方》(8.4)和《三体》(8.1),其中,《狂飙》曾一路“狂飙”至9分(高光时刻甚至涨到9.1分)。
这一惊喜的开局让网友预测今年可能是国产电视剧大年,也有人担忧接下来国产剧的总体豆瓣评分会越来越高,含金量下降,市场走向虚假繁荣。
这样的担忧不无道理,几年前,7分已经算得上是还不错的口碑剧了;到了去年,8分剧成为好剧门槛;今年开年,好剧的标准直逼9分。让人不禁疑问:不断上升的评分,到底意味着国剧的提高,还是豆瓣评分的“通货膨胀”?
01 国剧崛起还是评分“通胀”?
豆瓣评分是不是“通货膨胀”了?这样的疑问在去年《梦华录》大热时就有讨论了。《梦华录》开播就有8.3分,并一度拿到8.8分。
毕竟豆瓣以往的高分古装剧都是这个水平:《甄嬛传》《大秦帝国之裂变》《大秦帝国之纵横》(9.3)《汉武大帝》《康熙王朝》(9.2),《大明宫词》(9.1)……无论是质感、编剧、演技还是时代意义上看,《梦华录》与这些剧都不是一个量级。
如果说这样的比较多少有点跨“赛道”,那么看看初代古偶、一代人心中的白月光《仙剑奇侠传》,在年代、情怀、口碑等多重加持下,也不过一部9.1分、一部8.9分。
好在经过时间的“冷却”,现在该评分已降低,但依然有8分。在过去的一年里,华语剧集在8分及以上的作品有22部,与8分接近的有8部。
以这样的评分标准来看,《狂飙》的接近9分,似乎非常合理。但是如果将时间再往前推,豆瓣的9分剧又是什么样呢?
可以看出,按照曾经豆瓣评分的标准,9分剧首先要求剧集自身素质高,无论是剧本、拍摄以及演员的演技都是比较优秀的;其次,曾经的9分剧集无论在纵向上对比还是横向上对比,都是能有一席之地的,也就是说,要么意味着经典或某一类型剧的天花板,要么意味着某一类型剧(甚至整个产业)的创新或突破。
《西游记》《红楼梦》这样的经典自不必说,拿更接地气的“9分喜剧”《武林外传》举例,它以武侠喜剧的题材开启了一种全新的情景喜剧形式,尤其是前30集,不仅随处充满笑点,细品之下又能看出哲理,还有着中国文化特有的“侠意”,至今难以找到能与之对标的作品。
稍晚一些的《甄嬛传》,时至今日仍是一部现象级电视剧,2011年开播至今每一年都热度依旧。因剧而起的网络梗也从未停过,2014年流行过甄嬛体,直到2022年,还连续几年有过网络“甄嬛学十级学者全国统一考试”。
△2020~2022“甄嬛学全国统一考试”也有三届了
随着时代更迭,“甄嬛学考题”也有了新形式。
这些都从侧面反映出《甄嬛传》的9分含金量。
过去的9分剧,哪怕不说常看常新,但至少也是能够经得起反复检验的。再回到前几日一度达到9.1分的《狂飙》,该剧无疑是一部较为优秀、值得一看的剧集,但跟昔日的9分剧相比还稍有距离。
《狂飙》以较为饱满的人物塑造与剧情呈现了一个老实本分的卖鱼贩如何一步步成为黑社会的“大佬”。剧中的扫黑督导组组长徐忠的一段话点出了这部剧实现的现实反思:
对“小人物”的描写在电视剧中并不少见,就近了说,去年的《开端》也涉及了几个小人物的艰辛与无奈。《狂飙》的张力与批判力在于,它涉及到了很多剧点到即止的地方,让这个小人物“成长”为一个黑社会大哥。以这样的角度去写一个“小人物”才能够实现对现实的结构性反思。
这样看来,《狂飙》的亮点是非常突出的,只是亮点不意味经典。在剧情和悬念上,《狂飙》的“爽感”其实大过了剧情本身,部分细节和逻辑难以经得起仔细推敲。
就连“好评”最多的人物塑造方面,细推之下也能看出稍显扁平的地方。如安欣这一角色是否过于理想化?腐败官员赵立冬、何黎明是否有些“简单”了?这些瑕疵,都让《狂飙》与“经典”之间产生距离。
如果说这样的比较过于“严苛”(毕竟《狂飙》最终跌下9分),与题材及年代差距没有那么大的《人民的名义》进行对比,或许更能看出《狂飙》分数中的“虚高部分”。
从播放量、话题热度、观众覆盖面以及综合口碑来看,《狂飙》与当年的《人民的名义》播出时的盛况是非常接近的,综合剧情的张力、完整性、故事的类型化以及人物塑造等多方面来看,两部剧的质量似乎也在伯仲之间。
但《人民的名义》豆瓣评分仅有8.3分。
△8.3分本来已算好剧的正常分数了,只是与《狂飙》的高分相比显得分差颇大
结合之前《梦华录》的8分以及2022年的22部8分剧集来看,可以说《狂飙》与《人民的名义》之间的分差,与其说《狂飙》评分“虚高”,不如说是豆瓣评分在近年或存在一定“通胀现象”。
据云合数据统计,2019年连续剧整体豆瓣平均分6.1,相比2018年的5.8分,上升了足足0.3分;2020年上新剧的豆瓣均分在6.2分左右;2021年上新剧的均分稍有回落,在6分左右;2022年上新剧豆瓣评分相较2021年整体有所提升,上新剧豆瓣均分6.2分。
考虑到2022年还出现了现象级“史低剧”《东八区的先生》,结合近几年新剧均分可以看出,自2019年以来的新剧,豆瓣评分整体略有上涨。
为什么会出现这样的现象?豆瓣评分还是否可靠?在连评分都“通胀”的时期,我们应该参考什么来选择影视剧?
02 环境是豆瓣评分“通胀”的结构性原因
首先来看看豆瓣评分采用了什么样的机制。
根据豆瓣的创始人、CEO阿北的文章《豆瓣电影评分八问》,豆瓣评分使用程序将每一部作品收到的评分由五星制转换为十分制,再相加求平均数。不论普通影迷还是明星粉丝,再或者是专业影评人,每个人在这个机制下都是一人一票。(在一些网络分析中,称豆瓣使用加权平均数,但是目前没在豆瓣官方的文章中看到这样的规则。)
这样的机制简单粗暴,却成为豆瓣评分相对客观的原因。因为,这样的机制为刷分等不良竞争手段的操作加大了难度。
了解了评分机制,可以看出在大部分情况下,豆瓣评分结果取决于作为观众的用户。
近年来的豆瓣评分通胀现象,有两个结构性的原因:其一是用户群体发生了变化,其二是影视剧的宣发手段与“刷分手段”提高。
在豆瓣最初成立之时,用户主要为部分电影爱好者,这部分观众的偏好更加“文艺”,一方面更偏爱艺术性强的作品,另一方面更容易从整个影视发展的角度去打分。到了2012年,豆瓣用户已超过1亿,阿北在2015年的文章中称此时的用户主要为一、二线城市的大众,只不过相较“看电视的大众”来说,此时的豆瓣用户更多是“看电影的大众”。
近年来,随着网络的进一步普及以及智能手机的普及,不难想象如今的用户群体已经进一步扩大。并且随着豆瓣娱乐小组增多,豆瓣用户开始变得更加多元化。其中,明星的粉丝也开始成为一个重要组成部分。也就说,现在的豆瓣用户又由之前的“看电影的大众”变成了“看电视的大众”,总体用户的偏好与标准也相应发生了改变。
剧方的宣发手段及刷分手段的提高也影响了评分。更广泛的宣传让更多的粉丝第一时间关注到影视开播情况,很多剧在开播之时的评分会高于后期评分,有一部分原因也是因为第一批观众往往本身就是导演/演员的粉丝,或者至少是喜欢该剧类型的受众,这一点不仅针对电视剧,电影方面也是如此。
至于刷分,前文提到,基于豆瓣评分的机制,刷分是有一定难度的,但不意味着完全无法实现。把刷分与宣传放在一起讲,是因为刷分也成了宣传的一个环节。
心理学上有一个概念叫“锚定效应”,概括地说是指在不确定情境下,判断与决策的结果或目标值向初始信息(锚)的方向过度接近而产生估计偏差的现象。
举一个不太严谨的例子来解释这一效应在评分中的体现:比如一部剧本身8分,如果我没看到它原本8分,可能我只会打7.6分;但是在我打分之前我看到它8分,跟我本身的感觉也不算差太多,那我可能也会给8分。换言之,已有分数会对未来打分者产生引导作用。
△《国际新闻界》(北大核心、CSSCI)的一篇论文中认为豆瓣电影评分中存在锚定效应
因此刷分也成为宣传手段的一部分。根据豆瓣评分的机制,在现有评分用户基数很大的情况下,人为干预、刷分对于最终评分的影响是较小的。但是如果在评分人数达到一定数量之前,先行影响评分,则能在一定程度上影响后来的观众的评分。
这样的手段成为豆瓣整体评分趋势上涨的结构性原因之一,是因为这不是个别现象。当有一个剧方选择这样的方式,其他剧方也会如此。并且,在剧方、粉丝方与豆瓣评分斗智斗勇的这些年里,宣传造势与刷分手段不断成熟。
△阿北文章中介绍的豆瓣的防刷分机制
豆瓣将能判断为非正常评分的打分一律剔除在评分计算之外,比如一些异常账号、全新账号,或者同一IP的多账号。专业的刷分团队就开始“养号”,拿自有账号打分,或者全网“收分”。
△刷分团队的手段
除了专业的刷分团队,为爱发电的粉丝群体也在不断提高刷分的能力。粉丝方本身就有一定基数,还会有粉丝科普如何评分、举报差评等。
2021年的《风起洛阳》、《谁是凶手》都受到过较大影响。
饭圈数据女工为了能在关键时刻为自己的偶像尽一份力,这些年来纷纷投身养号工程,甚至为了养号,让无关的领域受到影响。
△2020年曾出现过大批粉丝为了养号随机去其他文艺作品评论、打分的现象
虽然这种较为夸张的现象主要出现在流量明星参演的作品中,但对于其他影视作品评分依然具有影响。第一个原因如上文所说,一个片方为了给后期评分打下较好基础刷分,其他片方也不得不跟上。试想一下,假设两部剧都是7分水平,同时开播,一部不干预,另一部先浅刷到7.6分,你会去看哪一部呢?
另一个影响其他非流量明星参演剧集的原因在于,人们在打分时也会不自觉在心里和其他剧集进行比较,比如说,当我看到某部我认为“一般”的剧都有8分,那么当我在给同一时期的另一部“还可以”的剧打分时,很可能会给8分以上。
这样看来,虽然刷分无法颠覆一部剧的真实评分(因为随着评论人数上涨,每一个分母的增加都让“1”逐渐向“0”靠近),但是当这样的行为变成普遍的,成为环境,就对总体的评分情况产生了影响。
除了这两个结构性的原因让豆瓣评分总体“通胀”,还有一些个别原因会对豆瓣评分产生影响,但这些个别原因并不是造成评分“通胀”的原因,仅仅影响到部分剧集。
比如说情绪性打分。例如《梦华录》能拿到8分的高分,可以说是“苦烂剧久矣”的观众们在看到一部“还不错”的剧时激情打分。再比如,《仙剑奇侠传》在这几年间分数仍在上升,是因为每当一部古偶烂剧诞生就有人怀念一次《仙剑》。
△《梦华录》的高赞评论
更“激动”一点的情绪性打分,如在2021年“一星运动”的影响下,《人生果实》一度从9.3迅速降到8.7分。
而“手撕鬼子”的《抗日奇侠》,评分一度从3.4涨到6.7分。
但是这些现象不是常态,长期看来暂时不会对评分造成较大影响。只是这样的现象以后是否还会发生、是否会有其他乱象,届时豆瓣应该如何维护呢?这些问题,只能暂且交给时间。
03 结语
通过梳理分析,可以得出结论,豆瓣评分确实存在一定“通胀”现象,但是依然可以作为参考。例如,横向对比之下,依然能够看出同一时期哪一部剧更值得一看;开分靠“刷”才能高分的剧集,在评论人数上涨之后评分也会被“纠正”(甚至有过宣发与实际不符激起大众公愤最终遭更低评分的例子);如果再乐观一些,就连“鼓励性”高分,也许随着时间的推移,也会渐渐回落至纵向对比也依然合理的分数……
值得警惕与反思的是形成刷分环境的氛围,这样的环境就像“温水煮青蛙”,目前的总体“涨幅”也许还在未来的某一天能够得到纠正的范围内,但是如果这样的形式愈演愈烈呢?
如果连最简单的大众评分平均数也能被轻易控制,还有什么样的评分机制能够逃脱“刷分”呢?
最后,豆瓣评分本质上反应的是某一群体对一部作品的喜好程度,只是当这一群体基数够大、够多元时,反映的才是大众的喜好。也因此,评分高低也不能保证某一个个人是否会喜欢/厌恶这部作品。当我们追寻一个公正的评分时,我们追寻的不是一个审判,而仅仅是想要追寻一个能够让创作与欣赏干净、纯粹的栖息地。