互联网评分机制是如何运转的?基于豆瓣、亚马逊、大众点评的深度观察!

在具体分析每个领域代表的评分机制之前,我们可以先从宏观的视角,做一个整体思考,将历史的画卷展开,引起我们注意的,有这些内容:


本应岁月静好的评分交流舆论场,却沦为了各方关乎商业价值的角斗场!互联网评分机制的明天该何去何从?




1
《风起洛阳》评分风波


《风起洛阳》最近不少人在追吧。但你可能不知道,最近跟它一块上热搜的,还有豆瓣的评分机制。


事情的经过,大概是这样的:原定12月1日晚上八点,在爱奇艺开播的《风起洛阳》,因技术原因推迟了将近一个小时。(当时很多人以为自己被平台放鸽子了,有木有你~)但神奇的事情发生了,剧还未播,但评分浪潮已至,而且大多数都是齐刷刷的“一星好评”!



注意:这个34分钟前和30分钟前,是《风起洛阳》正式播出的时间之前,也就是大概当天晚上八点半左右,再强调一遍,剧是九点左右才正式开播~


无独有偶,《斛珠夫人》刚一上线,豆瓣词条下就出现了不少关于剧集的点评,其中还有仅播出几分钟就完成了被安利、看剧、写评论一系列动作的内容;“赵丽颖演技拉垮”等吐槽声出现在《谁是凶手》首播的一些评论中,但首播两集赵丽颖并未出场……


看到这里,我不禁心生感慨:这些个有着“未卜先知”能力的人们,把这个能力用在其他地方他不香么,比如预测一下哪只股票会涨。


近期的种种事件,加上这延迟播出一小时的导火索,刚好将“互联网评分机制”呈现在了大众的聚光灯下,更是将水军、控评、粉黑大战这些顽疾,推向了风口浪尖!


结果就造成了,豆瓣最近的“不太平”:部分娱乐小组被关停解散;小组回复功能暂停;出现在工信部发出的关于下架侵害用户权益APP名单的通报中;因水军控评、未看先评而被央视批评;豆瓣电影回应剧集疑似遭遇水军控评......


本应岁月静好的评分交流舆论场,却沦为了各方关乎商业价值的角斗场,这一局面究竟是如何形成的?而评分机制的明天又该何去何从?


今天,我们就选取了“评分机制”三个常见领域的典型代表来深刻剖析一下其中的真相,这“三个代表”分别是文艺领域的豆瓣实体电商领域的亚马逊以及生活服务领域的大众点评




2
宏观思考


在具体分析每个领域代表的评分机制之前,我们可以先从宏观的视角,做一个整体思考,将历史的画卷展开,引起我们注意的,有这些内容:


1. 用户底层需求


评价体系诞生之初,就是作为用户消费意愿的参考依据,为用户降低决策成本。越高的评价,在无形当中也就帮助了消费者进行了决策,产生了更多的消费,反之亦然。


但随着时间的推移,评价体系逐渐增加了社区属性,大家来此的目标,不仅仅是为了评价好坏,而是为了交流宣泄自己的情感,无论是喜欢还是厌恶,总能找到一些共鸣者跟帖、回复。


2. 衍生问题

(1)虚假评分问题


既然,评价体系是能够直接或者间接跟消费挂钩的,那么也就有不少人盯上了这条“灰色产业链”,刻意刷分的现象层出不穷,严重干扰了消费者进行决策。如何解决这个问题,俨然成为了各大平台的一块“心病”。


(2)个人情感问题


有时候想想,评分机制构建起来的难度也是非常之大的,因为其评分结果往往会因为个人经历、经济文化差异、政治理念差异这些因素而各不相同。


怎么解决个性和共性的占比问题,每个平台也必须重视。带着这些思考,我们来具体剖析一下这三个领域的代表!




3
文艺领域:豆瓣


文艺领域的豆瓣,可以说是所有平台当中,社区属性最重的,为了解决个人情感问题,豆瓣采取的基本原则为:尽力还原普通大众的平均看法!


其具体的评分逻辑为:把豆瓣用户的打分(一到五星换算为零到十分)加起来,再除以用户数,就得到了豆瓣评分。


因此,豆瓣的评分机制,被称为“大众评审团机制”,或者认为“一人一票”。这个分数完全来自程序的计算,中间没有编辑审核,每过若干分钟,程序会自动重跑一遍,记入最新打分人的意见计算分数,豆瓣评分计算到小数点后一位。


但这种尽力“照顾”个人情感的评分逻辑,也刚好为虚假评分问题创造了生根发芽的土壤。


那豆瓣是如何应对这方面问题的呢?豆瓣为此建立了一种防御机制,叫做剔除“非正常打分”,有程序专门识别“非正常打分”,在算分的时候剔除不正常评分。


根据豆瓣内部员工的叙述,“非正常评分”大致有四类:注册/收购帐号刷高分的,注册/收购帐号刷低分的,明星粉丝团“进攻豆瓣”的,铁杆用户“捍卫豆瓣评分公正”反水行动的。


对于与影片无关和人身攻击内容的判定,豆瓣采用算法+人工的方式筛选。具体被定义为与影片无关和人身攻击并未详细解释,不过针对人身攻击豆瓣方面举了一个例子,“如果用户评论“恶心”是没问题的,但是评论“xxx恶心”则会被判定为人身攻击。”


豆瓣为了照顾“个人情感”,其算法并没有特别严厉,而人工的方式,难免耗费人力物力,而且难免存在纰漏,也正是豆瓣评分的这种底层逻辑,才造成了我们前面所提到的,豆瓣最近的“不太平”。

我们再来看一下豆瓣评分机制的具体展现形式,主要分为短评区和无需评分的讨论区。



豆瓣短评的显示机制,首先会在首页依据算法显示5条热门短评,并且热门短评具有随机性,每次打开都会调整短评顺序,用户能够看到不一样的热门短评内容。


然后进入短评列表当中,也不会显示全部短评,网页端基本上只显示5页,app端约显示300条到达底部。整体来看,短评区仅展示部分短评,由算法根据时间、热度等因素筛选,并随机展示。


影片上映之前的、与影片无关的或包含人身攻击等内容的短评将被折叠,且其评分不计入豆瓣评分。从产品体验的视角来看豆瓣也在尽力保护用户减少骚扰。


小结:豆瓣充分照顾了个人情感问题,但其评分逻辑的根基,也注定了其之后所做的应对虚假评分问题的方案,都成了治标不治本的水中望月、镜里看花一般的存在。




4
电商领域:亚马逊


作为电商平台,亚马逊的评价体系,则少了很多个人情感问题方面的枷锁和束缚,更加专注于展示真实的评价结果。


其评分逻辑相比于豆瓣,则显示更加缜密:初步看去,我们会发现,亚马逊的评分逻辑好像和豆瓣一样,都是将所有评分相加,然后再取平均值,但实则不然,亚马逊的平均值,是经过处理后的加权平均值~


其“加权”,主要包含以下三个方面:


1. 已买单用户的评论权重大于未买单用户的评论权重;

2. 评论存在时间长的权重大于留存时间短的权重;

3. 评论内容丰富详实的权重大于内容简略的权重。


可以看出,亚马逊是在评论质量内容考核方面下了功夫,这个也贴切亚马逊的社区运营的初衷,为消费者打造一个高质量的站内review,QA社区,引领未消费做出正确的消费抉择。


那亚马逊是怎么应对虚假评分问题的呢?


亚马逊对所有买家评论违规行为都实行零容忍政策。如果被发现卖家有任何试图操控买家评论的行为,亚马逊会立即采取措施,包括但不限于:


● 立即永久撤销卖家在亚马逊上的销售权限,包括扣留资金。

● 移除商品的所有评论,并且阻止商品日后收到评论或评级。

● 从亚马逊永久下架商品。

● 对卖家采取法律行动,包括诉讼和移交民事和刑事执法机构。

● 公开披露卖家的名称和其他相关信息。


并且,亚马逊的评价门槛,也是相当之高:必须在过去12个月内用有效的信用卡或借记卡在亚马逊上消费至少50美元,促销折扣不符合最低50美元的条件。那亚马逊评分机制的展现形式是怎样的呢?我们可以看下图:




在商品详情页,顾客会看到三种商品评论:


1. 没有文字的星级打分;

2. 带有星级打分和文字(及图片)的买家商品评论;

3. 显示有Vine Voice的高质量Vine评论。


只有参加了AmazonVine计划的商品才会有Vine评论,且每个商品最多可获得30个Vine评论。


小结:亚马逊以近乎苛刻的准则,最大程度上打压了虚假评分问题的出现,但同时也降低了用户主动评论的热情和积极性。




5
生活服务领域:大众点评


生活服务领域更加的包罗万象,不仅有琳琅满目的各种类目,而且共性和个性的问题也是相当突出,评价机制的构建难度,也是相当之大。但从名称我们就可以看出,大众点评就是一个基于评价体系而生的平台!


大众点评秉持的原则为:鼓励真实有帮助的评价!这句话可以从两方面进行解读,一方面是鼓励用户进行评价,另一方面呈现给用户的,都是真实有帮助的评价。


从大众点评的评分逻辑上,我们可以找到解读的依据:首先在评价结果当中,最直观,对用户影响最大的就是星级评分,大众点评的星级计算逻辑是一个全面且更能够反应事实的逻辑。


总体来说,大众点评的星级评分并不是简单的算术平均,而是众多用户的“总体评价”,结果根据数据模型自动评定而出,没有任何的人工干预,采用5分制,并且星级每天会根据商户4天前新增的评价更新计算。


全面性体现在,星级评分计算,包含了以下四方面的因素:


(1)诚信度:体验后的真实评价才会纳入计算;

(2)时间:近期新提交的评价更重要;

(3)质量:评价包含更多真实有用的信息更具有参考性;

(4)数量:其他因素相同,评价数相对更多的商户更有机会获得高星。


至于说该逻辑更能够反应事实,主要基于大众点评年初对于规则的优化:2月3日起,大众点评对平台星级计算规则作出调整,规定评价数量达10条后才会计算星级,评价是个位数的商户,直接被评为五星或一星的情况,从此不会有了。


而精选评价本身,也有严格的条件:


(1)通过审核,平台会对每条评价进行审核,评价发布时间的次日24点前可审核完成,广告、灌水、重复、违规、虚假等内容无法通过审核;并且不定期对精选评级进行回扫审核,不符合要求的则会取消展示;


(2)评价字数不少于15字,能够有效传递消费体验。


虽然大众点评的评价机制已经足够完善,但虚假评分的问题,则是会永远伴随着平台而存在的,大众点评又是怎样应对此问题的呢?
我们可以从前期的预防和后期的处置来进行剖析。


前期预防:

大众点评根据不同的评价场景,定期迭代和优化算法,结合人工审核监督,保障平台上展示的评价能够反映用户真实体验后的感受。借助风控系统,识别和过滤评价内容,只有通过过滤机制的评价,才会在精选评价页面展示。


后期处置:

自2019年3月开始,大众点评在社区对每月违规用户商户、违规行为、处罚方式和对应的规则进行公示,积极开展一系列用户宣传教育工作,传递正面的评价价值导向。


根据《商户评价诚信管理办法》,对违规刷评价的商户进行“星级隐藏”、“排序降权”、“商户页公示”等。违规用户也会涉及“等级降级”、“撤销VIP”、“禁发评价、笔记、图片、视频等内容”等多项处理措施。


此外,大众点评主动配合执法机关打击刷单炒信黑灰产团伙。2021年1-5月,大众点评处罚“刷好评”用户账号5万个,处罚“刷单”“刷评”商户1万余家,协同执法机关打击29个非法刷单网络灰黑产团伙。说了这么多理论的东西,我们也来看一下大众点评的展现形式吧:



首先星级评分,能够支撑让我们进行初步决策;然后精选评价,能够让我们对于该内容有一个相对真实且详细的了解;最后可以查看全部评价,让我们对内容有一个全面的认知。


小结:正如生活服务领域的包罗万象一样,大众点评的评价体系也是包罗万象,不仅在内容输入侧,对所有用户持开放态度,更是在内容展示侧,尽可能地展示真实有用的内容!




6
结语


网信办近年来陆续出台了《网络信息内容生态治理规定》《互联网用户公众账号信息服务管理规定》《互联网跟帖评论服务管理规定》等规定,对网络“水军”的刷帖控评行为都有较为细化的规制。


从这些政策导向可以看出,互联网的评价体系,一定要建立在“真实、有帮助”的内容生态基础之上。


相比于豆瓣的“宽容”和亚马逊的“苛刻”,大众点评则显得更加“中和”,在照顾了个人情感的基础之上,还最大程度地为用户展示有用的内容,减少用户的决策成本,该评价体系,值得其他平台好好借鉴一下~




文章来源:作者:啊庄。公众号:晓庄同学产品笔记。

图片来源:部分图片来源网络,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。文章为作者独立观点,不代表135编辑器立场。

文章评价
登录后可以评论
立即登录
分享到