你在这里

美国电影网站是怎么给电影评分的?

最近几天,中文互联网上最专业的影评网站‌‌“豆瓣电影‌‌”成为了电影界激烈讨论的对象。一篇来自广电总局官办的《中国电影报》的文章,称豆瓣电影以及其他社交平台上‌‌“个别大V、公众号为博眼球、圈粉丝、流量变现等目的,发布恶意的、不负责任的言论,严重破坏了中国电影的生态环境。‌‌”

这件事还真是挺有点活久见的。在美国,如果有这样的批评来自无论民间还是官方,那简直是要笑掉大牙了——从来没听说过一两篇影评,一两家网站就能糟蹋了一国电影生态环境的。如果真有,这国的电影生态环境是有多脆弱呀。

在美国,也有这么几个和豆瓣类似,跟电影有关,主流网民经常访问的网站:专业存储电影信息兼职打分的IMDb(Internet Movie Database 互联网电影数据库)、创立快二十年几经易手的烂番茄(Rotten Tomatoes)、专业网络购票副业打分的‌‌“美国版猫眼‌‌”Fandango,以及专门聚合书籍和视听出版产品批评意见的Metacritic。

随着互联网和社交网站的快速普及,这几个网站也形成了独特的电影打分机制,虽然各不相同,但还都挺受电影市场片方、观众和专业批评人士的信任。这也让它们在国内甚至国际上成为了具有公信力的电影评分网站。

它们是怎样工作的呢?
 


IMDb

现在市面上有一个比较流行的IMDb 加权分计算公式,大概长这个样子:

imdb-rank

v =投票人数,实际上是经常投票的人数,也即IMDb 活跃用户投票数

m =进入IMDb Top 250 榜单所需的最小票数

R =该电影的平均分(分数相加除以人数)

C =IMDb 数据库所有电影的平均分

这是一个在统计学上公认比较科学的贝叶斯算法实例。但需要明确的是,这个公式只是IMDb 维护Top 250 电影榜单所使用的,并不是每一部新电影打分都采用这个方法。

平常,IMDb 的用户可以用1-10 颗星来为一部电影打分,最后IMDb 会计算出一个加权平均星数作为得分。用最近上映的星战外传电影《侠盗一号》举例,在IMDb 上的得分是8.2。目前《侠盗一号》在Top 250 榜单里排名205,也就是说我们可以确定它的得分是用上面那个公式计算得到得了。

rogue-one-imdb

但是,为了维护评分的公正,这个日常评分的计算公式仍然是个不能公开的秘密——可知的是,结果依然是加权分,采用了算术平均数(Arithmetic mean)的计算方法,但由于算数平均数容易受到极端数据的影响,IMDb 也设计了一些过滤机制。

rogue-one-arithmetic-mean-imdb

很明显,IMDb 得分是一个普通观众打分的结果。就像美国总统大选有全民投票(popular vote)和选举人票(electoral vote)一样,IMDb 在全面和公正的同时,也想要追求专业,体现一下电影人的意见。于是在上图的‌‌“Ratings‌‌”后面,还有一个百分制的‌‌“Metascore‌‌”。

这第二个得分又是怎么来的呢?这就要提到Metascore 的来源Metacritic 了。

Metacritic

Metacritic 是一个出版物专业批评聚合网站,成立于1999 年。最早从书评起家,现在的Metacritic 的批评对象已经涵盖了音乐专辑、电影、电视剧、电子游戏等视听出版物。注意,重点在于‌‌“专业‌‌”二字。

要体现专业,首先,Metacritic 为电影打出的Metascore 是从主流媒体和专业影评机构的影评人那里聚合而来的,这是它和IMDb 评分最主要的不同。这些影评人和他们供职的机构,大多在影评方面具有公信力,比如《卫报》、《纽约时报》、《滚石》、《好莱坞记者》,《时代周刊》和NPR 等这样的大报和电台,都是能参与Metascore 计算的专业影评来源。

但不是每个机构和影评人都会自己给出一个准确的分数。实际上Metacritic 是这样做的:来源有分数就用来源分数;来源有星数就大概换算成百分制的分数;如果来源的影评只有文字没有评分,他们就自己找人去阅读影评,然后根据读完的感受自己给一个分,然后再用这个分拿去计算……

metascore-breakdown-rogue-one

虽然这样计算出的Metascore,看上去不是特别能够准确和真实地体现批评家的感受,但至少这十几年过来Metacritic 没怎么被质疑过。尽管如此,Metacritic 在Metascore 之外也还是设立了一个Userscore——不会展现在一部电影的页面上,但用户投票的工具会直接放在Metascore 的下方,给用户一种投了票就能影响得分的错觉(详见下图)。

Metascore 采用百分制,Userscore 打分采用十分制。还是用《侠盗一号》举例,现在的Metascore 是65,整合了51 个专业来源;Userscore 是7.7,基于1489 个用户打分。

metacritic-rogue-one

烂番茄

烂番茄创立于1998 年,一直致力于提供具有公信力的电影打分。其创始人帕特里克·李曾经在Pingwest品玩的SYNC 2016 科技大会上介绍过烂番茄的极盛时的风光和设立的机制。这么来看,烂番茄也算是影评界的不老松。

烂番茄没有评分!必须明确烂番茄采用的评价系统叫做Tomatometer,一般翻译成‌‌“新鲜度‌‌”。一部电影的新鲜度,同样是由专业的影评意见所决定的。在烂番茄上影评人不打分,也不给星,只能给出Fresh(一个新鲜番茄)和Rotten(一个烂番茄)两种标记,分别代表推荐和不推荐。

tomatometer

如果超过60%的影评人推荐一部电影,电影的新鲜度就会整体为Fresh,旁边有一个百分比显示新鲜度,也即具体多大比例的影评人推荐;如果超过75%的影评人推荐,像《侠盗一号》一样,新鲜度就会变成‌‌“Certified Fresh‌‌”;但如果给Fresh 的影评人低于60%,电影就只能得到那一坨绿色的烂番茄了。

和Metacritic 一样,烂番茄也需要确保用户的意见能够得到体现,于是又设定了一个Audience Score(观众分数)。这个观众分数采集来源是观众打星,但最后体现出来的所有打出3 星半以上的用户比例。

rotten-rogue-one

用打好评的影评人/用户占总影评人/用户人数的比例,而不是一个简单的数值来评价一部电影,是烂番茄和其他影评网站在本质上的最大区别。它突出的是人群对一部电影持有的主流观点,而不是用一个无法让每个评价者都感同身受的数值。

这个设定让烂番茄获得了相当高的信誉,但也不是所有粉丝都能接受的了。比如今年的美国大厂烂片代表作《自杀小队》的粉丝,就被糊了一脸只有26%新鲜度的烂番茄。结果这些粉丝以烂番茄敌视DC 扩展宇宙电影的罪名,在网上发起集体签名,要求烂番茄关站谢罪……

Fandango

2000 年成立的Fandango(原名Tickemaker),可以被理解为美国版猫眼。它慢慢统一了美国混乱的网络票务市场,现在最主要的功能就是网上买电影票,查座位情况,以及查看影评等等。

Fandango 对粉丝、用户的地位和意见非常重视,在影评机制上得到了体现。Fandango 的电影评价完全采用粉丝打分作为依据。在该网站上,超过17000 名粉丝给《侠盗一号》打出了4 星半的评价。

metascore-breakdown-rogue-one

Fandango 的评分计算方式看上去并不复杂,应该没有什么加权和过滤机制。这也导致了该网站上3 星以下电影的数量比烂番茄、Metacritic 和IMDb 要少得多。幸好Fandango 加上了比较专业和严苛的烂番茄新鲜度,以及专业的家庭电影评价机构意见(上图右上角),来中和什么烂片都能咽得下去的粉丝打分。比如星爵克里斯·普拉特和大表姐珍妮佛·劳伦斯主演的《太空旅客》,粉丝打了4 分,却得到了一颗只有31%新鲜度的烂番茄,也被负责任的专业机构标注了‌‌“露骨的性爱场景‌‌”、‌‌“过量的饮酒场景‌‌”、‌‌“令人恐惧的溺水场面‌‌”,可能不适宜儿童观看……
 


所以你看,资深人士从电影的艺术和学术的角度进行的专业批判,和普通观众以获得的感官愉悦和心理满足程度给出的打分,就是这样在互联网上和平共处的。

幸运的是,美国商业电影市场经过了一百年的发展已经格外成熟,无论是创作、制作、院线、影评还是周边开发,都已经走在一条相当专业化的道路上,不太可能像这几天的中国电影界一样,发生如此严重的争吵。在美国,佳片会收到它应得的票房和好评作为奖赏,烂片就算进了电影院也不可能躲得开差评——无论在报纸、电台还是互联网上。在美国,对电影的批评,也是言论自由保护的一部分。

若差评不自由,则高分无意义。连中国前总理周恩来都《在文艺工作座谈会和故事片创作会议上的讲话》里说过,‌‌“人民喜闻乐见,你不喜欢,你算老几?‌‌”

 

关键词: 
栏目: 

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer