- 积分
- 7627
- 在线时间
- 小时
- 基因片段
-
- 银行存款
-
- 注册时间
- 2009-5-28
- 最后登录
- 1970-1-1
签到天数: 180 天 连续签到: 1 天 [LV.7]常住居民III 
|
IMDB的评分方式

IMDb的评分包括两个分值,一个是算术平均值(arithmetic mean),一个是中值(median)。算术平均值大概就是平均数,中值是统计学中的中间数值,该值和比它大及比它小的数值是等差的。而最后我们查到的分数却既不是算术平均值,也不是中值。
IMDb的评分计算方法不是就做一下平均就ok了,在它的网页上也提到了它的计算方法是保密的。不过IMDb250佳影片用的是贝叶斯定理得出的加权分 (Weighted Rank-WR),公式如下:weighted rank (WR) = (v ÷ (v+m)) × R + (m÷ (v+m)) × C
其中:
R = average for the movie (mean) = (Rating) (是用普通的方法计算出的骄?郑?br>v =number of votes for the movie = (votes)(投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分)
此外,还有一个重点,根据这个注释:note: for this top 250, only votes from regular voters are considered.
只有'regular voters'的投票才会被计算在IMDB top250之内,这就是IMDb防御因为某种电影的fans拉票而影响top 250结果,把top250尽量限制在资深影迷投票范围内的主要方法。regularvoter的标准不详,估计至少是“投票电影超过xxx部以上”这样的水平,搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不行。
因此,细心的人可以注意到,列入IMDb top250的电影,其主页面上的分数与250列表中的分数是不同的。以魔戒1为例,它在自己的页面中的分数是8.8,而列表中是8.7。一般250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。这大概是因为regularvoter对于电影的要求通常较高的关系。)而IMDb的过人之处不仅仅在于这儿,它除了给出分数,还给了一个更详细的投票人的列表.
投票人的列表会根据年龄、性别、国别等不同的情况,列出了不同的分数表格。而且你点击每个选项,都会出现一个不同的表格。这个其实是比较有用的。比如你在要选择动画片的时候,就应该点选一下小于18岁,或者30~44岁这个选项看看他们的评分,因为他们才是这部电影的最大观众群,其他人的分数都是仅供参考的。
碟报员或者我们在选择影片的时候,可以不仅仅看个总得分,多花一点时间,看看影片各个年龄段的得分会更有帮助的。有些影片我们觉得不好看,但是分数很高,你也可以参照一下,“US users”和“non-USusers”这部分的数据,如果美国投票用户远远大于海外用户,那说明此片的确是有相当深厚的美国文化底蕴的,不觉得好看也是正常。相反的,如果我们觉得不错,但是IMDB的分数很低,这也许是老美的评分人数多,打的分低,就把总分给拉下来了。 |
|