数据分析：评委打分精准度及权重失衡对获奖的影响 [复制链接]

主楼

发表于 2023-2-11 21:17 |只看该作者 |倒序浏览 |

本帖最后由公理力于 2023-2-11 21:32 编辑

注意到有版友发帖，呼吁大家给4位评委的工作也打打分。此事当然可以有，怎奈，应者寥寥。

还有版友建议：评委们就自己工作中的遗憾和有待改进之处谈谈看法，亦未见回应。

无需多少想象力，参赛者，赛事组织者，也包括关心赛事的不少版友，应该也关注下面两个问题：

1）4位评委打分的精准度究竟如何？

2）由评委打分区间差异悬殊导致的权重失衡，对作品排名，特别是获奖等级的影响究竟有多严重？

事实上，早在赛事进行期间，darling小芳就曾专门发帖，提出了第二个问题，并恳请组织者采取必要措施。公某在被点名的情况下，也曾回应一帖，提出过改进建议。

赛事结束，小芳再次提到该问题，并点了公某的名。现在，就通过数据统计，专门分析一下上面两个问题。

重点是，数据分析是得以屏蔽任何主观影响的客观性手段，舍此，几乎没有得出明确、公正结论的方法。

（一）4位评委打分精准度数据分析

该表仅限于统计4位评委对12篇获奖作品的打分。计算评委对每篇作品打分与该作品平均得分之差，即打分偏差，然后统计4位评委各自对12篇作品的累计总偏差，就是各位评委打分精准度指标。

从该表不难看出，如果不是打分分布区间差异过于悬殊，这是一个相当不错的结果：4位评委的精准度都相当高，且差异不大，按顺序为：公孙小刀，黄河编辑，马缨花，道家传人。

应该指出的是，公孙和道人两位评委的12个偏差值各自在同一方向：公孙打分无一例外都偏低（红色）；而道人正相反，全部偏高（黑色）。

这个现象对打分准确度的影响是正面的。这意味着，该两评委各自的打分标准具有相当高的前后一致性。

值得特别注意的是，评委们对46号作品的打分。除了马花评委给出了12篇作品的个人最低分（7分），另外三位都给了全部65篇作品的个人最高分。

但由于马花的最低分偏差高达1.97（或许是看走眼了吧），导致这篇另3位评委一致认同的最佳作品，不仅无缘一等奖，二、三等奖也没份儿，仅获优秀作品奖。

从这一意外即可管窥：打分区间差异悬殊，所导致的评委间实际权重失衡有多么严重：一位评委的影响抵消了3位评委的最高分！

而这一最低分同时也影响到黄河和道人打分精准度：该两评委的最大偏差均出现于该作品（1.03和0.99）。

再仔细看一下马花的12个打分：5篇给了最高分（9.0），6篇给了次高分（8.5）。这与另外3位评委形成对比。

不应忽视的一个事实是，她是最早开始评论作品的，也最早开始受到质疑和批评。客观地看，这11个高分，显然是希望自己看好的作品都能获奖！这是出于缓解版友批评的目的吗？公某不猜测。

附件: 您需要登录才可以下载或查看，没有帐号？立即注册 

分享到: QQ好友和群 QQ空间 腾讯微博 腾讯朋友

新浪微博人人网豆瓣更多...

帐号		自动登录	找回密码
密码			立即注册