本帖最后由 公理力 于 2023-2-11 21:32 编辑
注意到有版友发帖,呼吁大家给4位评委的工作也打打分。此事当然可以有,怎奈,应者寥寥。 还有版友建议:评委们就自己工作中的遗憾和有待改进之处谈谈看法,亦未见回应。
无需多少想象力,参赛者,赛事组织者,也包括关心赛事的不少版友,应该也关注下面两个问题: 1)4位评委打分的精准度究竟如何? 2)由评委打分区间差异悬殊导致的权重失衡,对作品排名,特别是获奖等级的影响究竟有多严重?
事实上,早在赛事进行期间,darling小芳就曾专门发帖,提出了第二个问题,并恳请组织者采取必要措施。公某在被点名的情况下,也曾回应一帖,提出过改进建议。 赛事结束,小芳再次提到该问题,并点了公某的名。现在,就通过数据统计,专门分析一下上面两个问题。
重点是,数据分析是得以屏蔽任何主观影响的客观性手段,舍此,几乎没有得出明确、公正结论的方法。
(一)4位评委打分精准度数据分析
该表仅限于统计4位评委对12篇获奖作品的打分。计算评委对每篇作品打分与该作品平均得分之差,即打分偏差,然后统计4位评委各自对12篇作品的累计总偏差,就是各位评委打分精准度指标。
从该表不难看出,如果不是打分分布区间差异过于悬殊,这是一个相当不错的结果:4位评委的精准度都相当高,且差异不大,按顺序为:公孙小刀,黄河编辑,马缨花,道家传人。
应该指出的是,公孙和道人两位评委的12个偏差值各自在同一方向:公孙打分无一例外都偏低(红色);而道人正相反,全部偏高(黑色)。 这个现象对打分准确度的影响是正面的。这意味着,该两评委各自的打分标准具有相当高的前后一致性。
值得特别注意的是,评委们对46号作品的打分。除了马花评委给出了12篇作品的个人最低分(7分),另外三位都给了全部65篇作品的个人最高分。 但由于马花的最低分偏差高达1.97(或许是看走眼了吧),导致这篇另3位评委一致认同的最佳作品,不仅无缘一等奖,二、三等奖也没份儿,仅获优秀作品奖。 从这一意外即可管窥:打分区间差异悬殊,所导致的评委间实际权重失衡有多么严重:一位评委的影响抵消了3位评委的最高分!
而这一最低分同时也影响到黄河和道人打分精准度:该两评委的最大偏差均出现于该作品(1.03和0.99)。
再仔细看一下马花的12个打分:5篇给了最高分(9.0),6篇给了次高分(8.5)。这与另外3位评委形成对比。
不应忽视的一个事实是,她是最早开始评论作品的,也最早开始受到质疑和批评。客观地看,这11个高分,显然是希望自己看好的作品都能获奖!这是出于缓解版友批评的目的吗?公某不猜测。
|