机器学习数学基础:33.肯德尔和谐系数教程
肯德尔和谐系数教程
·
肯德尔和谐系数教程
一、定义与用途
肯德尔和谐系数(Kendall’s W)是一种用于衡量多个评价者对一组对象进行评价时,评价结果一致性程度的统计量。它的取值范围在0到1之间。当W \ = 0时,表示评价者之间的评价完全不一致;当W \ = 1时,表示评价者之间的评价完全一致。常用于心理学、教育学、社会学等领域,比如判断多个评委对选手表现评分的一致性,或多位老师对学生论文评价的一致性等。
二、适用场景
- 多个评价者:适用于两个及以上评价者对同一组对象进行评价的情况。例如,3位医生对20位患者的病情严重程度进行等级评定。
- 等级数据:评价结果通常为等级形式,如名次、等级分类(优、良、中、差)等。当然,也可以将连续数据转化为等级数据后使用。
三、计算步骤(同一评价者无相同等级评定时)
假设存在K个评价者对N个对象进行评价。
- 整理数据:将每个评价者对N个对象的评价结果(等级)整理成表格形式。
- 计算每个对象的秩和RiR_iRi:对于每个对象,把K个评价者给出的等级相加,得到该对象的秩和RiR_iRi(i =1,2,⋯ ,Ni \ = 1,2,\cdots,Ni =1,2,⋯,N)。
- 计算平均秩和Rˉ\bar{R}Rˉ:Rˉ =∑i =1NRiN\bar{R}\ =\frac{\sum_{i \ = 1}^{N}R_i}{N}Rˉ =N∑i =1NRi,即所有对象秩和的平均值。
- 计算SSS:S =∑i =1N(Ri−Rˉ)2S\ =\sum_{i \ = 1}^{N}(R_i - \bar{R})^2S =∑i =1N(Ri−Rˉ)2,也就是每个对象的秩和与平均秩和差值的平方和。
- 计算肯德尔和谐系数WWW:根据公式W =S112K2(N3−N)W\ =\frac{S}{\frac{1}{12}K^2(N^3 - N)}W =121K2(N3−N)S进行计算。
四、计算步骤(存在相同等级评定时)
- 前3步与无相同等级评定时相同。
- 计算TjT_jTj:对于每个评价者,统计其评价中相同等级的组数为ggg,对于第jjj组相同等级,设该组等级的个数为njn_jnj,则Tj =∑j =1gnj(nj2−1)12T_j\ =\sum_{j \ = 1}^{g}\frac{n_j(n_j^2 - 1)}{12}Tj =∑j =1g12nj(nj2−1)。然后计算所有评价者的T =∑k =1KTkT\ =\sum_{k \ = 1}^{K}T_kT =∑k =1KTk。
- 计算SSS的校正值S′S'S′:S′ =S−K(K2−1)12∑k =1KTkS' \ = S-\frac{K(K^2 - 1)}{12}\sum_{k \ = 1}^{K}T_kS′ =S−12K(K2−1)∑k =1KTk。
- 计算肯德尔和谐系数WWW:W =S′112K2(N3−N)−K∑k =1KTkW\ =\frac{S'}{\frac{1}{12}K^2(N^3 - N)-K\sum_{k \ = 1}^{K}T_k}W =121K2(N3−N)−K∑k =1KTkS′。
五、实例演示(无相同等级评定)
4位评委(K =4K \ = 4K =4)对6位歌手(N =6N \ = 6N =6)的演唱表现进行排名,结果如下:
| 评委 | 歌手1排名 | 歌手2排名 | 歌手3排名 | 歌手4排名 | 歌手5排名 | 歌手6排名 |
|---|---|---|---|---|---|---|
| 评委1 | 2 | 4 | 1 | 5 | 3 | 6 |
| 评委2 | 3 | 5 | 2 | 6 | 1 | 4 |
| 评委3 | 1 | 3 | 4 | 2 | 5 | 6 |
| 评委4 | 2 | 4 | 3 | 5 | 1 | 6 |
- 计算每个歌手的秩和RiR_iRi:
- 歌手1:2+3+1+2 =82 + 3 + 1 + 2 \ = 82+3+1+2 =8
- 歌手2:4+5+3+4 =164 + 5 + 3 + 4 \ = 164+5+3+4 =16
- 歌手3:1+2+4+3 =101 + 2 + 4 + 3 \ = 101+2+4+3 =10
- 歌手4:5+6+2+5 =185 + 6 + 2 + 5 \ = 185+6+2+5 =18
- 歌手5:3+1+5+1 =103 + 1 + 5 + 1 \ = 103+1+5+1 =10
- 歌手6:6+4+6+6 =226 + 4 + 6 + 6 \ = 226+4+6+6 =22
- 计算平均秩和Rˉ\bar{R}Rˉ:∑i =16Ri =8+16+10+18+10+22 =84\sum_{i \ = 1}^{6}R_i \ = 8 + 16 + 10 + 18 + 10 + 22 \ = 84∑i =16Ri =8+16+10+18+10+22 =84,Rˉ =846 =14\bar{R}\ =\frac{84}{6} \ = 14Rˉ =684 =14。
- 计算SSS:
-(8−14)2+(16−14)2+(10−14)2+(18−14)2+(10−14)2+(22−14)2(8 - 14)^2+(16 - 14)^2+(10 - 14)^2+(18 - 14)^2+(10 - 14)^2+(22 - 14)^2(8−14)2+(16−14)2+(10−14)2+(18−14)2+(10−14)2+(22−14)2
- =(−6)2+22+(−4)2+42+(−4)2+82\ = (-6)^2 + 2^2 + (-4)^2 + 4^2 + (-4)^2 + 8^2 =(−6)2+22+(−4)2+42+(−4)2+82
- =36+4+16+16+16+64 =152\ = 36 + 4 + 16 + 16 + 16 + 64 \ = 152 =36+4+16+16+16+64 =152。 - 计算肯德尔和谐系数WWW:
-112K2(N3−N) =112×42×(63−6) =112×16×(216−6) =280\frac{1}{12}K^2(N^3 - N)\ =\frac{1}{12}\times4^2\times(6^3 - 6)\ =\frac{1}{12}\times16\times(216 - 6)\ =280121K2(N3−N) =121×42×(63−6) =121×16×(216−6) =280。
-W =152280≈0.54W\ =\frac{152}{280}\approx0.54W =280152≈0.54。
说明4位评委对6位歌手演唱表现排名的一致性程度中等。
六、注意事项
- 肯德尔和谐系数只衡量评价的一致性,不反映评价的准确性。
- 数据转化为等级时,方法要合理,否则可能影响结果。
- 当评价者数量或对象数量过少时,结果的可靠性可能降低 。
更多推荐




所有评论(0)