Une matrice de confusion sert à d’analyser la répartition des erreurs. Les deux dernières lignes ne font pas à proprement parler de la matrice de confusion.
En lignes tu as les valeurs réelles, en colonnes tu as les valeurs « prédites » par le système.
.
Par exemple, la ligne PS correspond à tous les sièges qui sont réellement attribués au PS au soir du second tour. Donc la somme des nombres sur cette ligne correspond au nombre de sièges réels obtenus par ce parti.
La colonne PS correspond à tous les sièges que le programme informatique attribue au PS étant donné les résultats du 1er tour et les hypothèses de calcul que je décris dans l’article. C’est pour ca qu’une bonne matrice de confusion comprend une diagonale forte : les chiffres sur la diagonale sont le croisement des valeurs reelles (lignes) et des valeurs prédites (colonnes).
.
Si on regarde les radicaux de gauche (ou RG, selon la terminologie JDD), ils récupèrent 7 sièges : la somme des nombres sur la ligne RG est égale à 7. Le système « prédit » correctement 6 de ces 7 sièges (sur la diagonale), tandis que l’un de ces 7 sièges est attribué à l’UMP de manière erronée (ligne RG, colonne UMP).
Le système que je propose leur prédit 9 sièges : la somme des nombres sur la colonne RG est égale à 9. 6 de ces 9 sièges sont corrects, tandis que je leur attribue par erreur 3 sièges qui reviennent en réalité à l’UMP (ligne UMP, colonne RG).
L’avant derniere ligne de la matrice fait la somme sur les colonnes (valeurs prédites), et la dernière ligne de la matrice rappelle les valeurs réelles.
L’intéret d’une telle matrice est de mettre en évidence toutes les erreurs, y compris celles qui sont cachées lorsqu’on se contente de compter la somme du nombre de sièges. Dans l’exemple RG : le système « prédit » 9 sièges au lieu de 7. Mais il n’y a pas que 2 erreurs, il y en a 4, dont 2 qui se compensent.