• AgoraVox sur Twitter
  • RSS
  • Agoravox TV
  • Agoravox Mobile


En réponse à :


Gaël 26 mai 2011 12:02

Je me suis amusé à reprendre vos données pour savoir ce qu’en pensaient les algorithmes de clustering.


Voici ce que ça donne pour quelques algos classiques (en imposant à chaque fois 4 groupes) :

K-means :

[76,87], [98,100], [127,204], [228,379]

Diana :

[76,130], [138,204], [228, 271], [324,379]

SingleLinkage :

[76, 176], [204, 271], [324, 332], [379, 379]



Donc au final : cette division en 4 groupes me paraît bien arbitraire. Il n’y a pas de réelle solution de continuité entre les groupes, c’est pourquoi les résultats sont si différents selon l’algorithme utilisé.

Il serait intéressant de faire un histogramme pour voir l’allure de la distribution - même si l’échantillon est un peu faible.

Je n’ai pas le temps d’étudier votre affirmation selon laquelle il n’existe pas de corrélation entre le nombre d’accidents et la situation nord / sud. Mais cela mériterait plus ample investigation...

Ajouter une réaction

Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page

Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.


FAIRE UN DON


Palmarès