@perlseb
Vous avez raison.
On a beaucoup parlé du programme AlphaZero qui a battu tous
les records en décembre 2017 en fonctionnant par apprentissage. Il a battu le
programme Stockfish qui fonctionnait avec des algorithmes classiques. Pour parvenir
à une telle performance, il a fallu mettre en œuvre des moyens gigantesques. Voir
à ce sujet l’article : « Qu’y a-t-il dans le cerveau échiquéen
d’AlphaZero ? » « le réseau neuronal d’AlphaZero
comprend environ 80 couches, soit des centaines de milliers de neurones. Un
petit calcul nous permet donc d’estimer son nombre de poids exprimés en
centaines de millions ». Le matériel nécessaire pour faire fonctionner
ce réseau neuronal est hors norme : « AlphaZero tourne sur un
matériel ultra-spécialisé : Le Tensor Processing Unit (TPU) de Google.
AlphaZero a utilisé 5000 TPUs de première génération pour jouer contre lui-même,
ce qui a permis de « former » son réseau, et 64 TPU de seconde
génération pour l’entraînement proprement dit. ».
Avec de tels moyens cet ordinateur avec son logiciel ne sait
faire qu’une seule chose : jouer aux échecs ou au jeu de go. Pour remplir
une autre tâche, il lui faudrait faire un nouvel apprentissage. Avec cette
débauche de moyens, il est très loin de faire ce que fait un humain lequel s’adapte
à toutes sortes de situation. L’ordinateur ne fait aucune adaptation de sa
propre initiative. Il fait tourner le programme d’apprentissage qu’un humain a
décidé de lancer.