N’oublions pas que Google est un système de base de données distribué et répliqué constitué de plusieurs dizaines de milliers de machine, dès lors la reconstruction d’un index aussi spectaculaire que cela puisse sembler est relativement bien factorisable.
Cela n’enlève rien à la performance technique de résoudre de multiples petits problèmes techniques qui ensemble constituent un problème complexe.
En revanche c’est très inquiétant quand on pense à la sélection des sources par exemple de Google news et de la possibilité de créer du prime time avec le risque de transformer partiellement un média basé sur le pull en média push.
Si la pertinence et le déclencheur de la réindexation s’appuie sur « on en parle à la télé » ou qu’un blog bien référencé par technorati fait du ping il y a lieu d’avoir des soucis pour l’avenir...