A l’auteur : je suis sidéré en lisant votre article qu’à aucun moment vous n’envisagiez que les acteurs du big data, et notamment Google, puissent ne pas être neutres dans cette affaire et laisseraient donc une idyllique information « objective » apparaître ! Alors que google n’est pas un organisme philantropique mais une société à but commercial !
Quand vous parlez de « manipulations » de données, il ne s’agit sans doute pas de ce que vous pensez car Google fait évidemment passer ses intérêts avant ceux de ses concurrents ou du grand public.
Exemple : pendant un ou deux ans google a mis en avant sur ses pages de résultats les pages contenant des vidéos. On voyait une petite icône de vidéo, c’était super il suffisait de produire une vidéo sur un thème donné, et on avait de meilleurs chances d’être positionné correctement sur google. Mais entre temps Google a racheté youtube, et toutes les vidéos autres que youtube ont disparu des résultats de recherche.
Plus récemment ce sont les micro-datas qui ont été prises en compte par Google, et vous pouviez avoir une micro-image de votre page dans les résultats de recherche, ce qui augmentait le nombre de clics. Bingo, tout le monde s’est précipité sur cette nouvelle fonctionnalité mais au bout d’un an Google a décidé unilatéralement de supprimer ces images, pour ne plus les laisser qu’aux sites les plus gros. En vertu de la qualité des résultats peut-être ? Non en fonction du bon vouloir de Google. Google favorise les gros sites parce que c’est plus simple à gérer pour lui. Peu importe la qualité du contenu. Contrairement à ce que vous pensez il n’existe sur terre aucun moyen de savoir si un contenu a un quelconque intérêt ou pas, à part le faire lire par des humains, et Google emploie des centaines de personnes pour vérifier la qualité des contenus des pages (et surtout la « fraude » au référencement)
Autrement dit tout ce que vous voyez dans Google est trafiqué en permanence, et pas dans le sens d’un hypothétique intérêt général qui n’existe pas car Google ne représente que lui-même et n’a pas d’autre objectif que de gagner de l’argent.
Les algos de Google sont bricolés en permanence car la base de leur algorithme, à savoir le nombre d’hyperliens qui pointent vers une page pour décider de sa popularité est une fumisterie que tout le monde trafique depuis les débuts du référencement, à la fin des années 90, et il faut être bien naïf pour penser que ce qui peut sortir de Google est autre chose que ce qui est l’intérêt direct de Google, sans compter que Google a également des accords avec la NSA, donc toute information sensible qui pourrait sortir d’analyses de type « big data » peut être entachée de présomption de manipulation.
Rien de ce qui est classé dans Google dans la première page de résultat n’arrive là « naturellement ».
Le big data c’est comme les OGM on nous le vend en disant que cela fera des miracles pour l’humanité, alors que les résultats que nous pouvons voir d’ores et déjà prouvent le contraire !