Si un site change ... des archives restent en ligne
Troisième leçon d'Internet aujourd'hui, pour convaincre, s'il est encore besoin, de la nécessité d'apprendre à l'école (au lieu de quelques théories douteuses) à se servir d'Internet comme un outil professionnel. Nous avons vu cette semaine dans la première leçon comment rechercher sur un site web précis ou une famille de sites Web et retrouver ainsi le tweet du Premier Ministre où il écrit : "La PMA mérite un débat en tant que tel, c’est pourquoi elle figurera dans le projet de loi famille". Dans la deuxième leçon, nous avons étudié comment retrouver un site Web inaccessible avec l'exemple, encore issu de l'actualité, du site Ligne Azur qui, selon son rédacteur en chef a été hacké et n'est donc plus accessible.
Les caches, que nous avons déjà évoqué, proposent la dernière version d'un site tel qu'il était lors du dernier passage du robot d'un moteur de recherche. Dans l'exemple donné, les caches sont aujourd'hui obsolètes, car les robots des diffférents moteurs sont revenus visiter le site et ont donc copié en cache une nouvelle version, celle de la page inaccessible. Pour aller plus loin, regardons aujourd'hui les sites d'archives qui proposent différentes versions de l'intégralité d'un site web à différentes dates.
Troisième leçon : Retrouver différentes versions d'un site web
Le site Archive.org propose, dans sa "Wayback Machine" de remonter le temps et de vous donner accès à des sites (quelques 390 milliards de pages Web ...) dans des versions qui ont été publiées mais qui n'existent plus. Ce projet, Internet Archive, est mené par un organisme à but non lucratif consacré à l’archivage du Web. il collecte ainsi, avec son propre robot des clichés instantanés de sites Web (copie de pages prises à différents moments), mais aussi de logiciels, de films, de livres et d’enregistrements audio (à retrouver ici). D'autres sites équivalent existent : Europarchive et Archive-it.
Ainsi, vous pourrez donc visualiser sur archive.org, le site Ligne Azur, non pas dans les dernières versions connues par les moteurs de recherche, mais dans un grand nombre de versions, aspirées entre le 20 mai 2001 et le 1er février 2014. Notamment cette page, reprise par quelques journaux, qui explique les situations individuelles multiples et distingue, sur un site partenaire des différents gouvernements successifs, le sexe biologique (en lien avec l’anatomie et qui ne définit pas nécessairement le sexe social d’une personne), de l'identité de genre.
CQFD
François JEANNE-BEYLOT
6 réactions à cet article
Ajouter une réaction
Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page
Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.
FAIRE UN DON