Pourquoi la NSA contrôle entre 12 et 35% du trafic internet pertinent ?
- Dans un document déclassifié publié avant-hier ("L'Agence nationale de sécurité : Missions, pouvoirs, contrôle et partenariats", la NSA étaye ses démentis de surveillance globale par l'encadré suivant (destiné à être repris par les médias de manière ostensible) : En clair la portée et l'ampleur de la collecte de données porterait sur 1.6% du web au total seul moins d'1/1 000 000ème du trafic global.
"Scope and Scale of NSA Collection
According to figures published by a major tech provider, the Internet carries 1,826 Petabytes of information per day. In its foreign intelligence mission, NSA touches about 1.6% of that. However, of the 1.6% of the data, only 0.025% is actually selected for review. The net effect is that NSA analysts look at 0.00004% of the world's traffic in conducting their mission, that's less than one part in a million. Put another way, if a standard basketball court represented the global communications environment, NSA's total collection would be represented by an area smaller than a dime on that basketball court."
- On remarquera tout d'abord que ce ratio (données collectées ou traitées sur volume global) n'a aucun sens (encore moins que les ratios sur PIB). Imaginez un voleur dire qu'il n'a volé la valeur que moins d'1 000 000ème des richesses n'a absolument aucun sens. Mais puisque la NSA veut jouer à ce jeu...
-
L'estimation du volume internet global à 1.826 pétabits (francisé) provient très certainement d'une des études de CISCO et notamment du Visual Networking Index qui indique les tendances de consommation et les projections à moyen-terme. Le volume total par mois est divisé pour être ramené à un volume journalier.
Ainsi en 2013, 55,553 exabits (ou 55 553 pétabits) par mois, donc 1,826 exabits par jour (si on divise par un peu plus de 30) ou 1826 pétabits.
- La NSA nous informe qu'elle touche 29 pétabits par jour (900 par mois), on doit pouvoir lui faire confiance sur ce point dans la mesure où elle a plutôt joué sur la manipulation du dénominateur que sur celle du numérateur pour défendre son action. Autrement dit, si les données collectées doivent bien être de 29 pétabits, le dénominateur pertinent n'est certainement pas le trafic IP global !
- La NSA a pris un risque en fournissant des données chiffrées, risque atténuée par le manque de réflexions des médias qui ont tous relayé le petit encadré du rapport de la NSA. Reconstruire les données pertinentes n'est pas évident mais on peut encore une fois se baser sur les données de CISCO pour tenter d'établir une fourchette.
- Tout d'abord une précision : l'important n'est pas ce que la NSA "regarde" effectivement, mais ce qu'elle a la possibilité de regarder après recherche (via XKeyScore notamment). Ce qu'elle peut potentiellement regarder selon ses choix et pas ce que ses analystes vont effectivement regarder (on se doute qu'ils ne peuvent pas "regarder" tout...)
- L'image ci-dessus vise à illustrer la fragmentation du flux internet par segment. Maintenant nous allons ôter tout ce qui n'est pas pertinent en nous basant sur les données de CISCO.
-
Il faut tout d'abord opérer la distinction entre le trafic internet (ouvert") par opposition au "managed IP traffic" (fermé) : Un rapport de juin 2012 sur l'utilisation du réseau haut débit en France faisait la distinction : "Internet ou « l’Internet ouvert » est souvent défini par rapport aux technologies IP. Toutefois, celles-ci peuvent être utilisées à l’intérieur d’un réseau fermé et contrôlé (réseau d’accès, réseau d’entreprise) pour assurer une distribution de bout en bout de services et contenus proposés par l’opérateur de réseau. Dans ce cas, il faut parler de réseau fermé ou de services managés". Le trafic internet pèse 45 000 pétabits/mois tandis que le réseau managé en pèse 10 000. Les statistiques par segments ne sont pas disponibles pour le réseau managé. Néanmoins sachant qu'on touche un réseau par définition fermé qui comprend le : "corporate IP WAN traffic and IP transport of TV and VoD", on peut retirer la composante "consumer" du réseau fermé qui ne comporte que de la vidéo (Sauf à considérer que la NSA analyse le transport de TV et la vidéo à la demande). On peut donc retirer 11 686 pétabits/mois au volume total (11 000 soyons gentils).
-
Ensuite, CISCO analyse précisément le trafic internet (ouvert) des consommateurs 33.337 (fixe + mobile). Et la encore on peut retirer 19 855 + 26 (vidéo (youtube etc...) + gaming)). Disons 20 000 pétabits par mois. Il nous reste encore les données web et les partages de fichiers :
* Web data : "web, email, instant messaging and other data trafic".
* File sharing : trafic des systèmes P2P reconnus + trafic des systèmes de partage sur le web.
- On peut conserver l'intégralité du web data comme dénominateur pour la fourchette basse du contrôle. On pourra le réviser par zone géographique pour la fourchette haute du contrôle.
- Concernant les partages de fichiers, il m'apparaît improbable d'inclure l'intégralité du trafic des systèmes P2P dans le champ du contrôle potentiel de la NSA (sauf à contrôler le contenu de chacun des fichiers ou à rechercher les fichiers dénommés : "comment fabriquer des bombes" etc...). Je retiendrais comme dénominateur pour la fourchette basse du contrôle 20% du flux de fichiers partagés (si certains sites de partages hors principaux sont ciblés) et 5% pour la fourchette haute. Soit 1400 et 360 pétabits par mois.
Au total sur le trafic consommateur internet (33.337), on peut (doit) retirer entre 26 000 et 27 000 pétabits et sur le total du trafic internet consommateur (45 000) on doit retirer entre 37 000 et 38 500 pétabits. La donnée pertinente est donc comprise entre 8 000 et 6 500 pétabits par mois pour les consommateurs.
-
Passons, au trafic des entreprises (10 500), 3000 est en réseau fermé et 7500 en ouvert. Je ne peux faire qu'une estimation à la louche ici. En retirant les flux vidéos (qui ne sont pas absent sous prétexte que ce sont des entreprises), les réseaux fermés sécurisés, les partages de fichiers standards, on peut estimer entre 1000 et 2500 le volume de données pertinent.
-
In fine, le volume de données pertinent, hors correction géographique, est compris entre 7 500 et 11 500 (particuliers + business)
-
On ne peut pas s'en tenir la, le trafic global est segmenté entre utilisateurs et utilisations mais aussi géographiquement. En croisant la géographie et donc la nationalité des fournisseurs de services de cloud computing, on peut retirer du champ américain une bonne part des données précédemment évoquées. Je ne peux que livrer une fourchette encore une fois qui prendra en considération :
- L'existence de réseaux sécurisés.
- Les fournisseurs de service cloud computing étrangers.
- Une part de certains pays "ne présentant sans doute pas d'intérêt" (subjectif j'en conviens).
- Concernant l'Europe, considérer que 100% du trafic ne passe pas par les USA (à un quelconque moment de la chaine).
Au final, on peut réduire le volume de données pertinent entre 35% et 65% (1/3 // 2/3) à mon avis.
Conclusion : La fourchette des données pertinente finale se situe donc entre 2 625 pétabits et 7475 pétabits par mois. La NSA touche à (contrôle potentiellement) 900 pétabits de données par mois. La NSA contrôle donc entre 12% et 35% du trafic internet pertinent.
2 réactions à cet article
Ajouter une réaction
Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page
Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.
FAIRE UN DON