Traduction : Systran ou Reverso ?
Il est de bon ton chez les linguistes de se moquer des traducteurs automatiques. Il est vrai qu’ils nous offrent parfois un florilège de phrases mal construites et de contresens qui frisent le surréalisme. Pourtant, les premières recherches en traduction automatique remontent au tout début des années 1950 : plus d’un demi-siècle d’efforts qui n’ont pas réussi à casser le code. Incroyable difficulté du langage ! Dans le même temps, on aura réussi à décrypter le génome humain (la découverte de la structure en double hélice de l’ADN en 1953 est contemporaine des débuts de la traduction automatique)...
Pour autant, les choses progressent — trop lentement, bien sûr, à mon goût, mais il ne faut pas être injuste. Si la traduction automatique ne peut absolument pas rivaliser avec un traducteur humain (même mauvais !), cela ne veut pas dire qu’elle soit totalement dénuée d’intérêt. Voici une petite expérience que je soumets chaque année à mes étudiants dans mon cours d’introduction aux technologies du langage. Prenons une des nouvelles du jour sur un journal grec, Kathimerini :
Δύο νέα κρούσματα στην Τουρκία του θανατηφόρου ιού της γρίπης των πτηνώνΟ Παγκόσμιος Οργανισμός Υγείας ανακοίνωσε σήμερα στη Γενεύη ότι δυο παιδιά που νοσηλεύονται στην Τουρκία έχουν προσβληθεί από το θανατηφόρο στέλεχος Η5Ν1 του ιού της γρίπης των πτηνών.
Εκπρόσωπος του Οργανισμού δήλωσε ότι τα παιδιά, ηλικίας 5 και 8 ετών, προέρχονται από την ίδια περιοχή με τα τρία αδέλφια που πέθαναν από τη γρίπη των πτηνών αυτήν την εβδομάδα.
Σημειώνεται πως 32 άτομα νοσηλεύονται σε νοσοκομείο της πόλης Βαν με ύποπτα συμπτώματα, ενώ τουλάχιστον πέντε περιοχές της ανατολικής Τουρκίας έχουν τεθεί σε καραντίνα.
[original]
Cela ne vous dit probablement pas grand chose... Je prends toujours volontairement une langue que peu de gens connaissent. Le grec est idéal parce qu’on ne peut même pas deviner de quoi il s’agit d’après la forme des mots (alors qu’on peut déchiffrer de l’anglais, de l’espagnol ou de l’allemand, même si on ne connaît pas ces langues). Le chinois ou le japonais seraient aussi de bons candidats !
Comparons maintenant le texte avec sa version traduite par Babelfish :
Deux nouveaux cas en Turquie du virus mortel de la grippe des oiseauxL’organisme mondial de santé a communiqué aujourd’hui à Genève que deux enfants qui nosiley’ontaj en Turquie ils ont été attaqués par le cadre I5N1 mortel du virus de la grippe des oiseaux.
Représentant de l’organisme a déclaré que les enfants, de l’âge 5 et de 8 années, proviennent de la même région que les trois frères qui sont morts de la grippe des oiseaux cette la semaine.
Il est marqué que 32 individus nosiley’ontaj à hôpital de la ville Van grâce à des symptômes suspects, tandis qu’au moins cinq régions de la Turquie orientale ont été posées à quarantaine.
Cette traduction reflète parfaitement l’état de l’art dans le domaine : on comprend le thème général (la grippe aviaire en Turquie), et on peut même lister les faits principaux : deux enfants de 5 et 8 ans sont morts de la grippe aviaire en Turquie, 32 individus ont été hospitalisés avec des symptomes suspects, cinq régions sont en quarantaine, etc. Certaines des erreurs sont stupides : H5N1 est traduit par I5N1, νοσηλεύονται (hospitalisés) est absent du dictionnaire. On pourrait améliorer les choses à peu de frais.
Il est hors de question d’utiliser de telles traductions comme documents finaux, et je suis toujours très perplexe quand des étudiants (ou collègues !) m’annoncent fièrement qu’ils ont traduit automatiquement leur résumé en anglais pour une conférence ! Mais la traduction automatique a passé le cap qui lui permet d’être un véritable outil de déchiffrage, utile pour prendre connaissance rapidement du thème et du contenu global de pages en langues étrangères, dans des situations où il serait inconcevable de payer un traducteur. C’est la cas, par exemple, des spécialistes de veille économique, mais aussi de l’internaute lambda : alors que la grande majorité des documents du web sont écrits en anglais, moins de 30% des internautes sont anglophones (voir étude de Byte Level), et ce pourcentage ne cesse de décroître.
Il n’est donc pas étonnant que la plupart des moteurs de recherche offrent une fonction permettant de traduire les pages retournées. Mais dans un contexte où le marché potentiel est aussi considérable, il est par contre surprenant de voir à quel point l’offre est limitée : Google et Yahoo utilisent la même technologie, le système Systran, qui est aussi derrière Babelfish (Altavista). Le moteur français Voila utilisait au départ Reverso de Softissimo, mais s’est finalement mis aussi à Systran... Les portails comme AOL et Wanadoo le proposent aussi. Systran fait d’ailleurs désormais la plus grande partie de son chiffre d’affaire avec les opérateurs internet.
Dans ce contexte de systrannisation, Ask Jeeves surprend, puisque la firme a annoncé récemment son association avec Reverso [via DSI], disponible aussi sur la version beta francophone du moteur.
Alors, mauvais choix ? Pour en avoir le coeur net, nous avons demandé à 58 étudiants de première année de licence d’étudier la question. Le projet consistait à traduire un texte de leur choix, d’au moins 500 mots, de leur langue seconde vers leur langue maternelle (de façon à pouvoir juger correctement du résultat), à l’aide à la fois de Reverso et de Systran (site Babelfish). Chaque étudiant devait faire une étude détaillée des erreurs et de leurs causes probables (mot absent du dictionnaire, etc.) ; je vous passe les détails. La dernière question demandait à chacun de choisir parmi Reverso et Systran quel était le système qui fournissait la traduction la plus lisible.
Les résultats sont sans appel :
Source | Cible | Reverso | Systran |
---|---|---|---|
Allemand | Français | 2 | 0 |
Anglais | Français | 15 | 5 |
Italien | Français | 8 | 1 |
Espagnol | Français | 20 | 6 |
Français | Anglais | 0 | 1 |
Total | 45 | 13 |
Quelle que soit la langue, la préférence va massivement à Reverso.

Alors... Ask Jeeves aurait-il eu du flair ? En tous cas, Systran, qui est en désamour avec sa "vache à lait" historique, la Commission européenne [voir Le Monde, Systran], a sans doute intérêt à serrer quelques boulons pour survivre dans le monde plus impitoyable des opérateurs Internet.
Merci à Estelle pour le dépouillement de l’enquête !
10 réactions à cet article
Ajouter une réaction
Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page
Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.
FAIRE UN DON