En novembre 2016, Google a sorti une nouvelle version de Google Translate et fait le buzz dans le monde entier avec la "qualité extraordinaire" des traductions que le nouveau moteur fournit. Des dizaines d'articles comparant l'ancienne version vs la nouvelle version dans différentes langues, traduisant et retraduisant des textes littéraires (réputés plus difficiles à traduire), ont occupé pendant des mois les colonnes et les blogs des médias généralistes et spécialisés.
Ce que Google a publié techniquement, c'est l'introduction d'un modèle de traduction neuronale dans son moteur de traduction automatique. Cette amélioration majeure de la qualité des traductions fournies (gratuitement !) par Google Translate a commencé à changer l'opinion du grand public sur l'avenir de la industrie de la traduction et la place de la traduction automatique dans celle-ci. Le développement de nouveaux outils et l'accès à des traductions automatiques de meilleure qualité ont poussé les gros clients de l'industrie à envisager de réduire leurs coûts en obtenant des services de post-édition au lieu de traductions. La post-édition de la traduction automatique est alors devenue plus largement proposée par les fournisseurs de services de traduction en tant que service professionnel. Les grands acteurs et les éditeurs de TMS ont accéléré la formation de leurs propres moteurs de MT. L'industrie de la traduction a commencé à changer profondément.
Nous avons voulu dans cet article vous rappeler ce qu'était la traduction automatique, ce qu'elle est devenue et quels sont les changements qu'elle engendre dans l'industrie de la traduction.
L'histoire de la traduction automatique
La traduction automatique (MT) a une longue histoire qui remonte à 1949 lorsqu'elle est apparue pour la première fois dans le Memorandum on Translation de Warren Weaver. Le premier chercheur dans le domaine, Yehosha Bar-Hillel, débute ses études au MIT en 1951. L'équipe de recherche MT de Georgetown suit avec une démonstration publique de son système en 1954. La traduction automatique est également l'une des premières applications non numériques pour les ordinateurs. Une grande échelle de chercheurs a commencé à évoluer lorsque l'Association pour la traduction automatique et la linguistique informatique a émergé aux États-Unis et que l'Académie nationale des sciences a formé un conseil (ALPAC) pour étudier la traduction automatique.
La MT est mise en place en 1970, avec l'Institut Français du Textile pour traduire les résumés depuis et vers le français, l'anglais, l'allemand et l'espagnol. Diverses sociétés de traduction automatique sont lancées, dont Trados (1984), qui est la première à améliorer et à commercialiser la technologie de mémoire de traduction (TM) en 1989.
Ces dernières années, la technologie de traduction automatique a évolué vers une nouvelle dimension, et un futur clin d'œil prometteur nous est adressé alors que la recherche sur la traduction automatique neuronale continue de construire une nouvelle ère pour l'industrie.
Traduction automatique neuronale
Utilisant les avantages technologiques du Deep Learning, la traduction automatique neurale domine aujourd'hui les efforts de développement de la traduction automatique sur tous les continents. En tant que sous-domaine de la linguistique informatique, la traduction automatique neurale est essentiellement une application de Deep Learning dans laquelle un algorithme est formé par des quantités massives d'ensembles de données de textes traduits. Il utilise essentiellement un modèle de prédiction, codant d'abord le texte source en nombres et le décodant en un texte final dans la langue demandée. Expliqué très simplement, parmi toutes les possibilités, l'algorithme sélectionne le groupe de mots qui ont la plus grande probabilité d'être vus ensemble et le montre comme la traduction finale. Plus vous avez de données de traduction pour alimenter votre machine, plus vous vous rapprochez d'une traduction plus naturelle, car les touches stylistiques et le contexte sont également détectés par les algorithmes. Mais vous devez vous assurer que les entrées sont très propres pour entraîner correctement le moteur. Ainsi, la qualité de votre moteur de traduction automatique neuronale dépend de la quantité mais aussi de la qualité des données de traduction originales que vous utilisez pour entraîner vos algorithmes.
Jusqu'à présent, même si les moteurs de traduction automatique ont amélioré la qualité de la sortie, il existe un problème de confiance sur le contenu et les textes qui seront utilisés de manière professionnelle. Ce qui vient ensuite est une solution de contournement pour des traductions de qualité acceptable avec un processus hybride, la traduction automatique suivie d'une vérification humaine, c'est-à-dire la post-édition.
La tendance de la post-édition dans l'industrie de la traduction
Alors que les données de traduction disponibles numériquement connaissent une croissance exponentielle et que le Deep Learning a ouvert les portes d'une traduction automatique de meilleure qualité, le premier réflexe des acheteurs de services de traduction professionnels a été de voir s'ils pouvaient réduire les coûts en utilisant la traduction automatique dans leurs processus de traduction. Comme la sortie de la traduction automatique n'est pas encore « prête pour le client », mais qu'elle s'est encore considérablement améliorée, les consommateurs de services de traduction ont commencé à demander la post-édition de la traduction automatique pour des traductions plus rapides et moins chères avec une qualité « acceptable ». Le post-éditeur ne reformulera ni ne retraduira mais corrigera les éventuelles erreurs de sens et rendra le texte cohérent. Le ton sera peut-être un peu robotique, mais le sens restera le même.
Alors que la pandémie de COVID accélérait le contenu du commerce électronique dans plusieurs langues, le besoin de traductions rapides et bon marché est devenu réel pour un grand nombre de PME. Les salons et événements ont été annulés, les voyages interdits pendant des mois et les PME ont commencé à dépendre davantage des ventes en ligne que de leurs méthodes de vente traditionnelles. Dans ce contexte, la post-édition de traduction automatique s'est imposée comme une solution précieuse pour ces PME. Ce phénomène a été observé par un grand nombre de Prestataires de Services Linguistiques et une brève explication a également été donnée par Florian Faes, fondateur de Slateur , et l'événement de l'industrie de la langue SlatorCon, qui s'est tenu à distance et en ligne à Juillet 2020 .
Même pour les grandes entreprises développant leurs propres moteurs de traduction automatique, le service de post-édition de traduction automatique semble être le seul dont un fournisseur de services linguistiques (LSP) ait besoin. Par exemple, le service Watson Language Translator d'IBM est utilisé en interne par IBM comme outil de traduction, mais il semble que la sortie doit encore être vérifié .
Au fur et à mesure que la demande façonne l'offre, les prestataires de services linguistiques ont commencé à proposer régulièrement le service de post-édition de traduction en tant qu'option de traduction moins chère mais valable aux grandes entreprises, au grand désarroi des vétérans de l'industrie et des traducteurs professionnels. Les arguments contre cette tendance se multiplient également et ont des arguments solides.
La traduction humaine, toujours la meilleure option pour un contenu de haute qualité
Dans la course entre les machines et les humains, la traduction automatique rattrape d'énormes progrès tandis que les humains progressent également dans la fourniture d'outils technologiques plus rapides, mais apparemment pas assez rapidement. La traduction humaine reste aujourd'hui la meilleure option pour un contenu créatif et de haute qualité. Et il y a quelques points valables à l'appui de cela.
Le manque de processus dans la gestion de la qualité et des risques lors de l'utilisation de la traduction automatique dans les industries critiques (médical et pharmaceutique par exemple pour les conséquences sur la santé des personnes, et financier et juridique pour les conséquences financières sur les entreprises) pose un problème pour la mise en œuvre de solutions de traduction automatique à grande échelle dans ces industries. La responsabilité en cas d'erreurs de traduction est difficile à résoudre. Personne ne veut vraiment prendre le risque. La post-édition fait son chemin, car il y a une vérification humaine et cela limite les risques, mais cela ne résout toujours pas le problème de savoir où placer le moteur de traduction automatique dans la chaîne de responsabilité.
Si votre contenu n'est pas très technique, vous avez besoin d'un ton moins formel ou vous voulez être créatif, eh bien, les machines ne sont pas encore là. Les traductions automatiques sont principalement alimentées par des traductions officielles (disponibles gratuitement en gros volumes et dans de nombreuses langues), différentes versions linguistiques de sites Web d'entreprise. C'est là que les ensembles de données massifs sont disponibles. En ce qui concerne le contenu créatif, il est plus difficile pour une machine de dupliquer le style et la sensation du texte, car il n'y a pas assez d'entrée dans la plupart des langues. Soit dit en passant, dans les entreprises qui utilisent la traduction automatique et la post-édition de traduction automatique pour créer de nouvelles versions de leur site Web par exemple, ou pour traduire leurs publications et articles de blog, il est conseillé à la personne qui créera le contenu source (souvent en anglais) de s'abstenir d'utiliser des figures de style spécifiques dans le texte. La qualité du texte source est alors limitée à ce qui sera traduisible correctement par une machine, ce qui crée à son tour un ressenti global médiocre sur le contenu disponible. Si vous utilisez des traductions humaines professionnelles, vous n'avez pas vraiment besoin d'y penser pour obtenir un texte de haute qualité dans n'importe quelle langue…
Un dernier point, concernant la qualité et les préoccupations concernant l'utilisation généralisée de la post-édition de la traduction automatique par rapport aux traductions humaines, est le suivant : comme les traductions automatiques post-éditées créent de nouveaux ensembles de données massifs qui alimentent les moteurs, l'"évolution" et la formation des machines deviennent problématiques. Si nous voulons obtenir des résultats de haute qualité avec une solution de traduction automatique, nous devons l'alimenter avec des aliments de haute qualité. Jusqu'à présent, la plupart des solutions de traduction automatique étaient entraînées par des traductions humaines de bonne qualité. Que se passera-t-il lorsque la plupart des ensembles de données de traduction nouvellement disponibles résulteront de la post-édition de la traduction automatique ? Eh bien, les préoccupations sont que vous ne pouvez pas vraiment obtenir de meilleurs résultats d'une machine si vous n'utilisez pas les bonnes données.
En bref, si vous recherchez des traductions rapides, bon marché et de qualité médiocre, mais généralement correctes, vous pouvez opter pour la post-édition de la traduction automatique. Si la façon dont vous vous adressez aux gens dans la langue cible dans laquelle vous souhaitez traduire votre contenu vous tient vraiment à cœur, si vous recherchez un contenu qui générera un trafic et des revenus réels, optez pour un double regard professionnel : la traduction professionnelle suivie d'une relecture est votre solution, et de nombreux fournisseurs de services de traduction seront plus qu'heureux de vous servir.
Obtenez une consultation de traduction gratuite de notre équipe
Nous contacter