Votre publicité ici avec IMPACT_medias

Suisse: de nouvelles techniques pour une meilleure traduction automatique

Le Fonds national suisse soutient un projet qui permettrait aux traducteurs automatiques de saisir l'ensemble du texte et non plus chaque mot individuellement. La recherche aiderait des outils comme Google traduction, notamment, qui traite près de 100 milliards de mots par jours.

03 avr. 2017, 08:33
Les systèmes de traduction automatique ne comprennent pas vraiment le sens du texte selon Andrei Popescu-Belis.

En travaillant phrase par phrase, les algorithmes de traduction omettent une grande partie du contexte et font des erreurs. Un projet soutenu par le Fonds national suisse (FNS) a développé de nouvelles techniques afin qu’ils considèrent mieux l’ensemble du texte.

Le célèbre Google Translate traite quotidiennement quelque 100 milliards de mots. Informaticiens et linguistes ont été les premiers à montrer qu'il était possible d'améliorer les systèmes de traduction en forçant l'intelligence artificielle à dépasser le simple "phrase à phrase" et à croiser des informations contenues ailleurs dans le texte.

Cette démarche fait aujourd'hui l'objet de travaux dans le monde entier. Des scientifiques suisses ont dévoilé leurs derniers résultats lundi lors d'une conférence de l'Association for Computational Linguistics à Valence (E).

Traduire sans comprendre

"Les systèmes de traduction automatique ne comprennent pas vraiment le sens des textes", explique Andrei Popescu-Belis, responsable du Natural Language Processing Group à l'Institut de recherche Idiap à Martigny (VS), cité dans un communiqué du FNS.

"Ils opèrent un rendu d'une langue vers une autre, en suivant des règles statistiques. Et surtout, ils travaillent phrase par phrase. Or une phrase isolée ne comporte souvent pas assez d'informations sur le contexte pour pouvoir être traduite correctement", poursuit le spécialiste.

Le piège de la statistique

Le système est induit en erreur, car il sait que le qualificatif "pas très jolie" s'applique plus souvent à des personnes qu'à des objets. Si on le substitue par "rouillée" ou "en panne", plus fréquemment appliqués aux objets, le pronom aura plus de chances d'être correctement traduit par "it".

Pour obtenir un résultat pertinent, le traducteur automatique aurait dû considérer les informations contenues dans la première phrase. C'est dans les grandes lignes ce que fait le système mis au point par les chercheurs de l'Idiap en collaboration avec les départements de linguistique des universités de Genève et d'Utrecht (NL) ainsi que l'Institut de linguistique computationnelle de l'Université de Zurich.

Votre publicité ici avec IMPACT_medias