URL: https://linuxfr.org/news/omegat-logiciel-de-traduction-assistee-par-ordinateur-tao-en-version-6-0 Title: OmegaT logiciel de traduction assistée par ordinateur (TAO) en version 6.0 Authors: WalterPolo dourouc05, tisaac, lejocelyn, L'intendant zonard, BAud, Ysabeau, 11321, Nÿco, Benoît Sibaud et bobble bubble Date: 2023-03-13T14:34:56+01:00 License: CC By-SA Tags: traduction Score: 6 La version 6.0 du logiciel professionnel de traduction assistée par ordinateur (TAO) OmegaT vient d’être publiée. Comme ce logiciel a plus de vingt ans et que la version 6.0 apporte de multiples améliorations depuis la dernière version “stable” (4.3.3, mars 2022), je pense qu’il vaut la peine de faire un point sur cet outil à mon avis peu ou mal connu, rarement abordé sur LinuxFr.org et [il y a bien longtemps](https://linuxfr.org/news/le-libre-et-les-memoires-de-traduction). Dans cette dépêche, vous trouverez donc une brève introduction sur ce type de logiciels professionnels, une description des nouveautés que je juge intéressantes depuis la version 4.3.3, un avis parfaitement subjectif sur l’outil par rapport à d’autres outils professionnels non libres et puis, bien sûr, les références nécessaires pour celles et ceux qui souhaitent aller voir de plus près. ---- ---- Présentation générale ======== OmegaT est un logiciel professionnel de la famille des outils de traduction assistée par ordinateur (TAO) dits à « [[mémoire de traduction]] ». Dans ce type de logiciels, lorsque le traducteur saisit une traduction (OmegaT permet à l’utilisateur de définir la manière dont le texte est segmenté en unités de traduction), celle-ci est enregistrée dans une base de données : la « mémoire de traduction ». Au fur et à mesure que le traducteur accumule des traductions, le logiciel repère les similitudes avec les traductions enregistrées dans sa mémoire, et lui propose les segments qu’il identifie comme équivalents ou suffisamment proches pour aider le traducteur. Traditionnellement, ces outils intègrent également une fonctionnalité de gestion de la terminologie, autrement dit de gestion de glossaires, ainsi qu’un outil d’alignement (conversion de textes originaux et de leur traduction en mémoire de traduction). Ces outils proposent en outre toute une série de fonctions secondaires d’aide à la traduction, telle la production de statistiques pour la gestion de projet de traduction, un ou plusieurs vérificateurs orthosyntaxiques, des contrôles de la qualité formelle, etc. Enfin, ils disposent souvent d’un « écosystème » (extensions, greffons, voire API ou SDK, etc. et communauté d’utilisateurs) assez riche. La technologie originelle (mémoire de traduction) sous-jacente à ces logiciels, qui a émergé durant les années 1980-1990, est arrivée à maturité durant la première décennie 2000. Les principales évolutions de ces outils depuis lors ont été l’élargissement de leurs fonctionnalités à l’intégration de la traduction automatique et, plus récemment, à la disponibilité dans le nuage (cloud, SaaS). OmegaT est un outil libre (GPL 3), gratuit et multiplateforme (basé sur Java). Il est développé bénévolement par des traductaires[^1] pour des traductaires (de temps à autre, des particuliers ou entreprises financent un développement particulier pour satisfaire leurs besoins et toute la communauté en bénéficie). Il dispose de toutes les fonctionnalités susmentionnées et permet l’interaction avec d’autres outils du marché en se conformant aux formats d’interopérabilité minimale adoptés par le secteur de la traduction professionnelle[^2] (et quand il s’en écarte, des outils externes permettent la conversion à ces formats). En termes de pérennité, vous aurez lu plus haut que l’outil a plus de vingt ans (la première sortie date du 28 novembre 2002)… Enfin, je ne dispose d’aucune donnée exacte sur sa popularité (les responsables du projet fondent en général leur estimation sur le nombre de téléchargements de l’outil), mais je sais qu’il est utilisé par de nombreux professionnels, y compris au sein d’organisations comme le Linux Professional Institute (LPI), et qu’un [fork](http://185.13.37.79/) est développé au sein de la Commission européenne. Principales améliorations et nouveautés depuis la version 4.3.3 ========= Entre la version 4.3.3 de mars 2022 et la version 5.8.0, ce sont pas moins de 80 améliorations et 87 corrections de bogues qui sont documentées. Mon choix est ici évidemment subjectif[^3]. * **Documentation** * Un énorme travail a été investi dans une refonte approfondie de la forme et du fond du _Guide de l’utilisateur_ (en anglais -- les versions localisées suivront) de manière, entre autres, à couvrir bon nombre des fonctionnalités auparavant peu ou non documentées. Le guide d’apprentissage rapide qui s’affiche à l’ouverture d’OmegaT a été revu dans le même esprit. * **Interface utilisateur (ergonomie)** * Nouvelles valeurs par défaut de l’Éditeur. * Nouveaux raccourcis clavier : pour naviguer entre l’Éditeur et le volet Notes, par exemple. * **Mémoires de traduction** * Il est désormais possible de spécifier dans les propriétés d’un projet le dossier dans lequel les mémoires de traduction seront enregistrées lors de la création des documents traduits. Il est en outre aussi possible de spécifier quelles mémoires doivent être exportées (level-1, level-2 et/ou OmegaT ou aucune). * **Traduction automatique (TA)** * OmegaT ignore désormais les propositions des moteurs de TA renvoyant une erreur _403: Forbidden_ lors du parcours des propositions (`Ctrl` + `M`). * Quand les propositions de plusieurs moteurs de TA sont affichées dans le volet Traduction automatique, ces propositions sont triées par ordre du nom des moteurs de TA et la proposition active est en surbrillance ; en outre, une fois une proposition récupérée (`Ctrl` + `M`), le nom du moteur de traduction associé est visible dans le volet Propriétés du segment, ce qui permet de garder cette information pour la suite du projet de traduction. * **Glossaires** * Il est désormais possible d’utiliser des hyperliens vers des fichiers locaux (et plus uniquement des ressources en ligne) dans le champ de commentaire associé à une entrée de glossaire. * Quand un terme souligné dans l’Éditeur a plusieurs entrées qui lui correspondent dans le glossaire, il est possible de voir les commentaires associés à chacun en pointant la souris sur le terme. [pas sûr que je vais garder car potential bug -it works when hovering over the term while the RFE states it is in the context menu; in the context menu, only the first comment is shown for all alphabetically sorted entries; and, enhanc. request: no word wrap so that text may go beyond the screen] * Quand un segment comporte plusieurs termes, les entrées correspondantes dans le volet Glossaires sont triées par ordre alphabétique, indépendamment du glossaire dont elles proviennent. * Le volet Glossaires propose désormais deux modes d’affichage (thèmes), et les couleurs des termes source, cible et du commentaire associé sont paramétrables (un système pour la mise en place de thèmes supplémentaires est aussi désormais disponible pour les développeurs). * **Alignement** * Quand un alignement est exécuté en mode ligne de commande, il est désormais possible de générer un fichier [TMX](https://en.wikipedia.org/wiki/Translation_Memory_eXchange) avec des traductions alternatives (à condition que la propagation automatique soit désactivée dans les propriétés du projet). * **Statistiques** * La génération de statistiques en mode Ligne de commande est désormais possible au format texte, XML et JSON. * **Dictionnaires** * Ajout de la prise en charge de l’API d’accès à l’_Oxford Dictionary_ en ligne. * Ajout de la gestion des fichiers audio et de l’affichage des images associées aux entrées des dictionnaires (du type DSL et autre). * **Filtres de fichiers** * Intégration des filtres [StAX](https://en.wikipedia.org/wiki/StAX). Ces filtres auparavant disponibles sous la forme d’extensions (greffons) et originellement proposés dans la bifurcation (*fork*) DGT-OmegaT permettent entre autres un meilleur traitement des fichiers [[en:XLIFF]]. * Ajout d’un filtre pour [les fichiers de langue Joomla](https://docs.joomla.org/Portal:Developers/Localisation/en). * **Projet en équipe** * Le partage d’authentification entre dépôts SVN ou Git est désormais possible (s’ils sont sur le même serveur). * Les fichiers répondant aux motifs .git, .hg et .repositories sont désormais ignorés. * Le nom donné à la branche Git peut désormais être tout autre chose que “master”. * **Maîtrise des expressions rationnelles** * Les expressions rationnelles (regex) sont souvent une source de difficultés pour les traductaires. On peut parfaitement utiliser OmegaT sans y recourir ; toutefois, une maîtrise minimale des regex est requise pour la définition des règles de segmentation des textes, et très utile pour les recherches et recherches-remplacement “avancées”, et d’autres usages spécialisés (comme le traitement des balises personnalisées). La documentation de la nouvelle version veille à y consacrer une annexe entière visant à en faciliter la prise en main sans (trop) de prise de tête. Mon avis =========== Pour avoir utilisé tant des outils commerciaux et privatifs que libres, tel OmegaT, dans le cadre professionnel de la gestion de projets multilingues, je crois pouvoir affirmer que, malgré les points soulevés ci-dessous, cet outil soutient parfaitement la comparaison. Un point essentiel pour les traductaires professionnels, qui se trouvent confrontés à des demandes de recours à tel ou tel logiciel de TAO par les commanditaires de traduction, est d’avoir la possibilité d’éviter de devoir s’équiper de chacun de ces outils (commerciaux et payants) pour pouvoir satisfaire la demande (le basculement vers les plateformes dans le nuage ne change pas vraiment la donne, l’assujettissement au fournisseur (vendor lock-in) restant identique). Dans le secteur de la traduction, une poignée d’acteurs commerciaux (dont les logiciels sont au demeurant excellents) sont en position de force. Or, moyennant le respect de quelques procédures et contraintes techniques, OmegaT permet de satisfaire dans la majorité des cas les demandes de ces commanditaires sans devoir posséder le logiciel commercial X ou Y -- s’il est du reste une lacune que je déplore dans la documentation d’OmegaT, c’est l’absence d’une section relative aux manières de faire en la matière (heureusement, la liste de diffusion Users est hyper-réactive et il ne manque pas d’utilisataires pour pallier cette carence). Et quand le commanditaire ne subordonne pas sa demande au recours à un logiciel particulier, OmegaT joue dans la même cour que les grands. D’après moi, le principal obstacle à l’adoption du logiciel (hormis la force de frappe du marketing des acteurs commerciaux) ne tient pas tant à l’outil et aux fonctionnalités qu’il offre ou pas qu’à la maîtrise par les traductaires de leurs outils informatiques professionnels. Souvent biberonnés aux solutions tout-en-un, de l’OS aux logiciels spécialisés mis en œuvre, bon nombre se trouvent dépourvus dès lors qu’ils doivent sortir des sentiers battus. En d’autres termes, si la prise en main d’OmegaT est facile (courbe d’apprentissage très faible pour les fonctions essentielles) et alors que bon nombre d’opérations sont réalisables sans quitter cet environnement de traduction, d’autres opérations un peu plus “techniques” (tiens, voilà un format de fichier que je connais pas et mon outil n’a pas de filtre pour celui-là, je fais quoi ?) requièrent la maîtrise de notions informatiques élémentaires mais essentielles et le recours à des procédures engageant des outils externes plutôt qu’à des solutions intégrées (si j’osais, je renverrais à la métaphore de la cathédrale et du bazar). Cette exigence de compétence est en réalité un avantage, car elle apporte une maîtrise forte de son système informatique (que ce soit sous Mac ou MS Windows, je ne parle pas forcément des linuxiens ici), qui va bien au-delà des outils de traduction en tant que tels. Notons que cette compétence est également requise pour les outils commerciaux (notamment la définition d’un filtre pour un dialecte XML particulier ou pour un format texte requérant le recours aux expressions rationnelles pour le filtrage du texte à traduire), mais ceux-ci intègrent le plus souvent directement les solutions à appliquer au sein de leur interface (et y confinent l’utilisateur, qui ne voit pas toujours que la solution appliquée en l’espèce est en réalité une solution applicable de manière générale, en dehors de l’outil utilisé). Pour ce qui est des points faibles d’OmegaT, j’en identifie trois, non rédhibitoires, mais qui mériteraient certainement des améliorations. 1. La réintégration des modifications apportées en dehors d’OmegaT à un document traduit avec OmegaT (pour disposer de mémoires de traduction à jour). Il existe bien quelques solutions, mais il n’existe pas de solution réellement satisfaisante en termes de productivité. Notons aussi au passage que, pour ce qui est du suivi des intervenants (traducteur, réviseur, relecteur, par exemple), des solutions plus efficaces que celles existantes semblent se dessiner. 2. L’absence d’outil intégré pour la maintenance des mémoires de traduction. Là aussi, il existe évidemment des solutions externes, mais une routine intégrée faciliterait la gestion de projets à plus grande échelle et dans le temps. 3. La gestion insatisfaisante des possibilités offertes par le format de glossaire interopérable [TBX](https://en.wikipedia.org/wiki/TermBase_eXchange) (hormis cela, OmegaT peut lire les fichiers TBX, mais pas les créer ou les modifier et ceci vaut aussi pour bon nombre des outils commerciaux ; il utilise un format tabulaire pour ses propres glossaires). Pour aller plus loin ======== ### Télécharger OmegaT OmegaT est proposé en deux versions : la version standard (stable) ou récente (latest). Ces versions sont proposées avec ou sans Java (JRE) pour chaque plateforme (Linux, Mac, MS Windows) et une version multiplateforme sans Java est également disponible. Ordinairement, les versions récentes sont très proches des versions stables, mais permettent en outre de bénéficier des dernières améliorations logicielles ou corrections de bogues. L’utilisateur novice préférera la version stable, l’utilisateur familier la version récente. De toute manière, plusieurs versions d’OmegaT peuvent être installées dans des répertoires (dossiers) parallèles, les paramètres de l’application étant, par défaut, partagés entre toutes les versions installées. Note : pour les développaires ou celles et ceux qui souhaitent profiter des dernières améliorations sans craindre les bogues, il y a aussi les versions master et *nightly builds* ;-). Tout est téléchargeable à partir de la page des [téléchargements](https://omegat.org/fr/download). ### Communauté de coopération L’entraide est un des points forts d’OmegaT et se fait pour l’essentiel au travers de listes de diffusion (liste [Utilisateurs](https://sourceforge.net/projects/omegat/lists/omegat-users) et [Développeurs](https://lists.sourceforge.net/lists/listinfo/omegat-development)). Ces listes sont extrêmement réactives, bienveillantes (y compris à l’égard de celles ou ceux qui ne consultent pas le manuel) et l’anglais n’y est pas la seule langue d’échange (youpie !). Notez que d’autres canaux sont utilisés, mais de manière bien plus confidentielle ([Mastodon](https://piaille.fr/@OmegaTOfficial@floss.social) par exemple). [^1]: je sais la sensibilité de certain·e·s à l’écriture inclusive, etc. sur linuxfr, et il ne s’agit pas ici de provocation, mais comme j’en ai marre d’écrire chaque fois “traducteurs et traductrices” (ou l’inverse) - d’autant plus dans un secteur professionnel qui me semble essentiellement féminin [simple impression, pas de fondement scientifique] -- et de me faire reprendre si j’osais traduct·eur·rice ou traducteurice ou encore traducteur·e, j’adopte volontiers la proposition 'traductaire' (sur le modèle du suffixe 'secrét-aire'). [^2]: le secteur s’est doté de normes pour une interopérabilité minimale concernant le format des mémoires de traduction ([TMX](https://www.gala-global.org/oscarStandards/tmx/)), le format des glossaires ([TBX](https://www.iso.org/fr/standard/62510.html)), le format des règles de segmentation des textes ([SRX](https://www.gala-global.org/srx-20-april-7-2008)), les métriques ([GMX](https://www.unicode.org/uli/pas/gmx-v/)) et le format d’échange des données textuelles multilingues ([XLIFF](http://docs.oasis-open.org/xliff/xliff-core/v2.1/os/xliff-core-v2.1-os.html), originellement dédié à la localisation, mais utilisé bien plus largement aujourd’hui). Hormis GMX, tous ces formats sont ordinairement supportés par les acteurs du secteur. [^3]: si vous voulez voir dans le détail toutes les améliorations et corrections de bogue apportées depuis la version 4.3.3, il vous suffit de passer par la commande Dernières modifications du menu Aide. ### Ressources supplémentaires Je liste ci-dessous quelques ressources supplémentaires (libres évidemment) qui permettent d’étendre les possibilités d’OmegaT. * **Scripts** * OmegaT peut être enrichi par des scripts codés en Groovy. L’application est fournie avec une série de scripts (dont certains à titre de démo) par défaut dans son dossier “Scripts”, mais d’autres scripts sont disponibles et il n’est pas toujours facile de savoir où les trouver… (il m’arrive souvent d’en découvrir l’existence via la liste Utilisateurs). Une série de scripts peuvent être trouvés à partir du [wiki SourceForge (section scripts)](https://sourceforge.net/p/omegat/wiki/Scripts/). Un autre point caractéristique d’OmegaT est que la fonctionnalité apportée par ces scripts se trouve parfois intégrée directement dans une version ultérieure de l’application (et permet du coup de se passer du script). Je n’en citerai qu’un seul en guise d’exemple, le script de scission ou fusion de segments de Kos Ivantsov [maybe 2 with manuel souto pico?]. * **Plugins** * OmegaT peut également être enrichi via des extensions (plugins). Comme pour les scripts, trouver des plugins n’est pas évident et la fonctionnalité de certains plugins se trouve parfois intégrée ultérieurement dans l’application. Pour les plus aventureux, les développeurs d’OmegaT fournissent [un modèle](https://github.com/omegat-org/plugin-skeleton) pour commencer son extension. * **Applications externes** * **Aligneurs -- [LFAligner](https://sourceforge.net/projects/aligner/)** : si vous souhaitez utiliser un aligneur autre que celui intégré à OmegaT, cet aligneur libre (GPL3) présente l’avantage de pouvoir traiter les documents à aligner par lots et dans plus de deux combinaisons de langues. Seul regret, depuis sa version 3.12, à moins d’être un utilisateur versé en Perl, il n’est directement accessible que sous MS Windows (.exe). * **Filtres de fichiers -- [Okapi Rainbow](https://okapiframework.org/wiki/index.php/Rainbow) et [MaxPrograms XliffManager](https://maxprograms.com/products/xliffmanager.html)** : ces deux applications libres (licence Apache 2.0 et licence Eclipse Public Licence 1.0 respectivement) offrent la possibilité de convertir divers types de fichiers vers le format standard XLIFF (et vice versa). On y recourra donc ordinairement pour pouvoir traiter avec OmegaT des formats de fichiers pour lesquels ce dernier ne propose pas de filtre. À titre personnel, XliffManager me semble plus accessible pour les traductaires (ergonomie de l’interface, courbe d’apprentissage très réduite et documentation simple) et offre toutes les fonctions nécessaires pour la gestion de fichiers XLIFF. Le recours à Okapi Rainbow n’est alors nécessaire que pour la conversion XLIFF de formats de données indisponibles dans XliffManager. De manière générale, Okapi Rainbow est très utile pour le traitement de fichiers XML. * **Création et configuration de filtres -- [Okapi Rainbow](https://okapiframework.org/wiki/index.php/Rainbow)** : outre la conversion de fichiers XLIFF, Okapi Rainbow, en bon couteau suisse pour les localisataires, offre la possibilité de créer des filtres personnalisés, fonctionnalité absente d’OmegaT. Rainbow propose en outre une série de filtres supplémentaires prêts à l’emploi pour OmegaT (sous la forme d’un plugin). Enfin, il offre la possibilité de convertir divers types de fichiers au format XLIFF (et vice versa) et de créer un package de projet pour la traduction des fichiers convertis avec OmegaT comme Okapi Rainbow. * **Assurance qualité -- [Okapi CheckMate](https://okapiframework.org/wiki/index.php/CheckMate)** : Checkmate, utilitaire du cadriciel libre Okapi (licence Apache 2.0) est un outil destiné à exécuter une série de contrôles linguistiques formels d’assurance qualité sur une paire de documents source et cible. Il complète utilement les contrôles qualité du même ordre intégrés à OmegaT. * **Maintenance des mémoires de traduction -- (MaxPrograms) TMXEditor** : cet outil libre (licence Eclipse Public Licence 1.0) mais payant (sauf compilation du code source, une tâche qui n’est pas à la portée de la majorité des traductaires d’ordinaire) est un de ces outils de maintenance auxquels je fais allusion plus haut quand j’évoque les lacunes courantes d’OmegaT. Ce relevé n’est certainement pas exhaustif ;-)