Plateforme PAPTAN

Plateforme pour l’apprentissage profond pour la traduction automatique neuronale, coordonnée par CLILLAC-ARP, Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus-Atelier de Recherche sur la Parole, dirigé par Prof. Natalie KÜBLER.

Le projet a été financé en 2021 par les fonds du Comité Plateformes et Équipements Scientifiques d’Université Paris Cité.

PAPTAN permet d’entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.

Architecture de la plateforme

PAPTAN est adossée à la plateforme PNS-UP utilisée pour la formation et recherche en traduction spécialisée :

  • Plateforme PNS-UP (SYSTRAN Pure Neural® Server). Ce serveur de traduction permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web ;
  • SYSTRAN Model Studio Lite : serveur d’entrainement de modèles spécialisés paramétré pour les applications des industries de la langue ;
  • SYSTRAN Model Studio Advanced : serveur d’entrainement de modèles spécialisés avec des fonctionnalités avancées permettant d’accéder aux GPUs de la plateforme PAPTAN ;
  • Accès SSH aux GPUs de la plateforme PAPTAN pour les administrateurs (après la validation de la demande par les coordinateurs).

Coordinateurs

Natalie Kübler UFR EILA
Directrice du CLILLAC-ARP, EA 3967
natalie.kubler@u-paris.fr
Nicolas Ballier UFR Études anglophones
CLILLAC-ARP, EA 3967
nicolas.ballier@u-paris.fr
Maria Zimina-Poirot UFR EILA
CLILLAC-ARP, EA 3967
maria.zimina-poirot@u-paris.fr

Administrateurs

Jean-Baptiste Yunès IRIT
Jean-Baptiste.Yunes@u-paris.fr
Guillaume Wisniewski LLF
guillaume.wisniewski@u-paris.fr

Projets en relation avec PAPTAN

Actualités

Tralogy III

Atelier SPECTRANS / PAPTAN
le 7 avril 2022

Formations à l’utilisation de la plateforme PAPTAN

mai 2022

Contacts :
nicolas.ballier@u-paris.fr
maria.zimina-poirot@u-paris.fr

Publications

Nicolas Ballier, Dahn Cho, Bilal Faye, Zong-You Ke, Hanna Martikainen, et al. The SPECTRANS System Description for the WMT21 Terminology Task. EMNLP 2021 SIXTH CONFERENCE ON MACHINE TRANSLATION (WMT21), ACL, Nov 2021, Punta Cana, Dominican Republic. pp.815-820. ⟨hal-03574680⟩

Christopher Gledhill, Maria Zimina-Poirot. The Impact of Machine Translation on a Masters Course in Web Translation: From Disrupted Practice to a Qualitative Translation/Revision Workflow. Translating and the Computer 41, AsLing, The International Association for Advancement in Language Technology, Nov 2019, London, United Kingdom. pp.60-73. ⟨hal-02522883⟩

Natalie Kübler, Hanna Martikainen, Alexandra Mestivier, Mojca PECMAN (sous presse). Post-editing neural machine translation in specialised languages: the role of corpora in the translation of phraseological structures. In Monti, Johanna, Gloria Corpas Pastor and Mitkov, Ruslan (eds.) Recent advances in Multiword Units in Machine Translation and Translation Technology. Amsterdam/Philadelphia: John Benjamins Publishing Company.

Natalie Kübler, Alexandra Mestivier, Mojca Pecman (sous presse). Using comparable corpora for translating and post-editing complex noun phrases in specialised texts: Insights from English-to-French in specialised translation. In S. Granger and M-A. Lefer (eds.), Extending the scope of corpus-based translation studies, “Advances in Translation” series, London/Oxford/New York/New Delfi/Sydney: Bloomsbury Publishing Plc. (Selection of papers from Using Corpora in Contrastive and Translation Studies (5th edition) UCCTS 2018, Louvain-la-Neuve, Belgium, 12-14 September 2018).

Maria Zimina-Poirot, Christopher Gledhill. L’impact de la traduction automatique sur les pratiques langagières et professionnelles des apprentis-traducteurs : entre apports en efficacité et menaces pour la diversité des discours. Jean-Claude Beacco; José Carlos Herreras; Christian Tremblay. Traduction automatique et usages sociaux des langues. Quelles conséquences pour la diversité linguistique ?, 2021 (3), Observatoire européen du plurilinguisme, pp.63-81, 2021, Plurilinguisme. ⟨hal-03511177⟩

Maria Zimina-Poirot, Nicolas Ballier, Jean-Baptiste Yunès. Approches quantitatives de l’analyse des prédictions en traduction automatique neuronale (TAN). JADT 2020 : 15èmes Journées Internationales d’Analyse statistique des Données Textuelles, Université de Toulouse, Jun 2020, Toulouse, France. ⟨hal-03049589⟩

À lire aussi

Pause, un programme pour se reconstruire

Pause, un programme pour se reconstruire

Dans le cadre du programme PAUSE, lancé par le Collège de France, Université Paris Cité accompagne et accueille les chercheuses et chercheurs en danger contraint.e à l’exil. Depuis son lancement en 2017, plus de 17 chercheurs et chercheuses ont pu exercer leur activité au sein des laboratoires d’Université Paris Cité

lire plus