Plateforme PAPTAN
Plateforme pour l’apprentissage profond pour la traduction automatique neuronale, coordonnée par CLILLAC-ARP, Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus-Atelier de Recherche sur la Parole, dirigé par Prof. Natalie KÜBLER.
Le projet a été financé en 2021 par les fonds du Comité Plateformes et Équipements Scientifiques d’Université Paris Cité.
PAPTAN permet d’entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.
Architecture de la plateforme
PAPTAN est adossée à la plateforme PNS-UP utilisée pour la formation et recherche en traduction spécialisée :
- Plateforme PNS-UP (SYSTRAN Pure Neural® Server). Ce serveur de traduction permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web ;
- SYSTRAN Model Studio Lite : serveur d’entrainement de modèles spécialisés paramétré pour les applications des industries de la langue ;
- SYSTRAN Model Studio Advanced : serveur d’entrainement de modèles spécialisés avec des fonctionnalités avancées permettant d’accéder aux GPUs de la plateforme PAPTAN ;
- Accès SSH aux GPUs de la plateforme PAPTAN pour les administrateurs (après la validation de la demande par les coordinateurs).
Coordinateurs
Natalie Kübler UFR EILA
Directrice du CLILLAC-ARP, EA 3967
natalie.kubler@u-paris.fr
Nicolas Ballier UFR Études anglophones
CLILLAC-ARP, EA 3967
nicolas.ballier@u-paris.fr
Maria Zimina-Poirot UFR EILA
CLILLAC-ARP, EA 3967
maria.zimina-poirot@u-paris.fr
Administrateurs
Jean-Baptiste Yunès IRIT
Jean-Baptiste.Yunes@u-paris.fr
Guillaume Wisniewski LLF
guillaume.wisniewski@u-paris.fr
Actualités
Tralogy III
Atelier SPECTRANS / PAPTAN
le 7 avril 2022
Formations à l’utilisation de la plateforme PAPTAN
mai 2022
Contacts :
nicolas.ballier@u-paris.fr
maria.zimina-poirot@u-paris.fr
Publications
Nicolas Ballier, Dahn Cho, Bilal Faye, Zong-You Ke, Hanna Martikainen, et al. The SPECTRANS System Description for the WMT21 Terminology Task. EMNLP 2021 SIXTH CONFERENCE ON MACHINE TRANSLATION (WMT21), ACL, Nov 2021, Punta Cana, Dominican Republic. pp.815-820. ⟨hal-03574680⟩
Christopher Gledhill, Maria Zimina-Poirot. The Impact of Machine Translation on a Masters Course in Web Translation: From Disrupted Practice to a Qualitative Translation/Revision Workflow. Translating and the Computer 41, AsLing, The International Association for Advancement in Language Technology, Nov 2019, London, United Kingdom. pp.60-73. ⟨hal-02522883⟩
Natalie Kübler, Hanna Martikainen, Alexandra Mestivier, Mojca PECMAN (sous presse). Post-editing neural machine translation in specialised languages: the role of corpora in the translation of phraseological structures. In Monti, Johanna, Gloria Corpas Pastor and Mitkov, Ruslan (eds.) Recent advances in Multiword Units in Machine Translation and Translation Technology. Amsterdam/Philadelphia: John Benjamins Publishing Company.
Natalie Kübler, Alexandra Mestivier, Mojca Pecman (sous presse). Using comparable corpora for translating and post-editing complex noun phrases in specialised texts: Insights from English-to-French in specialised translation. In S. Granger and M-A. Lefer (eds.), Extending the scope of corpus-based translation studies, “Advances in Translation” series, London/Oxford/New York/New Delfi/Sydney: Bloomsbury Publishing Plc. (Selection of papers from Using Corpora in Contrastive and Translation Studies (5th edition) UCCTS 2018, Louvain-la-Neuve, Belgium, 12-14 September 2018).
Maria Zimina-Poirot, Christopher Gledhill. L’impact de la traduction automatique sur les pratiques langagières et professionnelles des apprentis-traducteurs : entre apports en efficacité et menaces pour la diversité des discours. Jean-Claude Beacco; José Carlos Herreras; Christian Tremblay. Traduction automatique et usages sociaux des langues. Quelles conséquences pour la diversité linguistique ?, 2021 (3), Observatoire européen du plurilinguisme, pp.63-81, 2021, Plurilinguisme. ⟨hal-03511177⟩
Maria Zimina-Poirot, Nicolas Ballier, Jean-Baptiste Yunès. Approches quantitatives de l’analyse des prédictions en traduction automatique neuronale (TAN). JADT 2020 : 15èmes Journées Internationales d’Analyse statistique des Données Textuelles, Université de Toulouse, Jun 2020, Toulouse, France. ⟨hal-03049589⟩
À lire aussi
Augmentation des cas de scorbut chez les enfants en France depuis la pandémie de COVID-19
Les équipes du service de pédiatrie générale et du centre de référence des rhumatismes inflammatoires et maladies auto-immunes systémiques de l’enfant (RAISE) de l’hôpital Robert-Debré AP-HP, de l’Inserm, de l’université Paris Cité et du département de pédiatrie de...
lire plusUn laboratoire d’astrochimie et d’exobiologie de nouvelle génération en orbite autour de la Terre
Mardi 17 décembre 2024, un dispositif expérimental tout à fait inédit, conçu et assemblé au Laboratoire interuniversitaire des systèmes atmosphériques en collaboration avec le CNES, a été installé à l’extérieur de la Station spatiale internationale (ISS), sur la plateforme Bartolomeo d’Airbus, pour une durée d’un an.
lire plusFélicitations aux lauréates et lauréats UPCité 2024 des Prix solennels de thèse de la Chancellerie des universités de Paris !
C'est avec une immense fierté que nous saluons aujourd'hui les 11 lauréates et lauréats UPCité des Prix solennels de thèse de la Chancellerie des universités de Paris, figures emblématiques de la recherche scientifique et médicale. « Ces jeunes...
lire plus[Paris-Dakar] Renforcement du partenariat lors du colloque sur les maladies non transmissibles
Le 25 novembre 2024 s’est tenu à Dakar, le colloque international sur les maladies non transmissibles organisé par l’université Paris Cité, l’université Cheikh Anta Diop (UCAD) et le réseau African Research Network. Cet événement s’inscrit dans une démarche visant à...
lire plus