Plateforme PAPTAN
Plateforme pour l’apprentissage profond pour la traduction automatique neuronale, coordonnée par CLILLAC-ARP, Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus-Atelier de Recherche sur la Parole, dirigé par Prof. Natalie KÜBLER.
Le projet a été financé en 2021 par les fonds du Comité Plateformes et Équipements Scientifiques d’Université Paris Cité.
PAPTAN permet d’entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.
Architecture de la plateforme
PAPTAN est adossée à la plateforme PNS-UP utilisée pour la formation et recherche en traduction spécialisée :
- Plateforme PNS-UP (SYSTRAN Pure Neural® Server). Ce serveur de traduction permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web ;
- SYSTRAN Model Studio Lite : serveur d’entrainement de modèles spécialisés paramétré pour les applications des industries de la langue ;
- SYSTRAN Model Studio Advanced : serveur d’entrainement de modèles spécialisés avec des fonctionnalités avancées permettant d’accéder aux GPUs de la plateforme PAPTAN ;
- Accès SSH aux GPUs de la plateforme PAPTAN pour les administrateurs (après la validation de la demande par les coordinateurs).
Coordinateurs
Natalie Kübler UFR EILA
Directrice du CLILLAC-ARP, EA 3967
natalie.kubler@u-paris.fr
Nicolas Ballier UFR Études anglophones
CLILLAC-ARP, EA 3967
nicolas.ballier@u-paris.fr
Maria Zimina-Poirot UFR EILA
CLILLAC-ARP, EA 3967
maria.zimina-poirot@u-paris.fr
Administrateurs
Jean-Baptiste Yunès IRIT
Jean-Baptiste.Yunes@u-paris.fr
Guillaume Wisniewski LLF
guillaume.wisniewski@u-paris.fr
Actualités
Tralogy III
Atelier SPECTRANS / PAPTAN
le 7 avril 2022
Formations à l’utilisation de la plateforme PAPTAN
mai 2022
Contacts :
nicolas.ballier@u-paris.fr
maria.zimina-poirot@u-paris.fr
Publications
Nicolas Ballier, Dahn Cho, Bilal Faye, Zong-You Ke, Hanna Martikainen, et al. The SPECTRANS System Description for the WMT21 Terminology Task. EMNLP 2021 SIXTH CONFERENCE ON MACHINE TRANSLATION (WMT21), ACL, Nov 2021, Punta Cana, Dominican Republic. pp.815-820. ⟨hal-03574680⟩
Christopher Gledhill, Maria Zimina-Poirot. The Impact of Machine Translation on a Masters Course in Web Translation: From Disrupted Practice to a Qualitative Translation/Revision Workflow. Translating and the Computer 41, AsLing, The International Association for Advancement in Language Technology, Nov 2019, London, United Kingdom. pp.60-73. ⟨hal-02522883⟩
Natalie Kübler, Hanna Martikainen, Alexandra Mestivier, Mojca PECMAN (sous presse). Post-editing neural machine translation in specialised languages: the role of corpora in the translation of phraseological structures. In Monti, Johanna, Gloria Corpas Pastor and Mitkov, Ruslan (eds.) Recent advances in Multiword Units in Machine Translation and Translation Technology. Amsterdam/Philadelphia: John Benjamins Publishing Company.
Natalie Kübler, Alexandra Mestivier, Mojca Pecman (sous presse). Using comparable corpora for translating and post-editing complex noun phrases in specialised texts: Insights from English-to-French in specialised translation. In S. Granger and M-A. Lefer (eds.), Extending the scope of corpus-based translation studies, “Advances in Translation” series, London/Oxford/New York/New Delfi/Sydney: Bloomsbury Publishing Plc. (Selection of papers from Using Corpora in Contrastive and Translation Studies (5th edition) UCCTS 2018, Louvain-la-Neuve, Belgium, 12-14 September 2018).
Maria Zimina-Poirot, Christopher Gledhill. L’impact de la traduction automatique sur les pratiques langagières et professionnelles des apprentis-traducteurs : entre apports en efficacité et menaces pour la diversité des discours. Jean-Claude Beacco; José Carlos Herreras; Christian Tremblay. Traduction automatique et usages sociaux des langues. Quelles conséquences pour la diversité linguistique ?, 2021 (3), Observatoire européen du plurilinguisme, pp.63-81, 2021, Plurilinguisme. ⟨hal-03511177⟩
Maria Zimina-Poirot, Nicolas Ballier, Jean-Baptiste Yunès. Approches quantitatives de l’analyse des prédictions en traduction automatique neuronale (TAN). JADT 2020 : 15èmes Journées Internationales d’Analyse statistique des Données Textuelles, Université de Toulouse, Jun 2020, Toulouse, France. ⟨hal-03049589⟩
À lire aussi
Meet-Up 2025 : plus de 100 participants réunis pour les sessions d’information organisées par l’Université Paris Cité sur les appels européens MSCA Postdoctoral Fellowships
Afin d'offrir aux post doctorantes, aux post doctorants et à leurs superviseurs le meilleur soutien possible pour une candidature réussie et de grande qualité aux appels MSCA Postdoctoral Fellowships (MSCA PF), le Réseau Recherche Europe, coordonné par l’Université...
lire plus
Deux projets d’excellence d’UPCité lauréats des ERC Consolidator Grants en mathématiques et neurosciences
Le Conseil européen de la recherche (ERC) a annoncé le 9 décembre 2025 les résultats de son appel à projets Consolidator Grants. Parmi les 25 lauréats français, deux projets sont coordonnés à l'Université Paris Cité : le projet SAMPLING porté par Laura Dugué,...
lire plus
DiffeRs : le projet lauréat d’un ERC Consolidator Grants qui étudie les singularités
Le projet DiffeRs, coordonné par André Belotto Da Silva, enseignant-chercheur à l’Institut de Mathématiques de Jussieu–Paris Rive Gauche (Université Paris Cité) et lauréat d’une bourse ERC Consolidator en 2025, vise à développer de nouvelles méthodes afin d’ouvrir de...
lire plus
L’impact négatif du bruit environnemental sur le sommeil des Franciliens
Le bruit est reconnu comme étant le premier facteur environnemental perturbant le sommeil. Dans l’étude SOMNIBRUIT publiée le 15 décembre 2025, les équipes scientifiques de Bruitparif, de l’Observatoire régional de santé (ORS Île-de-France), département santé de...
lire plus