Conditions d’accès en master Computational Linguistics
Le M1 et le M2 « Computational Linguistics » sont ouverts à des profils variés, mais comportent des pré-requis et des « atouts » résumés ci-dessous. Les pré-requis sont des compétences validées par un enseignement académique du niveau correspondant, ou peuvent être évaluées par un oral d’entrée (voir ci-dessous). Les « atouts » sont des compétences utiles pour la réussite dans le cursus, même si elles ne sont pas formellement requises.
Pré-requis et atouts par niveau
De manière générale, les prérequis pour l’entrée en M1 CL correspondent aux enseignements de la L3 LTEI. Si vous parlez français, une bonne façon d’acquérir ces pré-requis consiste à suivre ce programme. Pour le M2, les pré-requis correspondent aux enseignements du M1.
Attention : la candidature en L3 est indépendante de celle en M1. Il est tout à fait possible de postuler aux deux formations : il suffit de déposer deux dossiers distincts.
- M1 CL :
- Informatique :
- Pré-requis : programmation en Python, programmation objet, algorithmique.
- Les étudiant·e·s sont censé·e·s posséder une bonne maîtrise de Python (en particulier une compréhension des variables, des instructions de contrôle, des structures de données usuelles, de la gestion de fichiers, de la programmation orientée objet, de la programmation récursive et des arbres).
- Pour (auto-)évaluer votre capacité à suivre les cours, vous trouverez ici un exemple de questions ICI (incluant les liens vers les données nécessaires). Les étudiant·e·s du parcours CL sont censé·e·s être capables de résoudre l’ensemble de ces problèmes dès le début de l’année.
- Linguistique
- Pré-requis: aucun
- Atouts : linguistique générale, phonétique, phonologie, morphologie, sémantique
- Mathématiques :
- Pré-requis : notions de probabilités et statistiques, algèbre linéaire
- Atouts : théorie des langages formels (automates finis et expressions régulières)
- Informatique :
- M2 CL :
- Pré-requis :
- Informatique : programmation avancée (y compris une connaissance de pandas, scikit-learn, PyTorch, HuggingFace 🤗), algorithmique
- Linguistique : notions de linguistique générale, connaissances fondamentales en phonétique, phonologie, grammaire, syntaxe formelle, sémantique formelle
- Apprentissage statistique : principes de base de la classification supervisée et régression, réseaux de neurones, plongement lexicaux statiques et contextualisés, architecture transformer, modèles de langue pré-entraînés de type encodeur (comme BERT) et décodeur (comme GPT), conception d’un LLM (neural scaling law, instruction fine tuning, …)
- Atout : connaissance du domaine du TAL
- Pré-requis :
Informations sur l'entrée en M1 Computational Linguistics
Selon votre profil, l’enseignant responsable du M1 pourra vous proposer de faire un entretien (en ligne) pour évaluer votre niveau d’informatique. Si tel est le cas, il est vivement conseillé d’échanger avec lui pour préparer cet oral.
Concernant le niveau en linguistique: depuis 2019, le M1 Linguistique informatique est ouvert aux débutants en linguistique, avec des parcours différenciés selon que l’étudiant a déjà des connaissances en linguistique ou pas.
ATTENTION: un dossier de candidature en M1 ne peut pas être basculé en L3. Pour un étudiant candidatant en M1 en étant un peu juste, il est conseillé de prévoir en plus une candidature au niveau L3.
Bibliographie en TAL / mathématiques / informatique
Voici en outre quelques pistes pour aider les étudiants à se préparer pour que le Master se passe dans les meilleures conditions possibles:
- TAL et linguistique computationnelle:
- Le livre de Jurafsky et Martin donne un aperçu du TAL, mis à jour régulièrement
- Pour les étudiants déjà un peu plus avancés en TAL et familiers avec le langage python, le livre Natural Language Processing with Python est un bon moyen de mettre en oeuvre en pratique les méthodes du TAL.
- pour l’introduction à l’apprentissage automatique pour le TAL et les méthodes neuronales: Y. Goldberg « Neural Network Methods in Natural Language Processing », Morgan & Claypool, 2017
- Algorithmique: Le programme d’algorithmique considéré comme déjà vu à l’entrée en M1 comprend les notions générales de complexité (grand O), les tris, les structures linéaires (piles, files), les arbres, les h-tables.
Il peut être pertinent de commencer avec des tutoriels en ligne, par exemple (parmi bien d’autres) Algorithmique pour l’apprenti programmeur. Le manuel de Cormen (« Algorithmique » 3e édition française 2010, Dunod) est l’un des meilleurs ouvrages de référence. - Programmation:
- Le langage le plus utilisé dans les TPs de master est python.
- Pour (auto-)évaluer votre capacité à suivre les cours, vous trouverez ici un exemple de questions ICI (incluant les liens vers les données nécessaires). Les étudiant·e·s du parcours CL sont censé·e·s être capables de résoudre l’ensemble de ces problèmes dès le début de l’année.
- Mathématiques: contactez le responsable du M1 pour des supports.
* Cormen, Th et collab. [2010] Algorithmique. Dunod.
* Partee, B. et alii [1993] Mathematical methods in Linguistics, Kluwer.
Quelle orientation avant le master Computational Linguistics?
Les étudiants (ou lycéens) intéressés par le master Computational Linguistics sont invités à choisir une formation de type « Mathématiques et Informatique Appliquées aux Sciences Humaines et Sociales » que ce soit dans les filières MIASHS offertes à l’université, ou en khâgne B/L. La licence MIASHS dispensée à l’université Paris Cité est particulièrement adaptée puisqu’elle offre un parcours « mathématiques, linguistique et informatique », et fournit donc tous les pré-requis nécessaires à l’entrée en Master.
Les étudiants ayant commencé par une L1/L2 en sciences humaines, littéraire, ou en linguistique, et qui ont une appétence pour les aspects formels du langage, peuvent s’orienter vers la L3 Linguistique Théorique, Expérimentale et Informatique (LTEI) d’université Paris Cité, qui fournit les pré-requis pour le master CL.
Contacts
La commission se réunit à intervalles réguliers au fur et à mesure des candidatures. Pour toute question sur votre candidature, notamment sur les pré-requis et la préparation, vous pouvez contacter le ou la responsable d’année:
- M1 Computational Linguistics : Guillaume Wisniewski
- M2 Computational Linguistics : Marie Candito
À lire aussi
Le LingFest
Les 9 et 11 septembre 2025, la Paris Graduate School of Linguistics organise le LingFest, une formation intensive en linguistique pour préparer l'entrée dans les masters qu'elle fédère.La formation s'adresse également aux étudiants d'autres écoles doctorales désireux...
Rentrée 2025
Les réunions de rentrée ont eu lieu le 8 septembre 2025. Plus de détails ici. Les cours débutent le lundi 15 septembre 2025.
Portes ouvertes sur les Masters en ligne samedi 8 mars 2025
Pour plus d’informations sur nos parcours de Master
Film sur l’UFRL
On peut découvrir certains aspects des enseignements à l'UFR Linguistique à partir d'un film disponible ici © Tous droits réservés À lire aussi