Conditions d’accès en linguistique informatique (L3 / M1 / M2)

La L3 est ouverte aussi bien aux étudiants issus de filières littéraires (linguistique, langues, sciences humaines, sciences cognitives, CPGE L ou B/L…) qu’aux étudiants issus de filières scientifiques (informatique, math-info, miashs…). La commission pédagogique statue en examinant le dossier scolaire des candidats, leur motivation, et la cohérence de leur parcours. Pour les étudiants issus de filières littéraires, un bac scientifique est un atout. Pour les étudiants issus de filières scientifiques, un intérêt démontré pour les langues et leur fonctionnement est un plus.
Le M1 et le M2 sont ouverts à des profils variés, mais comportent des pré-requis et des « atouts » résumés ci-dessous. Les pré-requis sont des compétences validées par un enseignement académique du niveau correspondant, ou peuvent être évaluées par un oral d’entrée (voir ci-dessous). Les « atouts » sont des compétences utiles pour la réussite dans le cursus, même si elles ne sont pas formellement requises.

Pré-requis et atouts par niveau
  • L3 LI:
    • pré-requis : aucun. Les débutants en linguistique et en informatique sont acceptés.
    • atouts: langues, linguistique générale (initiation), mathématiques, programmation (initiation)
    • NB: le parcours linguistique informatique comporte une partie importante en mathématiques et en informatique
  • M1 LI:
    • Informatique:
      • pré-requis: Programmation en python et Java, programmation objet, Algorithmique.
      • les étudiants sont censés connaître les bases de la programmation, idéalement en Python (à savoir une compréhension des variables, des instructions de contrôle, des structures de données, gestion de fichiers etc…). Pour vous donner une idée du niveau attendu, vous trouverez ici le sujet du tout premier TP du cours d’apprentissage automatique pour la TAL niveau 1 (le TP se déroule sur deux séances de 2 heures, puis est complété à la maison ; certaines indications sont données en classe). Pour (auto)évaluer votre capacité à suivre les cours, vérifiez si vous êtes capable d’écrire facilement un programme qui, étant donné un répertoire contenant plusieurs fichiers texte, imprime les 5 mots les plus fréquents dans tous ces fichiers.
    • Linguistique :
      • pré-requis: aucun: cours de mise à niveau en linguistique au sein du M1, avec parcours différencié selon le niveau en linguistique à l’entrée
      • atouts: linguistique générale, phonétique, phonologie, morphologie, sémantique
    • Mathématiques :
      • pré-requis: notions de probabilités et statistiques, algèbre linéaire
      • atouts: théorie des langages formels: automates et expressions régulières
  • M2 LI :
    • Pré-requis:
      • Informatique: Programmation avancée (au moins deux langages, python recommandé), Algorithmique (graphes)
      • Linguistique: Phonétique, phonologie, grammaire, syntaxe formelle, sémantique formelle
      • Mathématiques/TAL: Langages formels (grammaires, parsing), Apprentissage automatique
    • Atout: Connaissance du domaine du TAL
Informations sur l'entrée en M1

Selon votre profil, l’enseignant responsable du M1 pourra vous proposer de faire un entretien (en ligne) pour évaluer votre niveau d’informatique. Si tel est le cas, il est vivement conseillé d’échanger avec lui pour préparer cet oral.

Concernant le niveau en linguistique: depuis 2019, le M1 Linguistique informatique est ouvert aux débutants en linguistique, avec des parcours différenciés selon que l’étudiant a déjà des connaissances en linguistique ou pas.

ATTENTION: un dossier de candidature en M1 ne peut pas être basculé en L3. Pour un étudiant candidatant en M1 en étant un peu juste, il est conseillé de prévoir en plus une candidature au niveau L3.

Informations pour l'entrée en M2
  • Connaissances requises en Informatique, langages formels, apprentissage automatique:
    • autonomie en programmation python, programmation objet
    • bases mathématiques (cf. B. Partee et al., « Mathematical methods in Linguistics », 1993.
    • principes de base de la classification supervisée, l’architecture d’un réseau de neurones simple (de type perceptron multicouche) et l’algorithme de la descente de gradient (voir Y. Goldberg « Neural Network Methods in Natural Language Processing », Morgan & Claypool, 2017)
    • architecture transformer, et modèles de langue pré-entraînés de type bidirectionnels (à la BERT) et génératifs (à la GPT)
  • Syntaxe formelle: les étudiants désirant entrer en M2 sont supposés maîtriser au moins l’une des grandes approches formelles de la syntaxe (GB/minimalisme, LFG, ou HPSG), et avoir une connaissance avancée des grands phénomènes syntaxiques et de leur traitement.
Bibliographie en TAL / mathématiques / informatique

Voici en outre quelques pistes pour aider les étudiants à se préparer pour que le Master se passe dans les meilleures conditions possibles (indépendamment de l’oral d’entrée).

  • TAL et linguistique computationnelle:
    • Le livre de Jurafsky et Martin donne un aperçu du TAL, mis à jour régulièrement
    • Pour les étudiants déjà un peu plus avancés en TAL et familiers avec le langage python, le livre Natural Language Processing with Python est un bon moyen de mettre en oeuvre en pratique les méthodes du TAL.
    • pour l’introduction à l’apprentissage automatique pour le TAL et les méthodes neuronales: Y. Goldberg « Neural Network Methods in Natural Language Processing », Morgan & Claypool, 2017
  • Algorithmique: Le programme d’algorithmique considéré comme déjà vu à l’entrée en M1 comprend les notions générales de complexité (grand O), les tris, les structures linéaires (piles, files), les arbres, les h-tables.
    Il peut être pertinent de commencer avec des tutoriels en ligne, par exemple (parmi bien d’autres) Algorithmique pour l’apprenti programmeur. Le manuel de Cormen (« Algorithmique » 3e édition française 2010, Dunod) est l’un des meilleurs ouvrages de référence.
  • Programmation:
    • Le langage le plus utilisé dans les TPs de master est python.
    • Une façon d’évaluer ses compétences en programmation est d’utiliser le projet Euler: de petits problèmes mathématiques dont la résolution ne peut se faire qu’en faisant un programme dans un langage de programmation quelconque. Savoir résoudre les 15 premiers problèmes est une bonne garantie que votre niveau est approprié pour le Master.
  • Mathématiques: contactez le responsable du M1 pour des supports.

* Cormen, Th et collab. [2010] Algorithmique. Dunod.
* Partee, B. et alii [1993] Mathematical methods in Linguistics, Kluwer.

Bibliographie indicative en linguistique
  • Syntaxe
    • Abeillé, A. [2007] Les grammaires d’unification, Hermès (chap 1 et chap 2).
    • Bresnan, J. [2001] Lexical Functional Syntax, Basic Blackwell.
    • Delaveau, A. [2001] Syntaxe, la phrase et la subordination. Armand Colin.
    • Haegeman L. [1993]. Introduction to Government & Binding Theory. Blackwell, Oxford.
    • Kerleroux F. et Delaveau, A. [1985] Problèmes et exercices de syntaxe française. Armand Colin.
    • Sag, I et Wasow, T., et Bender, E. [2003] Syntactic theory: a formal introduction, CSLI Publications.
    • Radford, A. [1988]. Transformational Grammar: A First Course. Cambridge University Press.
    • Radford, A. [1997] Syntax: a minimalist Introduction.
  • Phonétique
    • Ladefoged, P., [1975] A Course in phonetics, Harcourt, Brace & Jovanovich.
    • Landercy A., & Renard R. [1977] Eléments de phonétique, Didier-Bruxelles.
    • Léon, P. [2000] Phonétisme et prononciation du français, Nathan, 2000.
  • Sémantique
    • John Lyons, Eléments de sémantique (Larousse, 1978, ISBN 2030703443).
    • Saeed, John I. [1997] Semantics. Blackwell.
Quelle orientation avant la L3 de linguistique informatique?

Les étudiants (ou lycéens) intéressés par le master de Linguistique Informatique sont invités à choisir une formation de type « Mathématiques et Informatique Appliquées aux Sciences Humaines et Sociales » pour les deux premières années après le bac, que ce soit dans les filières MIASHS offertes à l’université, ou en khâgne B/L. La licence MIASHS dispensée à l’université Paris Cité est particulièrement adaptée puisqu’elle offre un parcours « mathématiques, linguistique et informatique », et fournit donc tous les pré-requis nécessaires à l’entrée en Master.

Contacts

La commission se réunit à intervalles réguliers au fur et à mesure des candidatures. Pour toute question sur votre candidature, notamment sur les pré-requis et la préparation, vous pouvez contacter la commission pédagogique (linguistique.informatique@linguist.univ-paris-diderot.fr), ou directement le ou la responsable d’année:

À lire aussi

Ling Fest 2024

Ling Fest 2024

Du 9 au 13 septembre 2024, la Paris Graduate School of Linguistics organise une LingFest, une formation intensive en linguistique pour préparer l'entrée dans les masters de l'Ecole doctorale de linguistique de Paris. Chaque jour de la semaine est dédié dans l'ordre à...

Rentrée 2024

Rentrée 2024

Les réunions de rentrée auront lieu le 6 septembre 2024, et des tests de niveau de linguistique sont organisés le 1er septembre après-midi pour les étudiants externes entrant en M1. Consultez les salles et horaires dans la page de rentrée.Transparents des...

Film sur l’UFRL

Film sur l’UFRL

On peut découvrir certains aspects des enseignements à l'UFR Linguistique à partir d'un film réalisé récemment et disponible ici : https://cloud.parisdescartes.fr/index.php/s/o8dHb8WfnS48PCH © Tous droits réservés À lire...

Mentorat PGSL

Mentorat PGSL

Les étudiants de master sont membres de PGSL qui organise différentes activités, dont une sortie en forêt de Fontainebleau le samedi 23 avril.https://paris-gsl.org/PGSL organise un programme de mentorat qui s'adresse en priorité aux étudiants qui...