Master de linguistique informatique

Traitement automatique des langues

Description

  Le master de Sciences du langage – parcours linguistique informatique couvre les aspects théoriques et pratiques du traitement du langage naturel (TAL) et de la linguistique computationnelle. L’objectif de ce cursus est que les étudiants apprennent à concevoir, mettre en œuvre et tester des systèmes de TAL, en allant au-delà de l’utilisation d’outils prêts à l’emploi. Notre Master est conçu pour permettre aux étudiants de s’adapter à un domaine qui évolue rapidement, tant concernant les aspects pratiques que théoriques, et d’interagir naturellement avec des ingénieurs en sciences des données (« data scientists »), des informaticiens et des linguistes.
Le programme du Master forme les étudiants à la modélisation du langage à l’aide de méthodes mathématiques et computationnelles. Ils recevront un enseignement en statistiques, apprentissage automatique, intelligence artificielle et linguistique. L’orientation professionnelle mène à des postes dans des entreprises spécialisées dans le traitement automatique des langues et la science des données, principalement orientées vers le traitement des textes écrits. L’orientation recherche peut conduire à un doctorat en linguistique computationnelle.

Organisation

Les cours du master sont dispensés en anglais, et relèvent de trois types principaux:

  • Des cours en traitement automatique des langues (TAL), qui présentent, tant d’un point de vue pratique que théorique, les outils et algorithmes au cœur des systèmes de TAL actuels.
  • Des cours de linguistique (partagés avec les étudiants du Master en linguistique), qui permettent aux étudiants de prendre conscience et de comprendre les problèmes « théoriques » auxquels ils seront confrontés lorsqu’ils traiteront des données textuelles ou vocales réelles.
  • Des cours d’informatique (généralement dispensés par le département d’informatique de l’Université Paris Cité) : ces cours ont pour but de s’assurer que les étudiants ont les connaissances nécessaires pour concevoir et implémenter des algorithmes de TAL.

Pré-requis pour réussir dans ce master

De part son caractère  pluri-disciplinaire, les candidats à ce master peuvent avoir différents profils: nous accueillons soit des étudiants ayant une formation principale en linguistique mais ayant des connaissances et une appétence en informatique et mathématiques, soit des étudiants formés en informatique, mais intéressés par la linguistique et l’organisation formelle des langues.

Notez qu’il est possible d’entrer dans le Master avec peu ou pas de connaissances en linguistique (les étudiants recevront alors des cours d’introduction accélérés en linguistique au premier semestre du niveau M1). En revanche, des connaissances en informatique et en mathématiques sont requises.

  • En informatique : les étudiants sont censés connaître les bases de la programmation, idéalement en Python (à savoir une compréhension des variables, des instructions de contrôle, des structures de données, gestion de fichiers etc…). Pour vous donner une idée du niveau attendu, vous trouverez ici le sujet du tout premier TP du cours d’apprentissage automatique pour la TAL niveau 1 (le TP se déroule sur deux séances de 2 heures, puis est complété à la maison ; certaines indications sont données en classe). Pour (auto)évaluer votre capacité à suivre les cours, vérifiez si vous êtes capable d’écrire facilement un programme qui, étant donné un répertoire contenant plusieurs fichiers texte, imprime les 5 mots les plus fréquents dans tous ces fichiers.
  • En mathématiques : il est souhaitable d’avoir suivi un cours d’introduction aux statistiques et aux probabilités et de connaître les bases de l’algèbre linéaire (espace vectoriel, multiplication matrice-vecteur, produit scalaire, etc.)
  • En linguistique : un test de niveau est organisé la première semaine. Les étudiants jugés trop débutants en linguistique sont alors orientés vers des cours introductifs accélérés dans différents champs de la linguistique.

Ces prérequis ne sont pas des « contraintes fortes », mais doivent plutôt être interprétés comme des conseils pour éviter une orientation mal adaptée. Par exemple, une faiblesse côté pré-requis peut être compensée par un très bon dossier académique et une forte motivation. En fonction de votre dossier académique, vous serez invité à un entretien en ligne afin d’évaluer vos compétences en informatique et de discuter de votre candidature.

Comment candidater?

  Voir la page dédiée (commune à toutes les formations de l’UFR de linguistique)

Si vous pensez ne pas avoir les pré-requis

  Les étudiants n’ayant pas le bagage mathématique et informatique requis pour suivre le master peuvent envisager de commencer par le niveau L3. Cette L3, enseignée en français, est une bonne préparation au master.