Offres de stage
Ces stages sont offerts préférentiellement aux étudiants de l’UFR de linguistique, mais les étudiants inscrits dans d’autres établissement peuvent toutefois postuler.

© Université Paris Cité
NR = Non Rémunéré ; GR = Gratification Réglementaire
Merci de contacter directement les responsables indiqués pour chaque projet (voir contacts).
Stage au Laboratoire de Linguistique Formelle (UPC)
- Niveau : L3, M1 ou M2
- Rémunération : GR
- Contact et laboratoire : Heather Burnett (LLF)
- Durée, dates : année 2022-2023
- Descriptif :
La liaison en français. Revue de la littérature sur la liaison en français européen et québécois. Lecture et synthèse d’articles scientifiques. Éventuellement, constructions de stimulis pour une expérience sur la liaison en français québécois
Stage au Laboratoire de Linguistique Formelle (UPC)
Stage au Laboratoire de Linguistique Formelle (UPC)
Système d’alignement forcé en arabe/Forced Alignment system for Arabic Sujet 1
Français
- Niveau: M1 ou M2
- Gratification de stage possible ; à confirmer
- Tuteur : Jalal Al-Tamimi (al-tamimi@u-paris.fr), Laboratoire de Linguistique Formelle, Université Paris Cité en collaboration avec Djegdjiga Amazouz, Laboratoire de Phonétique et Phonologie
- Durée : jusqu’à 2 mois ; peut convenir pour deux personnes. A commencer immédiatement (année 2022-2023)
- Descriptif : Nous sommes à la recherche d’un stagiaire pour réaliser une tâche de translittération (romanisation) de l’écriture arabe. Les systèmes de translittération actuels effectuent un mappage 1graphème-1graphème dans le cas d’un script arabe vocalisé. Afin de translittérer l’arabe non vocalisée, nous cherchons à développer un convertisseur informé par une transcription automatique speech-to-text (en utilisant le WebMINNI, de la suite d’outils disponible sur WebMAUS) qui enrichie les convertisseurs préexistants avec la vocalisation obtenue à partir du speech-to-text. La première partie du stage sera consacré à la vérification de la transcription automatique des données en arabe (avec le script arabe non-vocalisé), ensuite l’automatisation des tâches et enfin, continuer le développement de l’outil de conversion.
- Compétence : Python, Praat, excellente programmation, connaissance de la langue arabe
English
- M1 ou M2
- Possible « Gratification de stage » to be confirmed
- Tutor: Jalal Al-Tamimi (al-tamimi@u-paris.fr), Laboratoire de Linguistique Formelle, Université Paris Cité in collaboration with Djegdjiga Amazouz, Laboratoire de Phonétique et Phonologie
- Duration: up to 2 months; can be split between two interns. To start immediately (academic year 2022-2023).
- Description: We are looking for an inter to work on a transliteration (romanisation) task for Arabic script. Current transliteration systems perform a 1Grapheme-1Grapheme mapping in the case of a vocalised Arabic script. To be able to obtain a transliteration of non-vocalised Arabic scripts, we are looking to develop a conversion tool informed by an automatic speech-to-text transcription (using the WebMINNI tool of the WebMAUS suite of tools), with the aim to enrich current pre-existent converting systems with vocalisation obtained from speech-to-text. The first part of the internship will be used to verify the automatic transcription of the Arabic data (using the non-vocalised Arabic script), then automation of the tasks and continue the development of the conversion tool.
- Skills: knowledge of Python, Praat, with excellent programming skills, knowledge of the Arabic language
______________________________________________________________
Sujet 2
Français
- Niveau: M1 ou M2
- Gratification de stage possible ; à confirmer
- Tuteur : Jalal Al-Tamimi (al-tamimi@u-paris.fr), Laboratoire de Linguistique Formelle, Université Paris Cité en collaboration avec Djegdjiga Amazouz, Laboratoire de Phonétique et Phonologie
- Durée : jusqu’à 1 mois. A commencer immédiatement (année 2022-2023)
- Descriptif : Nous sommes à la recherche d’un stagiaire pour réaliser une tâche d’évaluation de performance d’un système d’alignement forcé du signal acoustique de la langue arabe. Il y aura deux tâches à faire : 1) comparaison de performance d’alignement forcé avec des transcriptions manuelles and 2) comparaison de l’output d’une transcription automatique speech-to-text (en utilisant le WebMINNI, de la suite d’outils disponible sur WebMAUS) de la langue arabe avec les transcriptions manuelles.
- Compétence : Python, Praat, excellente programmation, connaissance de la langue arabe non-obligatoire
English
- M1 ou M2
- Possible « Gratification de stage » to be confirmed
- Tutor: Jalal Al-Tamimi (al-tamimi@u-paris.fr), Laboratoire de Linguistique Formelle, Université Paris Cité in collaboration with Djegdjiga Amazouz, Laboratoire de Phonétique et Phonologie
- Duration: up to 1 month. To start immediately (aa 2022-2023).
- Description: We are looking to recruit an intern to work on a specific task of evaluating the performance of a forced alignment system of the acoustic signal for the Arabic language. There will be two tasks: 1) comparison of the performance of the forced alignment system with pre-existing manual transcriptions and 2) comparison of the performance of the output of an automatic transcription system obtained via speech-to-text (using WebMINNI tool of the WebMAUS suite of tools) of the Arabic language with those obtained from manual transcription.
- Nous sommes à la recherche d’un stagiaire pour réaliser une tâche d’évaluation de performance d’un système d’alignement forcé du signal acoustique de la langue arabe. Il y aura deux tâches à faire : 1) comparaison de performance d’alignement forcé avec des transcriptions manuelles and 2) comparaison de l’output d’une transcription automatique speech-to-text (en utilisant le WebMINNI) de la langue arabe avec les transcriptions manuelles.
- Skills: knowledge of Python, Praat, with excellent programming skills, knowledge of the Arabic language not compulsory
Stage au Laboratoire de Linguistique Formelle (UPC)
Stage 1 : Expérience sur les interrogatives en français
- Niveau : L3, M1 ou M2
- Compétences : Un niveau natif ou quasi-natif du français est recommandé.
- Rémunération : NR
- Contact et laboratoire : Lisa Brunetti (LLF), brunetti@u-paris.fr
- Durée, dates : Année 2022-2023
- Description: Aide au montage et à la passation d’une expérience sur la fonction pragmatique des interrogatives introduites par pourquoi, comment, comment ça, comment ça se fait que.
__________________
Stage 2 : Annotation pragmatique / Pragmatic annotation
- Niveau : L3, M1 ou M2
- Compétences : très bonne connaissance d’une de ces langues : français, anglais, italien, espagnol
- Rémunération : peut être rémunéré
- Contact et laboratoire : Lisa Brunetti (LLF), brunetti@u-paris.fr
- Durée, dates : Année 2022-2023
- Description:
FRANÇAIS – Annotation (manuelle) d’un texte écrit ou oral en français, italien, anglais, ou espagnol. L’annotation consistera à reconstruire la question implicite qui précède chaque énoncé d’un texte, en suivant des consignes précises (voir Riester et al 2018). Une très bonne connaissance de la langue du texte à annoter est demandée.
ENGLISH : (Manual) annotation of the discourse structure of a text in English, Italian, French, or Spanish. The annotation consists in finding the implicit question that is assumed to precede each utterance of a text, by following precise instructions that are detailed in Riester et al 2018.
__________________
Stage 3 : Recherche sur corpus
- Niveau : L3, M1 ou M2
- Compétences : Un niveau natif ou quasi-natif du français est recommandé.
- Rémunération : NR
- Contact et laboratoire : Lisa Brunetti (LLF), brunetti@u-paris.fr, Lucia Tovena (LLF) tovena@linguist.univ-paris-diderot.fr
- Durée, dates : Année 2022-2023
- Description: Extraction des interrogatives introduites par pourquoi,comment ça, ou comment ça se fait que dans une partie du corpus frTenTen https://www.sketchengine.eu/frtenten-french-corpus/. Classification des phrases selon des critères syntaxiques et sémantiques qui seront précisés au moment du stage.
Stage au Laboratoire de Linguistique Formelle (UPC)
Sujet 1
FRANÇAIS (English below)
LES STRUCTURES PARTICIPALES DU FRANÇAIS : GRAMMAIRE/ACQUISITION
Ces stages peuvent aussi donner lieu à des mémoires de M1 ou de M2.
Stage en syntaxe sur les structures participiales du français adulte: dépouillement de corpus et analyse des données et/ou expériences d’acceptabilité
Stage en syntaxe/acquisition sur les structures participiales du français enfantin: dépouillement de corpus CHILDES et analyse des données.
- Niveau : M1 ou M2
- Rémunération : NR
- Contact et laboratoire : Caterina Donati (LLF)
- Durée, dates : début immédiat (Année 2022-2023)
- Descriptif :
Dans le cadre d’un nouveau projet sur les structures réduites participiales du type problème résolu ! dans les langues romanes (cf. Donati & Cecchetto 2022), je propose deux stages visant à saisir et analyser les contours syntaxiques de ces structures dans la grammaire adulte (français oral spontané) et dans la grammaire enfantine. L’objectif est vérifier si il y a continuité dans la syntaxe de ces structures réduites (qui seraient donc un « fossile » dans la grammaire adulte d’une option largement exploitée par l’enfant), ou si il s’agit de phénomènes différents chez l’enfant et l’adulte.
ENGLISH
PARTICIPIAL STRUCTURES IN FRENCH: GRAMMAR/ACQUISITION
- M1 or M2
- Gratification: non
- Contact et lab : Caterina Donati (LLF)
- Dates : as soon as possible (Année 2022-2023)
- Description:
In the framework of a new project on reduced participial structures of the type problem solved! in Romance (cf. Donati & Cecchetto 2022), I propose two internships aiming at describing and analyzing the syntactic contours of these structures in adult grammar (spontaneous oral French) and in child grammar. The objective is to verify whether there is a continuity in the syntax of these reduced structures (which would thus be a « fossil » in adult grammar of an option widely used by the child), or whether they are different phenomena in the child and the adult.
- These internships can also lead to M1 or M2 theses.
- Syntax internship on participial structures in adult French: corpus analysis and data analysis and/or acceptability experiments
- Syntax/acquisition internship on the participial structures of child French: CHILDES corpus analysis and data analysis.
_________________________________________________________
Sujet 2
FRANÇAIS (English below)
LE BILINGUISME ET LA COACTIVATION LINGUISTIQUE
- Niveau : M1 ou M2
- Rémunération : GR
- Contact et laboratoire : Caterina Donati (LLF)
- Durée, dates : dès que possible (Année 2022-2023)
- Descriptif :
On sait que les deux langues d’un individu bilingue sont toujours actives à un certain degré, comme le montrent diverses expériences qui témoignent d’effets d’interférence de la langue « silencieuse » dans une variété de tâches effectuées dans l’autre langue, même sans que les individus observés en soient conscients (Marian & Spivey 2003, Dijkstra 2005, Kroll et al. 2006 etc.). Pour le versant de la compréhension, nous avons mis en place un protocole expérimental, appelé BIMOBILI, visant à mesurer l’impact d’un stimulus bilingue et/ou bimodal vs. un stimulus monolingue, sur les réponses des individus bilingues dans une variété de tâches (Jaber, Giustolisi, Geraci, Donati 2022).
Dans ce cadre, je propose un ensemble de stages rémunérés pour conduire une série pilote d’expériences de compréhension exploitant et adaptant ce protocole à différents bilinguismes, à différents environnements et à différentes méthodologies. Nous visons à piloter trois types d’expériences (en collaboration avec Unimib, Milan) :
- Adaptation de BIMOBILI à la méthodologie de l’oculométrie. Les populations visées sont A. bilingues français/LSF et B. bilingues italien/LIS.
- Adaptation de BIMOBILI dans un environnement de sous-titrage. Les populations visées sont A. bilingues italien/anglais ; B. bilingues français/arabe ; C. bilingues italien/chinois ; D. bilingues français/coréen.
- Adaptation de BIMOBILI à la méthodologie de l’écoute dicotique. Population visée : bilingues français/italien.
BILINGUALISM AND LINGUISTIC COACTIVATION
- M1 or M2
- Gratification: yes
- Contact et lab : Caterina Donati (LLF)
- Dates : as soon as possible (Année 2022-2023)
- Description:
We know that the two languages of a bilingual individual are always active to some degree, as shown by various experiments that reveal interference effects of the « silent » language in a variety of tasks performed in the other language, even without the observed individuals being aware of it (Marian & Spivey 2003, Dijkstra 2005, Kroll et al. 2006 etc.). For the comprehension side, we set up an experimental protocol, called BIMOBILI, aimed at measuring the impact of a bilingual and/or bimodal stimulus vs. a monolingual stimulus, on the responses of bilingual individuals in a variety of tasks (Jaber, Giustolisi, Geraci, Donati 2022).
Within this framework, I propose a set of paid internships to design and administer a pilot series of comprehension experiments exploiting and adapting this protocol to different populations of bilinguals, different environments, and different methodologies. We aim at piloting three types of experiments (in collaboration with Unimib, Milan):
- Adaptation of BIMOBILI to eye-tracking. The target populations are A. bilingual French/LSF and B. bilingual Italian/LIS.
- Adaptation of BIMOBILI in a subtitling environment. The target populations are A. Italian/English bilinguals; B. French/Arabic bilinguals; C. Italian/Chinese bilinguals; D. French/Korean bilinguals.
- Adaptation of BIMOBILI to the methodology of dictionary listening. Target population: French/Italian bilinguals.
___________________________________________________
Sujet 3
- Niveau : L3, M1
- Rémunération : NR
- Contact et laboratoire : Ruoxuan Li, Caterina Donati (LLF)
- Durée, dates : dès que possible (Année 2022-2023)
- Descriptif :
Dans le cadre de la thèse de doctorat de Ruoxuan Li, sur les questions in situ en perspective typologique, nous recherchons deux stagiaires pour aider à la préparation de deux versions (en français et en mandarin) de la même expérience visant à mesurer l’acceptation et la conpréhension des phrases interrogatives avec une tâche de maze self paced reading task .
- stage pour l’expérience en français : nous cherchons un natif français pour aider a) à la préparation et sélection des items b) à la réalisation des images expérimentales (photos de playmobil) ; c) à poser l’expérience sur ibex-farm
- stage pour l’expérience en mandarin : mêmes tâches, mais pour un natif chinois.
Stage au Laboratoire de Linguistique Formelle et Clillac-ARP (UPC)
Niveau : M1 ou M2
Rémunération : peut être rémunéré
Contact et laboratoire : Anouk Dieuleveut / Morgan Moyer (LLF) / Ioana Chitoran (Clillac-ARP)
Durée, dates : année 2022-2023
En français, une phrase comme “tu peux jouer de la guitare” peut être utilisée pour exprimer trois différents actes de langage : une affirmation (si le but du locuteur est d’informer l’interlocuteur qu’il a le droit de jouer de la guitare), une “réelle” question (on demande à l’interlocuteur s’il sait jouer de la guitare), ou une requête d’effectuer une action (on demande à l’interlocuteur de jouer de la guitare). L’objectif de cette étude est d’étudier le type d’indices utilisés par les locuteurs pour interpréter correctement les phrases comme “tu peux P” en français. Précisément, son but est d’évaluer et de comparer la contribution respective d’indices de type contextuels et prosodiques.
Stage au Laboratoire INCC et Clillac-Arp (UPC)
Stage 1 : De la bouche aux oreilles : le rôle de la maturation sensorimotrice dans le développement phonologique.
- Niveau : M1 M2
- Rémunération: peut-être rémunéré
- Encadrement et labo : Irene Lorenzini https://incc-paris.fr/people/irene-lorenzini/ et Laurianne Cabrera https://incc-paris.fr/people/laurianne-cabrera/
- Descriptif:
Traditionnellement, le traitement de la parole a été étudié comme un phénomène auditif. Cependant, de nombreuses études ont récemment montré des corrélats perceptifs entre les actions liées à la parole et les sons de la parole. En effet, chez les adultes sains, le réseau neuronal recruté par le traitement de la parole inclut une contribution régulière des aires sensorimotrices. Ceci est en accord avec certains modèles neuroscientifiques proposant des représentations partagées entre action et perception. Dans ce contexte, les recherches sur la perception de la parole et le développement du langage chez le nourrisson cherchent à comprendre le lien entre maturation sensorimotrice et développement phonologique. Ce projet explore l’impact du développement sensorimoteur sur le développement phonologique précoce. La collecte de données auprès de nourrissons de 6 à 8 mois pourra s’effectuer au Babylab de l’INCC. Les nourrissons prendront part à la fois à une étude comportementale (fixation centrale) et de neuroimagerie (fNIRS). Des enregistrements de l’environnement linguistique de l’enfant seront aussi effectués à la maison avec le système LENA.
________________________________________________________
Stage 2: Acquisition des complexes consonantiques
- Niveau : M1 – M2
- Rémunération: GR
- Encadrement et labo : Laurianne Cabrera https://incc-paris.fr/people/laurianne-cabrera/ Ioana Chitoran http://www.clillac-arp.univ-paris-diderot.fr/user/ioana_chitoran
- Durée : année 2022-2023
- Descriptif:
FRANÇAIS. L’agencement des phonèmes dans la langue, ou phonotactique, suit des règles et contraintes particulières. Dans certains contextes, les locuteurs ont tendance à assimiler des phonèmes non-natifs entendus à ceux de leur inventaire phonologique. La perception de la parole n’est donc pas seulement dépendante de contraintes mécaniques biologiques, mais est aussi influencée par des spécificités de la langue de l’environnement : connaissance de la phonologie et des contraintes phonotactiques de celle-ci. Comment se spécialise-t-on dans le traitement des sons/séquences sonores de sa langue et Comment se développe l’acquisition d’éléments phonotactiques typologiquement rares ?
Dans ce projet nous explorons l’influence de la langue de l’environnement sur le poids perceptif accordé à certains indices acoustiques (notamment temporels) au cours du développement. Dans une étude expérimentale cross-linguistique, nous cherchons à mesurer la perception de clusters consonantiques complexes licites et illicites dans deux langues : le français et le géorgien. Nous pourrons manipuler des indices acoustiques temporels afin d’évaluer le rôle de l’acoustique dans le développement phonotactique en fonction de l’âge du locuteur (jeunes adultes vs. enfants de 3-5 ans) et de sa langue. Des tâches comportementales devront être mises en place, ainsi que le traitement et la manipulation de stimuli sonores. L’acquisition de données perceptives auprès d’enfants et d’adultes francophones pourra être également menée au sein du babylab de l’INCC.
ENGLISH. The organization of phonemes in languages, or phonotactics, follows specific rules and constrains. In some contexts, speakers have shown the tendency to assimilate non-native phonemes to the ones in their native repertoire. Thus, speech perception is not only dependant on biological mechanisms but also on the acoustical-phonological characteristics of the environmental language. How do we specialize in the processing of native speech sounds/sound sequences, and how do we acquire phonotactic elements that are typologically rare?
In this project, in collaboration with Ioana Chitoran http://www.clillac-arp.univ-paris-diderot.fr/user/ioana_chitoran, we aim to explore the influence of the native language on the processing of specific acoustic information of speech (temporal information) during development. Using a cross-linguistic experimental design, we would like to assess the perception of consonant clusters. Speech temporal information could be manipulated to assess the role of acoustics in the development of phonotactics as a function of age (adults vs children of 3-5 years) and native language. Stimulus and behavioral perceptual tasks need to be developed. Data acquisition with children and adults will take place at the babylab of the INCC.
Stages au laboratoire LISN (Université Paris-Saclay) et Clillac-ARP (UPC)
- Niveau: non précisé
- Rémunération : NR
- Encadrement et labo : Mathilde Hutin (LISN)
- Dates, durée: année 2022-2023
- Descriptifs :
Stage1. Analyse phonétique du schwa final en français standard. / Phonetic Analysis of Word-Final Schwa in Standard French
Etablir les durées et formants des schwas finaux alignés automatiquement par le système du LISN, analyser leurs relations à l’environnement phonétique des schwas (notamment de la consonne précédente).
Maîtrise de Praat (lecture de spectrogrammes et code) et R recommandée.
————-
Stage2. L’utilisation de données participatives pour la recherche en phonétique/phonologie
Using crowd-sourced data for research in phonetics-phonology
Vérification des alignements automatiques dans 10 langues indo-européennes.
Maîtrise de Praat (lecture de spectrogrammes et code), Excel et R recommandée.
————-
Stage3. La liaison fautive en français
Ungrammatical liaisons in French
Observer les erreurs de liaison dans trois grands corpus du français alignés automatiquement. Maîtrise de Praat (lecture de spectrogrammes et code), Excel et R recommandée.
————-
Stage4. Le rôle des représentations graphiques dans les représentations lexicales en français
The part of graphic representations in lexical representations in French
Le ou la stagiaire sera en charge de la mise en place de l’expérience (choix des items-tests, implémentation dans OpenSesame…), du recrutement des sujets, de la passation de l’expérience et, si le temps le permet, de l’analyse des résultats dans R et de la rédaction d’article.
————-
Stage5. Le rôle du domaine prosodique dans la réalisation du schwa final en français standard
The role of the prosodic domain in word-final schwa realization before vowels
Le ou la stagiaire devra opérer une écoute de tous les schwas réalisés devant voyelle dans nos alignements de corpus et vérifier si le schwa est en fait réalisé en fin de groupe intonatif, afin d’établir si le schwa et la voyelle qui suit sont en fait séparés par une frontière prosodique. Le ou la stagiaire doit maîtriser Praat (lecture de spectrogrammes et code), Excel et R.
Stage au Laboratoire INCC (UPC)
Stage 1: Perception différentielle des consonnes et des voyelles: une comparaison français-allemand
- Niveau : M2 ou M1
- Rémunération : GR si M2
- Contact et laboratoire : Thierry Nazzi (INCC)
- Durée, dates : année 2022-2023
- Description: Il s’agira de mettre en place une série d’expérience sur la capacité de jeunes enfants (avant 1 an) à détecter des répétitions de consonnes et de voyelles dans les listes de mots. Ce projet compare l’acquisition du langage en français et en allemand, afin de déterminer si et comment ce traitement différentiel est modulé en fonction de la langue maternelle.
Stage 2 : Babillage et perception des sons de la parole
- Niveau : LM1 ou M2
- Compétences : Etudiant.e en Master 1 ou 2 de Psychologie, Sciences Cognitives, Sciences du Langage. Candidat.e dynamique et motivé.e. La/le stagiaire travaillera en contact direct avec les participants invité.es aux expériences (nourrissons âgés de 3 à 10 mois) et leurs parents. Langue maternelle française de préférence ou très bon niveau de français
- Rémunération : peut être rémunéré
- Contact et laboratoire : Irene Lorenzini, Chercheuse post-doctorante, Thierry Nazzi, Directeur de recherche CNRS. Ce stage de recherche se déroulera au sein de l’équipe Langage et Cognition de l’Integrative Neurosciences and Cognitive Center (INCC) de l’Université Paris Cité.
- Durée, dates : 6 mois ; date de début souhaitée : automne 2022
- Description:
Deux études expérimentales portant sur la perception de la parole chez les nourrissons et les mécanismes sensoriels impliqués sont en cours au Babylab de l’INCC. Spécifiquement, ces deux projets s’intéressent à la relation entre le développement sensorimoteur (babillage) et la perception des sons de la parole. Dans le cadre de cette recherche, des méthodes d’analyse comportementale (paradigme de préférence visuelle) ; neurofonctionnelles (potentiels évoqués) et observationnelles (enregistrement et codage de séances de babillage) sont employées. La/le stagiaire recruté.e apprendra à utiliser les techniques expérimentales citées et participera aux activités expérimentales ainsi qu’à la récolte des données observationnelles et aux analyses des données obtenues.
Envoyer par mail à Irene Lorenzini irene.lorenzini@parisdescartes.fr) un CV, une lettre de motivation et les relevés de notes de Master si disponibles.
Stage au Laboratoire Articulabo (INRIA)
Stage 1
- Niveau : L3, M1 ou M2
- Compétences : bon niveau d’anglais
- Rémunération : GR
- Contact et laboratoire : Justine Cassell (justine.cassell@inria.fr), ArticuLabo (INRIA)
- Durée, dates : printemps 2023
- Description:
- Real-time face-to-face interaction involves not only cooperating on tasks but also engaging in social exchanges. SARA [1] is an embodied social intelligent personal assistant that can analyze the user’s verbal and non-verbal behaviors to estimate the level of interpersonal closeness with the user at any given point – what we call rapport. Several conversational strategies (revealing information about oneself, praising the other, teasing, reminding the other about shared experiences in the past) have been proven to increase and maintain rapport in various different tasks [2]. It is therefore important to be able to identify these conversational strategies. However, nowadays, technologies needs human annotated datasets to train machine learning models.
- The aim of this internship is to annotate these conversational strategies. The annotation task is carried out using software called ELAN, a linguistic tool for annotating video or audio data. Iif the intern wishes, a guided research project may be carried out on the strategy that one has annotated. Prior interns have looked at the role of intonation in off-task talk, the role of indirect talk (such as hedges) on interpersonal closeness, and so on
- These projects take place in the ArticuLabo at Inria Paris Center (with a joint affiliation with Carnegie Mellon University in the US). The intern will work closely with the Articulabo team, composed of doctoral students, a postdoc, an engineer and a number of other interns, supervised by Professor Justine Cassell.
To apply, please send a CV and a letter of motivation to justine.cassell@inria.fr
Stages au Laboratoire de Linguistique Formelle (UPC)
Stages en sémantique et pragmatique sur des sujets tels que les quantificateurs, les structures distributives et proportionnelles, ou la structure argumentale des verbes. Il s’agira d’études théoriques, bibliographiques et sur corpus.
- Type, durée, rémunération : L3 et M1, NR
- Encadrement et labo : Lucia Tovena (LLF)
Stage au Laboratoire LISN CNRS (Orsay).
Ce stage se déroulera dans le cadre du projet « Les vraies voix de l’intelligence artificielle » qui porte sur l’analyse sociologique et linguistique de la parole des micro-travailleurs et travailleuses de l’intelligence artificielle. Des enquêtes sociologiques ont été menées au sujet de la réalité socio-économique et linguistique de cette population de travailleurs émergente et un corpus a été constitué consistant en des questionnaires écrits et des entretiens oraux. Le travail de stage portera sur l’analyse de la variation sonore portée par l’expression orale des sujets participants à l’enquête. Plus précisément, à partir de données alignées son/texte grâce à un outil automatique, il s’agira d’explorer et de proposer une typologie des motifs de variation portant sur des phénomènes spécifiques à l’oral tels que le débit de parole, les patrons de réduction (durée, réalisations vocaliques et consonantiques), le rapport entre parole/fluente et disfluente etc. Ces patrons seront analysé selon des dimensions socio-phonétiques potentielles, comme par exemple hommes/femmes, âge, métiers etc. afin de contribuer aux profiles socio-économiques et d’aboutir à une description interdisciplinaire de la variation de l’oral.
- Type, durée, rémunération :6 mois; M1 – M2, GR
- Compétences requises : phonétique, TAL, analyse statistique (R), programmation (connaissances de base en python)
- Encadrement et labo : Ioana Vasilescu, Yaru Wu, Paola Tubaro – Laboratoire LISN CNRS (Orsay).
Stages au Laboratoire de Linguistique Formelle (UPC)
Stage 1 : L’ellipse du verbe en français: une approche expérimentale / Ellipsis in French : an experimental approach
Les phrases sans verbe ont souvent un équivalent verbal comme ‘Paul aime les pommes et ses enfants (aiment) les bananes.’ De nombreuses langues présentent des cas de mismtach, où la forme manquante n’est pas la même que celle de l’antécédent (ici aime/aiment). Le but du stage sera de tester des cas de mismatch de genre (Paul est content et Marie aussi.) et d’omission de la préposition (Paul rêve d’habiter à Paris et Marie Venise.), en montant des expériences de jugement d’acceptabilité.
ENGLISH. Verbless sentences tend to have verbal counterparts as in: Paul aime les pommes et ses enfants (aiment) les bananes.(‘Paul likes apples and his children bananas’). ‘Mismatch’ cases abound in many languages, where the missing form is not the same as the antecedent one (here the verb aime/aiment). The intern will run design and run acceptability judgement experiments on gender mismatch (Paul est content et Marie aussi. ‘Paul is happy.msg and Mary too.’) and preposition omission (Paul rêve d’habiter à Paris et Marie Venise. ‘Paul dreams about living in Paris and Marie Venice’).
- Type, durée, rémunération : L3,M1,M2, GR
- Encadrement et labo : Anne Abeillé (LLF)
Stage 2: Gender biases en syntax / Les biais de genre en syntaxe
ENGLISH. In many languages, human subjects tend to be more masculine than feminine. The intern will test and refine this kind of gender bias in large syntactically annotated corpora, using additional databases to annotate the semantic roles for instance. The target language may vary according on the student’s linguistic background. A preference would be French, English, Greek or Spanish. The intern will learn advanced inferential statistics
Dans beaucoup de langues, les sujets humains sont plus masculins que féminins. Le but su stage est de tester et préciser ce biais de genre sur de larges corpus annotés pour la syntaxe, en utilisant des bases de données permettant d’annoter les rôles sémantiques par exemple. La langue étudiée pourra être fixée selon les compétences de l’étudiant.e. Une préférence sera donnée au français, à l’anglais, à l’espagnol et au grec..
- Type, durée, rémunération : L3,M1,M2, GR
- Encadrement et labo : Anne Abeillé (LLF) and Yanis DaCunha (LLF)
Stage 3 : Modeling degrees of grammaticality / Modéliser les degrés de grammaticalité
ENGLISH. The goal is to build language models which are based on psycholinguistics data using insights from Harmonic Grammar. An (2020) has devised a sum-weighted constraint based model which is based on very general typologically valid grammatical constraints. The model is able to learn from the means ratings of human acceptability judgements to predict various degrees of grammaticality for various agreement phenomena (Mon frère ou mon père viendra/viendront.). The model is being extended to other syntactic phenomena. The intern will learn penalized linear regression models and also the design of on-line acceptability judgement tasks. They should devise an automatic tool to convert experimental data into weighted constraints.
- Type, durée, rémunération : 3 mois, M1, M2, GR
- Place : Laboratoire de linguistique formelle (U Paris)
- Advisors : Anne Abeillé (LLF) and Aixiu An (U Geneva)
- For computational linguistics students.
Stages au Laboratoire de Linguistique Formelle (UPC)
Stage 1 : L’ellipse du verbe en français: une approche expérimentale / Ellipsis in French : an experimental approach
Les phrases sans verbe ont souvent un équivalent verbal comme ‘Paul aime les pommes et ses enfants (aiment) les bananes.’ De nombreuses langues présentent des cas de mismtach, où la forme manquante n’est pas la même que celle de l’antécédent (ici aime/aiment). Le but du stage sera de tester des cas de mismatch de genre (Paul est content et Marie aussi.) et d’omission de la préposition (Paul rêve d’habiter à Paris et Marie Venise.), en montant des expériences de jugement d’acceptabilité.
ENGLISH. Verbless sentences tend to have verbal counterparts as in: Paul aime les pommes et ses enfants (aiment) les bananes.(‘Paul likes apples and his children bananas’). ‘Mismatch’ cases abound in many languages, where the missing form is not the same as the antecedent one (here the verb aime/aiment). The intern will run design and run acceptability judgement experiments on gender mismatch (Paul est content et Marie aussi. ‘Paul is happy.msg and Mary too.’) and preposition omission (Paul rêve d’habiter à Paris et Marie Venise. ‘Paul dreams about living in Paris and Marie Venice’).
- Type, durée, rémunération : L3,M1,M2, GR
- Encadrement et labo : Anne Abeillé (LLF)
Stage 2: Gender biases en syntax / Les biais de genre en syntaxe
ENGLISH. In many languages, human subjects tend to be more masculine than feminine. The intern will test and refine this kind of gender bias in large syntactically annotated corpora, using additional databases to annotate the semantic roles for instance. The target language may vary according on the student’s linguistic background. A preference would be French, English, Greek or Spanish. The intern will learn advanced inferential statistics
Dans beaucoup de langues, les sujets humains sont plus masculins que féminins. Le but su stage est de tester et préciser ce biais de genre sur de larges corpus annotés pour la syntaxe, en utilisant des bases de données permettant d’annoter les rôles sémantiques par exemple. La langue étudiée pourra être fixée selon les compétences de l’étudiant.e. Une préférence sera donnée au français, à l’anglais, à l’espagnol et au grec..
- Type, durée, rémunération : L3,M1,M2, GR
- Encadrement et labo : Anne Abeillé (LLF) and Yanis DaCunha (LLF)
Stage 3 : Modeling degrees of grammaticality / Modéliser les degrés de grammaticalité
ENGLISH. The goal is to build language models which are based on psycholinguistics data using insights from Harmonic Grammar. An (2020) has devised a sum-weighted constraint based model which is based on very general typologically valid grammatical constraints. The model is able to learn from the means ratings of human acceptability judgements to predict various degrees of grammaticality for various agreement phenomena (Mon frère ou mon père viendra/viendront.). The model is being extended to other syntactic phenomena. The intern will learn penalized linear regression models and also the design of on-line acceptability judgement tasks. They should devise an automatic tool to convert experimental data into weighted constraints.
- Type, durée, rémunération : 3 mois, M1, M2, GR
- Place : Laboratoire de linguistique formelle (U Paris)
- Advisors : Anne Abeillé (LLF) and Aixiu An (U Geneva)
- For computational linguistics students.
Stage au Laboratoire de Linguistique Formelle (UPC)
Sujet de stage : Analyse de données expérimentales d’oculométrie (eye-tracking)`
Lieu de stage : Université de Paris Cité, Laboratoire de Linguistique Formelle
Encadrement : Saïda Loucif – doctorante en linguistique à l’Université de Paris Cité
Durée du stage : 1 mois ; 80 heures, à temps partiel
Date de début souhaitée : fin juillet-début août 2022
Rémunération : 312 euros, soit 3,90 euros par heure
Profil recherché :
– Étudiant.e en Licence 3 / Master 1 / Master 2 en sciences du langage ;
– candidat.e dynamique et motivé.e ;
– rigueur scientifique ;
– bonne capacité d’organisation et de travail en autonomie ;
– locuteur natif ou non-natif mais ayant un très bon niveau de français.
Mission :
Le stage s’inscrit dans le cadre d’une étude expérimentale portant sur l’acquisition du
genre grammatical en langue seconde. Le ou la stagiaire participera à l’analyse des
résultats expérimentaux d’eye-tracking avec les deux logiciels DataViewer et Excel. Il
ou elle sera encadré.e et accompagné.e par la doctorante pour effectuer les
différentes analyses des données.
Candidature :
Merci de bien vouloir envoyer votre C.V. ainsi que votre lettre de motivation à Saïda
Loucif (loucif.saida100@yahoo.com).
Stage au Laboratoire de Linguistique Formelle (UPC)
Stage GR à M1 ou M2: interaction avec un robot parlant
Tuteur: J Ginzburg (yonatanginzburg@gmail.com)
Mi oct 2022 — mi janvier 2023 (avec un peu de flexibilité sur les dates).
Descriptif: We need a stagiaire to help run experiments with the robot FurHat. The experiments (with human subjects) involve recording the reactions of subjects to interactions with the robot and also some programming of the scripts for the robot.
Background needed: some experience with programming in a language like python or java; interest in dialogue and/or human-robot interaction.
Nous avons besoin d’un stagiaire pour aider à mener des expériences avec le robot FurHat. Les expériences (avec des sujets humains) consistent à enregistrer les réactions des sujets aux interactions avec le robot et également à programmer des scripts pour le robot.
Prequis : une certaine expérience avec la programmation dans un langage comme python ou java ; intérêt pour le dialogue et/ou l’interaction homme-robot.
Stage au LLF (UPC)
Title: Sentence parsing as a cognitive process
Level : Master 2 computational linguistics
Duration : 6 months
Supervisor : B. Crabbé
Expected profile : fluent in deep learning, interested by cognitive modelling for linguistics
Topic:
The context of the internship is to compare current deep learning
architectures with coginitive architectures and to explore how
theoretical biases can be used to design new language models.
Here we are interested in designing a deep learning formalisation of the cue-based language modelling framework of Lewis et
al. (2006). The framework emphasizes an incremental parsing method motivated by cognitive
results where word order is not anymore the first class citizen but rather
memory organisation as a function of time. This framework is related to empirical observations such as dependency
length minimization and seems largely familiar to current deep learning models.
The internship amounts to design either a parser or a language model
inspired by the cue-based framework. According to the chosen directions, the
resulting model may be evaluated on dependendency treebanks and/or on
behavioral data (Futrell et al. 2021).
Bibliography;
– Richard L Lewis, Shravan Vasishth, Julie A Van Dyke, 2006, Computational principles of working memory in sentence comprehension, Trends in cognitive sciences (10).
– Shravan Vasishth, Felix Engelmann, Sentence Comprehension as a Cognitive Process: A Computational Approach
– Daniel Fernández-González, Carlos Gómez-Rodríguez, 2019, Left-to-Right Dependency Parsing with Pointer Networks, Proc. NAACL
– Richard Futrell, Edward Gibson, Harry J Tily, Idan Blank, Anastasia Vishnevetsky, Steven T Piantadosi, Evelina Fedorenko, 2021, The Natural Stories corpus: a reading-time corpus of English texts containing rare syntactic constructions, Language Ressources and Evaluation, 55(1).
Stage au Laboratoire de Linguistique Formelle (LLF), UPC
- Level: L3, M1 ou M2
- Compensation: GR = Gratification Réglementaire
- Tutor: Dorotea Bevivino, LLF (dorotea.bevivino@u-paris.fr)
- Dates: as soon as possible (année 2022-2023)
- Requirements: English native speakers; some knowledge of Excel; familiarity with Praat is not required but it is a plus.
- Description:
- Niveau : L3, M1 ou M2
- Compensation: GR = Gratification Réglementaire
- Tutor: Dorotea Bevivino, LLF (dorotea.bevivino@u-paris.fr)
- Dates: à partir de décembre (année 2022-2023)
- Connaissances : français langue maternelle ; bonne connaissance de l’anglais ; familiarité avec Excel ; familiarité avec Praat n’est pas nécessaire mais c’est un plus
- Description:
Scripts et schémas de codage seront fournis pour faciliter et accélérer les taches.
Stage au LLF (UPC)
Title: Transition parsing and Q-learning
Duration: at least 3 months
Supervisor: T. Bernard
Expected profile: Very good programming skills, interest in neural-based machine learning, Master 1 or Master 2 in computational linguistics or computer science
Syntactic transition parsers such as shift-reduce parsers and arc-eager parsers are straigthforward to implement and train in the standard (teacher forcing) supervised fashion (see, e.g., Chen and Manning 2014 and Dyer et al. 2015). Standard supervised training, however, aims at maximising the log-likelihood of the annotated (gold) structures of the training data while the quantity that matters most is the expected F1/attachement score (the actual performance of the parser). In addition, while beam-search decoding is the most standard improvement on greedy-decoding, there are reasons to believe that beams based on the probability of the hypotheses are not particularly good at dealing with ambiguity. Indeed, if a parsing hypothesis has two plausible continuations, the probabilities of each of these continuations will suffer from the existence of the other, which means that both might be ejected from the beam (while less plausible parsing hypotheses might stay in the beam).
Thanks to the advance of reinforcement learning in general and Q-learning in particular (see, e.g., Mnih et al. 2013), it has become easier to train a parser so as to optimise a metric such as its expected F1/attachement score. One particularity of reinforcement learning schemes is that the system is not trained on gold trajectories (the trajectories from an initial state to a complete gold parse), but on its own predicted trajectories. A parser trained in such a fashion is thus expected to be more reliable at prediction time. A particularity of Q-learning more specifically is that it is not based on estimating probabilities for actions but values for states (in this case, parsing states) in such a way that maximising the parser’s objective is compatible with two continuations of the same parsing hypothesis both having high value. This is somewhat reminiscent of the structured perception used by Weiss et al. (2015). It thus seems that beams based on state value rather than probability might be better at dealing with ambiguity.
The goal of this research internship is to adapt a traditional transition parser in order to train it with a mix of Q-learning and standard log-likelihood maximisation. The impact of Q-learning training on greedy and beam-seach decoding will be studied.
Depending on the profile of the students, other questions might be approached instead; such as how model calibration impacts the performance of beam-search decoding, and whether A* decoding can be implemented as a viable alternative to beam-search decoding.
Relevant references:
— Chen, Danqi, and Christopher Manning. ‘A Fast and Accurate Dependency Parser Using Neural Networks’. In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 740–50. Doha, Qatar: Association for Computational Linguistics, 2014. http://www.aclweb.org/anthology/D14-1082.
— Dyer, Chris, Miguel Ballesteros, Wang Ling, Austin Matthews, and Noah A. Smith. ‘Transition-Based Dependency Parsing with Stack Long Short-Term Memory’. In Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), 334–43, 2015. https://doi.org/10.3115/v1/P15-1033.
— Mnih, Volodymyr, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, and Martin Riedmiller. ‘Playing Atari with Deep Reinforcement Learning’, 2013. http://arxiv.org/abs/1312.5602.
— Weiss, David, Chris Alberti, Michael Collins, and Slav Petrov. ‘Structured Training for Neural Network Transition-Based Parsing’. In Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), 323–33. Beijing, China: Association for Computational Linguistics, 2015. https://doi.org/10.3115/v1/P15-1032.
Stage au INCC (UPC)
Stage: Comparaison de l’acquisition précoce du langage entre langues asiatiques et européennes
- Niveau : M2 ou M1
- Rémunération : GR si M2
- Contact et laboratoire : Thierry Nazzi (INCC), thierry.nazzi@parisdescartes.fr
- Durée, dates : année 2022-2023
- Description: Certaines études suggèrent un retard dans l’émergence de capacités de traitement du langage chez les enfants japonais. Dans ce projet crosslinguistique, nous comparons l’acquisition du langage dans 4 langues asiatiques (japonais, mandarin, coréen et thai) et 3 langues indo-européennes (français, anglais, italien). Nous testerons les capacités de discrimination phonétiques, la segmentation de la parole en mots et l’attention jointe chez des enfants entre 6 et 12 mois. Le stage sera co-dirigé par Panagiotis Boutris, chercheur postdoctorant.
Stage FLE : Emmaüs Solidarité Compétences
3 OFFRE DE STAGES
Enseignement du FLE
LIEUX : 1 stage sur PARIS 11ème,, 1 stage sur PARIS 14ème et 1 stage sur IVRY-SUR-SEINE.
DATE DE DÉBUT DU CONTRAT : courant Février / mars 2023
OFFRE ÉMISE PAR : EMMAÜS Solidarité Compétences
PRÉSENTATION DE L’ORGANISME :
Association créée, en1 954, par l’ABBÉ PIERRE, reconnue d’intérêt général, EMMAÜS Solidarité oeuvre au quotidien pour que chacun trouve ou retrouve une place dans la société. Le champ d’intervention principal d’EMMAÜS Solidarité est centré sur les personnes les plus fragiles.
Depuis la création du Pôle en 2015, l’association a pour ambition de mettre en synergie les différents acteurs de la formation, de l’insertion et de l’emploi, engagés dans la lutte contre les exclusions. L’objectif principal est de faciliter l’inclusion socio professionnelle des publics en situation précaire, en s’appuyant sur le pouvoir d’agir de ces personnes.
EMMAÜS Solidarité Compétences est organisme certifié QUALIOPI depuis septembre 2021.
La spécificité première d’EMMAÜS Solidarité est de dispenser des cours de linguistique à destination du public migrant en précarité.
DESCRIPTIF DU POSTE :
Assister les enseignants de français / FLE (niveau A1.1, A1 et /ou A2)
Être capable d’animer des cours et/ou ateliers de FLE sous la supervision d’une formatrice expérimentée
Etablir des fiches pédagogiques et des suivis pédagogiques conformément aux directives de la référente pédagogique.
Assister aux réunions pédagogiques
COMPÉTENCES REQUISES :
Capacité d’adaptation / Ponctualité, rigueur, enthousiasme / Très bonnes capacités rédactionnelles (orthographe) Connaissance du CECRL / La connaissance de la langue anglaise serait un plus / Doté d’une réelle empathie
NIVEAU DE FORMATION : Master 1 & 2 FLE
VOLUME HORAIRE PAR SEMAINE : environ 15 heures /semaine
DURÉE : 2 mois
ENCADREMENT PÉDAGOGIQUE : oui
CONVENTION : oui
DATE DE DÉBUT DU CONTRAT : Courant février 2023
RÉMUNÉRATION : stage non rémunéré
DÉMARCHE À SUIVRE POUR PRÉSENTER SA CANDIDATURE :
Envoyer CV et lettre de motivation à la Direction pédagogique
COURRIEL DE CONTACT : Hacène HAÏFI
hhaifi@emmaus.asso.fr
Le site espace carrière est une aide à l’insertion professionnelle. Il accompagne les étudiants d’Université Paris Cité dans leur recherche de stages, jobs ou encore de contrat d’alternance.
Retrouvez toutes les informations sur son fonctionnement.
À lire aussi

Rentrée 2022
La rentrée effective a lieu le 12 septembre 2022. Nous organisons des réunions de rentrée qui auront lieu le 2 septembre 2022, et des tests de niveau de linguistique pour les étudiants externes entrant en M1 le 5 septembre. consultez les salles et horaires:...

Film sur l’UFRL
On peut découvrir certains aspects des enseignements à l'UFR Linguistique à partir d'un film réalisé récemment et disponible ici : https://cloud.parisdescartes.fr/index.php/s/o8dHb8WfnS48PCH © Tous droits réservés À lire...

Mentorat PGSL
Les étudiants de master sont membres de PGSL qui organise différentes activités, dont une sortie en forêt de Fontainebleau le samedi 23 avril.https://paris-gsl.org/PGSL organise un programme de mentorat qui s'adresse en priorité aux étudiants qui...