Constitution et analyse d’un corpus documentaire à partir d’Istex
Résumé de la formation
Objectifs
Présenter l’infrastucture Istex (base et outils associés), former les stagiaires à la méthodologie de
constitution de corpus, faire découvrir des outils de constitution de corpus et de fouille de textes (ou TDM pour
text and data mining).
Contenu
L’infrastructure Istex donne accès à plus de 30 millions de publications scientifiques en texte intégral, couvrant
un large éventail disciplinaire. Au-delà de ce vaste réservoir, Istex propose également des outils pour
analyser, visualiser et exploiter ces données, facilitant ainsi l’exploration de corpus de grande taille.
Cette formation montrera comment mobiliser Istex pour construire une bibliographie pertinente, automatiser
la recherche d’informations dans des milliers de documents, et gagner du temps dans l’analyse de la littérature
scientifique grâce à des méthodes d’analyse textuelle. Cette formation se décline en deux séances complémentaires
de trois heures chacune.
Programme
Séance 1 – Recherche bibliographique
Cette première session est consacrée à l’exploitation d’Istex pour la constitution d’une bibliographie scientifique
ciblée. Elle permettra aux participant·es d’apprendre à formuler des requêtes efficaces et à naviguer dans l’écosystème
Istex.
Séance 2 – Constitution de corpus et fouille de textes
La seconde session portera sur la constitution, l’enrichissement et l’analyse d’un corpus scientifique. Elle présentera
des outils accessibles pour explorer les contenus et rechercher automatiquement des informations dans
des corpus de plusieurs milliers de documents. Nous manipulerons notamment :
— Lodex, un outil de data visualisation permettant d’identifier, par exemple, les auteurs les plus cités ou les
documents de référence dans un domaine ;
— Les web-services Istex TDM, des programmes informatiques prêts à l’emploi (utilisables sans connaissance
en programmation), s’appuyant sur des techniques d’intelligence artificielle pour analyser un corpus.
Chaque séance combinera apports théoriques, exemples concrets et travaux pratiques afin de permettre
une appropriation progressive des outils et méthodes proposés.
Formateurs et formatrices
Mathilde Huguin (Inist)
Informations pratiques
Dates proposées : 25 novembre et 2 décembre 2025 de 9h30 à 12h30 en distanciel sur Zoom.
ATTENTION : la formation se déroule en 2 séances. La présence sur les deux créneaux est requise.
Public
Doctorants
Durée
6h
Langue
Français
Format
Distanciel
Code
GST80
Formations dans la même catégorie
Appel CSC UPCité 2023-2024
Université Paris Cité coordonne l'appel à projets doctoraux pour accueillir des doctorantes et doctorants chinois financés par le China Scholarship Council pour une durée de 36 et de 48 mois à partir de l'année universitaire 2024-2025. L’ambition...
MOOC Research integrity in scientific professions
Langue : Anglais
Format : Distanciel
Code : DF25EIISA
MOOC Intégrité scientifique dans les métiers de la recherche
Langue : Français
Format : Distanciel
Code : DF25EIISF
MOOC Éthique de la recherche
Langue : Français
Format : Distanciel
Code : DF25EIER
Grâce à Camille, Université Paris Cité remporte la finale internationale de MT180s !
Camille Lakhlifi, candidate d’Université Paris Cité, a remporté le 1er prix de la finale internationale francophone du concours Ma Thèse en 180s ce jeudi 5 octobre 2023. Université Paris Cité adresse toutes ses félicitations à Camille ! Camille Lakhlifi...
Prix Jeunes Talents France l’Oréal – UNESCO : des doctorantes d’Université Paris Cité lauréates
Université Paris Cité félicite les doctorantes et postdoctorantes lauréates du prix Jeunes Talents France L’Oréal-UNESCO Pour les Femmes et la Science. Archène Dyreck, Alice Briole, Aurore-Claude Taupin, Flora Blangis, Giulia Hardouin, Laetitia Grabot,...
Advanced Applied Data Analytics
Langue : Anglais
Format : Distanciel
Code : DF25ONAA
Enseigner la biologie à l’université : des clés pour progresser
Langue : Français
Format : Présentiel
Code : DF25EPEB