Transcrire des documents avec Transkribus
Résumé de la formation
Disposer d’un fichier texte est essentiel pour pouvoir faire de la fouille de texte. Cette formation constitue une initiation à la reconnaissance automatique de caractère avant de passer d’un fichier pdf à un fichier texte.
Programme
- Introduction à l’OCR (reconnaissance automatique du caractère)
- Présentation de bibliothèques numériques
- Présentation et prise en main de Transkribus
Formateurs et formatrices
Suzanne M’Pouli, Direction Générale Déléguée aux Bibliothèques et Musées
Informations pratiques
Pas de date proposée ce semestre.
Public
Doctorants en sciences humaines et sociales
Durée
2h
Langue
Français
Format
Distanciel
Code
HUN9
Formations dans la même catégorie
Nettoyer et enrichir ses données avec OpenRefine
Langue : français
Format : distanciel
Code : HUN17
Lauréats Prix de Thèse Chancellerie 2022 d’Université Paris Cité
Les prix solennels de la Chancellerie récompensent chaque année l’excellence de la valeur universitaire et scientifique d’une thèse de doctorat soutenue au cours de l’année civile précédant l’année d’attribution. Ils s’adressent aux étudiants franciliens...
Science ouverte et logiciels libres
Langue : Français
Format : Distanciel
Code : SCO19
Podcast « Santé Vous Bien, ici on se thèse pas! »
Piloté par un groupe d'étudiantes interdisciplinaire (biologie, psychologie, santé publique...), le projet "Santé Vous Bien, ici on ne se thèse pas!" a pour objectif de sensibiliser sur la santé mentale des doctorantes et doctorants au travers d'une série...
Appel Contrat doctoral – Cité du Genre
Dans le cadre d’un financement de contrat doctoral, la Cité du Genre entend faire émerger des thématiques de recherche permettant d’aborder, dans le strict cadre d’une co-direction de thèse interdisciplinaire, les inégalités de genre sous l’angle croisé...
Valoriser ses documents numériques avec Omeka
Langue : français
Format : distanciel
Code : HUN11
Logiciel R/R-Studio pour le traitement statistique de données d’enquêtes – Initiation
Langue : français
Format : présentiel
Code : HUN6
Visualiser des données en humanités numériques
Langue : français
Format : distanciel
Code : HUN10