Identifiants

L’identification certaine et pérenne des productions scientifiques, de leurs auteurs et de leurs structures de rattachement est un enjeu stratégique en matière de Science ouverte. Il importe de systématiser l’usage d’identifiants ouverts et interopérables.

 

ORCID et autres identifiants auteur

Qu’est-ce qu’un identifiant chercheur ?

Un identifiant chercheur est un code numérique ou alphanumérique unique et pérenne attribué à un auteur pour l’identifier de manière univoque dans un système d’information donné :

  • un catalogue de bibliothèque (Sudoc => IdRef) ;
  • une archive ouverte (HAL => IdHAL) ;
  • une base de données bibliographique internationale (Web of Science, Scopus…)
  • un moteur de recherche, tel Isidore ou theses.fr ((IdRef)

A cet identifiant peuvent être rattachées, sans risque d’erreur d’attribution, les productions de l’auteur correspondant : articles, livres, thèses, jeux de données,….Cet identifiant ne varie pas, y compris lorsque l’auteur, ou l’autrice, change de nom ou d’institution. Cette pérennité garantit la continuité de l’identification et de l’attribution mais se heurte toutefois à la multiplicité des systèmes d’information fondés sur des identifiants différents.

L’un des enjeux de l’identité numérique d’un auteur scientifique consiste donc non seulement à créer ses identifiants lorsque cela dépend du publiant – ORCID, IdHAL – mais aussi à aligner ses identifiants, c’est-à-dire à les faire correspondre au sein d’un même système d’information.

En alignant ses identifiants, un auteur rassemble ainsi, de la manière la plus exhaustive, l’ensemble de ses productions scientifiques et augmente sa visibilité lors des recherches effectuées dans les moteurs de recherche. Cet alignement constitue également un enjeu pour les établissements, au même titre que la politique de signature des publications, pour repérer les productions scientifiques relevant de son périmètre institutionnel.

Un enjeu personnel et institutionnel

Un prénom et un nom ne suffisent pas à attribuer de manière certaine une production à une personne. Un article dont l’auteur est T. Martin est-il l’article de Théodore Martin, chercheur en épigénétique à l’Inserm ou de Théodore Martin, chercheur en linguistique formelle au laboratoire LLF d’Université Paris Cité ou de Thomas Martin, en post-doctorat en sciences de la vie à l’Université d’Édimbourg ?

Pour chacun de ces auteurs, rassembler ses publications sous un identifiant plus fiable qu’un nom d’auteur constitue donc un véritable enjeu de reconnaissance. Même sans risque d’homonymie, les variations d’écriture, d’abréviation, d’ordre, etc compliquent cette attribution, les pratiques de citation et les mesures bibliométriques de la production scientifique, pour un chercheur, son laboratoire ou son institution.

Les identifiants créés directement par les auteurs

Orcid (Open Researcher and Contributor ID) :

Utilisé par les éditeurs (Elsevier, Wiley, Plos, Springer, etc.), les financeurs (ERC, Wellcome Trust), les évaluateurs (HCERES), les entrepôts de données (Dryad, Figshare), ORCID est en passe de s’imposer comme un pivot international pour l’identification des auteurs scientifiques.

Créé par l’auteur lui-même, souvent à l’occasion de la soumission d’un article et à la demande d’un éditeur, ORCID comporte peu de métadonnées (nom, prénom). Son intérêt est d’être largement utilisé dans la communauté internationale. Il permet de créer un CV alimenté automatiquement par différentes bases (Crossref, Scopus, Springer) lorsque l’auteur publie chez un éditeur.

Lors de sa création, il est également possible d’y associer les adresses URL des différentes pages personnelles de l’auteur (réseaux sociaux, blogs, pages de laboratoires), d’indiquer ses autres identifiants pour leur alignement et relier ainsi entre elles les différentes informations constitutives de l’identité numérique d’un auteur scientifique.

IdHAL

HAL compte un grand nombre d’auteurs/déposants et souvent, pour un même auteur, de nombreuses formes différentes de son nom (coquilles, variation de l’ordre prénom/nom, initiales, majuscules, etc). Chaque personnel de recherche publiant a donc intérêt à se créer un identifiant numérique IdHAL puis à associer toutes les variantes de son nom d’auteur repérées sous cet identifiant. Un CV HAL, très bien référencé sur les moteurs de recherche, pourra ensuite être généré avec l’ensemble des productions scientifiques.

Les identifiants créés par les bibliothèques & systèmes d’information

On ne crée pas soi-même d’identifiant IdRef, ISNI ou VIAF comme on le fait pour un identifiant ORCID ou IdHAL. Pour les auteurs français de publications scientifiques, c’est généralement lors du signalement de la thèse que l’IdRef de l’auteur est créé par les bibliothèques de l’établissement de soutenance dans le fichier d’autorité du Sudoc. Les données sont enrichies, contrôlées et fiables. Elles sont reprises automatiquement dans les répertoires ISNI et VIAF. En revanche, un auteur garde la possibilité d’agir sur les informations qui le concernent en faisant modifier celles qui sont enregistrées sur sa notice Sudoc.

IdRef

IdRef est le répertoire des autorités des catalogues de l’enseignement supérieur français. C’est aussi un identifiant attribué à tout auteur (ou collectivité) lors du signalement de sa publication dans le Système Universitaire de DOCumentation (SUDOC), dans Calames (catalogue des manuscrits) ou dans theses.fr.

Pour valoriser la production scientifique, le consortium ORCID France, regroupe les établissements français adhérents d’ORCID, comme l’Université Paris Cité, et travaille à l’alignement des identifiants IdRef et ORCID. Stéphanie Arneau (DGDBM) est référente ORCID pour l’Université Paris Cité (stephanie.arneau[a]u-paris.fr).

 ISNI (International Standard Name Identifier)

ISNI normalise l’identification, au niveau international, des identités publiques des personnes ou des organismes impliqués dans la création, la production, la gestion et la distribution de tout contenu intellectuel, scientifique et artistique. Les personnes identifiées peuvent être, par exemple, l’auteur, l’éditeur, le traducteur ou l’illustrateur. Il est géré, pour la partie française, par la Bibliothèqe nationale de France.

ORCID est conforme à la norme ISNI. Les deux organisations ont signé un accord pour asseoir et améliorer leur interopérabilité. Ainsi, ORCID utilise l’ISNI pour l’identification des institutions auxquelles les chercheurs sont affiliés

VIAF (Virtual International Authority File)

L’identifiant  VIAF un identifiant créé par l’Online Computer Library Center (OCLC). Le VIAF est un référentiel international qui établit une fiche auteur avec un identifiant en rassemblant les fiches auteurs des différents catalogues des bibliothèques nationales ou de l’enseignement supérieur (IdRef) du monde entier. Il permet aussi de lier ces autorités à d’autres répertoires comme ISNI ou Wikidata.

DOI et autres identifiants publications et données

Le DOI (Digital Object Identifier) est à la fois

  • un identifiant unique d’un objet électronique publié : articles, monographies, jeux de données, etc
  • un accès pérenne vers cet objet même en cas de changement d’URL

Les domaines de DOI sont gérés par des agences internationales – parmi lesquelles CrossRef, DataCite, etc – regroupées au sein de l’International DOI Foundation (IDF).

L’attribution d’un DOI à son objet particulier s’effectue de manière transparente et automatique sur la plupart des plateformes éditoriales et des entrepôts de données lors de la publication ou du dépôt.

Le lien par DOI garantit la stabilité d’accès : il restera le même et permettra d’accéder à l’objet identifié même en cas de changement d’URL. C’est donc une métadonnée indispensable à la qualité de l’identification, de l’accès et de la conservation de long terme.

Un DOI se présente sous une forme telle que : 10.1371/journal.pone.0183464

Il convient de le copier dans le navigateur après http://doi.org/10.1371/journal.pone.0183464 pour être automatiquement dirigé vers l’article sur la page web correspondante.

SWHID : identifier les logiciels

L’identifiant SWHID, immédiatement attribué lors de la collecte des codes sources par Software Heritage ou lors d’un dépôt sur HAL, facilite l’identification, la citation et l’accès aux logiciels.

  • Le résolveur Software Heritage, https://archive.softwareheritage.org, permet de retrouver, lire et télécharger le code source déposé à l’aide d’un identifiant swh-id
  • Un SWHID est attribué à chaque code source archivé sur Software Heritage. Il fonctionne comme un identifiant numérique intrinsèque, pérenne et unique permettant par un contrôle de version décentralisé, de reconnaître avec exactitude la version d’un logiciel, condition indispensable à la reproduction d’une expérience. En savoir +
  • Le SWHID est également attribué aux dépôts de logiciels sur HAL,connecté à Software Heritage depuis 2018
  • Pour tirer le meilleur parti des SWHID dans la citation des logiciels, le style bibliographique biblatex-software est recommandé. En savoir +

 

À lire aussi

HALathon-Santé : du 2 au 12 mai 2023

HALathon-Santé : du 2 au 12 mai 2023

    HALathon : principes et fonctionnement Depuis son ouverture en octobre 2020, l’archive ouverte HAL UPCité s’est progressivement enrichie et contient aujourd’hui plus de 100 000 références et 67 000 documents en texte intégral. L’objectif est de mener,...