Analyses de plateformes : Enrichissement bibliographique dans ezPAARSE – Crossref d’abord !

Bonjour,

Nos collègues de l’INSERM nous ont signalé des erreurs dans les « Titre de publication » de leur tableau de bord ezMESURE, et en particulier chez l’éditeur Springer.

Nous avons procédé à une vérification des ECs et nous avons constaté des différences qui posent problème au moment de les comparer avec les statistiques COUNTER fournies par l’éditeur.

 

Voici un exemple concret :

springer ezmesure blut

Le titre « Blut » a été renseigné par l’enrichissement des ECs provenant des middlewares  suivants  :

  • ENHANCER –  recherche sur la liste des titres de publications fournies par l’éditeur au format Kbart (PKB) avec l’identifiant title_id renseigné dans l’URL de la requête. Cette liste est intégrée dans le parseur.
  • CROSSREF – recherche des métadonnées bibliographiques sur l’API CROSSREF au moment du traitement des logs dans ezPAARSE avec l’identifiant DOI renseigné dans l’URL de la requête.

Dans le paramétrage d’ezPAARSE, ces deux middlewares fonctionnent conjointement avec une priorité donnée à l’interrogation d’ENHANCER. CROSSREF ne vient qu’en complément quand les PKBs sont incomplètes ou absentes (et que le DOI est renseigné). 

Les PKBs sont mises à jour au moins 1 fois par an. C’est le cas de notre exemple pour SPRINGER (m-à-j : janvier 2018)

springer blut doi titre different

Le parseur SPRINGER est assez complet, puisqu’il possède une PKB. De plus, Les URL de la plateforme contiennent l’identifiant DOI. Dans l’exemple : 10.1007/s00277-017-3196-2

Lorsque nous interrogeons ce DOI dans l’API CROSSREF , le titre de publication indiqué n’est pas « Blut » mais « Annals of Hematology », « Blut » étant l’ancien titre en version papier !

L’information présentée dans les résultats ezPAARSE est donc incorrecte, et des erreurs de même nature peuvent se produire pour d’autres titres de publications.

springer blut pkb 2018 sur lien nouveau titre

 

Dans la liste PKB 2018  intégrée au parseur Springer,  on retrouve le titre « Blut » avec le lien URL :

https://link.springer.com/journal/277

blut lien annal of hematology

(277 est le title_id présent dans l’URL qui renseigne le titre de publication dans la PKB)

Deuxième surprise :  le titre renseigné dans la PKB « blut » ne correspond pas à la revue affichée, l’ISSN est également différent (0939-5555)

springer blut pkb info non exploitable

Si on regarde dans le détail la ligne concernant le titre « Blut »,  il y a une information sur le changement de titre : « now : Annals of Hematology« . Mais cette information n’est pas exploitable dans ezPAARSE car elle ne fait pas partie d’un champ renseigné.

Solution :

L’équipe ezTEAM a décidé de modifier l’ordre du traitement des MIDDLEWARES :

  • priorité 1 pour CROSSREF (DOI)
  • priorité 2 pour ENHANCER (PKB)

middleware ezpaarse pkb modif crossref first

middleware ezpaarse pkb modif crossref first

 

Test dans ezLOGGER :

springer ezlogger annal of hematology

 

Le test montre que les informations bibliographiques sont maintenant corrigées : le titre de publication et les identifiants  ISSN sont correctement renseignés.

Nous considérons que les PKBs, malgré une mise à jour annuelle peuvent contenir des informations assez rapidement obsolètes si l’éditeur ne fait pas de mise à jour régulière de ses métadonnées. Les informations collectées dans l’API CROSSREF par le DOI nous paraissent plus fiables. L’évolution des plateformes montre que l’identifiant DOI devrait être  plus  utilisé que le « title_id » dans le paramétrage des URLs.

Toutes les plateformes avec DOI sont concernées par cette mise à jour importante : Science DIrect, Nature, Wiley, ACS, NEJM, Taylor & Francis, …

Retrouvez ces informations dans le tableau trello des plateformes 

Vous pouvez également retraiter vos logs dans votre instance locale ezPAARSE après l’avoir mise à jour (version 2.12.5).

Bonne journée.

Frédéric Truong pour ezTEAM.