Analyses de plateformes : Journée parseurs pour les plateformes Wiley, IEEE et Cyberlibris

journee parseurs

 

 

Bonjour,

Chaque mois, Yannick Schurter, Steven Wilmouth et moi-même, nous nous réunissons pendant une journée pour faire le point des plateformes dans le Trello « Suivi des plateformes ». L’objectif de ces sessions est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée » dans le tableau Trello) et de faire la mise à jour des parseurs dans ezPAARSE.

Voici le bilan de cette dernière session :

wiley logo

 

ezlogger wiley ABS

Une nouvelle analyse ABS (abstract) au format HTML a été ajoutée dans ezPAARSE. La particularité de cette URL est la présence de l’identifiant DOI.

Comme signalé dans l’article consacré à la précédente journée parseurs,  il a fallu faire en sorte que l’expression régulière (regex) soit adaptée pour que les caratères spéciaux contenus dans l’identifiant soient pris compte dans ezPAARSE.

 

IEEE logo

 

ezlogger IEEE ISSUE

 

Notre collègue Annick Lagrange de L’Ecole Centrale de Lyon a proposé une analyse de la plateforme IEEE concernant la consultation d’un numéro complet au format PDF. Le RTYPE ISSUE a été attribué à cette URL et le parseur a été mis à jour avec une nouvelle expression régulière.

En revanche, nous avons décelé que l’enrichissement des événements de consultation (ECs) via les listes de publications KBART (PKB) ne fonctionnait pas correctement. La plateforme sera à nouveau revue lors de la prochaine journée parseurs pour essayer de trouver une solution à cette défaillance.

Cyberlibris Logo

 

cyberlibris scrapeur BACON

ezPAARSE possède déjà un parseur pour la plateforme Cyberlibris, mais aucun enrichissement avec les métadonnées (Titres des revues ou ebooks) des ECs n’était possible car aucune liste (PKB) n’était disponible quand le parseur a été créé.

Aujourd’hui plusieurs listes ont été ajoutées à l’API BACON de l’ABES. Steven a mis en place un scraper (c’est à dire un programme qui peut interroger une API pour extraire des listes de publications au format KBART). Les PKBs extraites sont alors ajoutées dans un dossier annexe au parseur. Au cours de son traitement dans ezPAARSE, le parseur utilise l’identifiant title_id présent dans l’URL de consultation pour interroger la PKB qui contient le même identifiant. S’il y a une concordance, alors les métadonnées sont ajoutées dans les ECs. Ces informations précieuses qualifient alors la consultation d’un point de vue bibliographique et sont exploitables pour fournir des rapports statistiques précis.

cyberlibris PKB scrapeur BACON

Voici toutes les listes extraites depuis l’API BACON.  Un test effectué dans ezLOGGER montre que l’enrichissement est bien effectué : on y retrouve le titre de publication , l’ISBN, l’auteur et l’année de publication.

ezlogger cyberlibris PKB BACON

 

Nous vous invitons à tester ces mises à jours en utilisant l’outil ezLOGGER. Vous pouvez également tester avec des logs dans votre instance locale ezPAARSE mise à jour. Nous vous conseillons également de retraiter tous vos logs de l’année 2018 si vous souhaitez bénéficier en particulier de l’enrichissement avec les métadonnées pour la plateforme Cyberlibris.

Bonne journée.

Frédéric Truong pour ezTEAM.