Analyses de plateformes : Mise à jour des parseurs Nature, Taylor & Francis, DeGruyter et Gale Cengage

 

Bonjour

 

La mise-à-jour des parseurs est nécessaire pour maintenir un niveau de reconnaissance des plateformes éditeurs qui soit le plus complet possible. C’est pourquoi nous détaillons aujourd’hui les dernières modifications apportées aux parseurs de Nature, Taylor & Francis, De Gruyter et Gale Cengage.

NATURE.COM

Nature-Publishing-Group-logo

 

nature nouvelle analyse article

 

Nous avons détecté une nouvelle URL de consultation ARTICLE en PDF qui a été ajoutée au parseur actuel.

nature ezlogger article pdf

 

L’URL est bien reconnue dans ezPAARSE avec ezLOGGER.

A noter que l’URL de consultation ARTICLE en HTML n’a pas été modifiée car elle est déjà reconnue par le parseur :

https://www.nature.com/articles/d41586-018-06997-8

 

TAYLOR & FRANCIS

Taylor et Francis logo

taylor et francis analogist al

Notre collègue Annick Lagrange de L’école Centrale de Lyon a ajouté 2 URLs de consultation ARTICLE et ABS (résumé d’un article) dans analogIST.

La particularité de ces URLs, c’est de contenir un DOI, identifiant avec lequel l’API Crossref est interrogée au moment où ezPAARSE traite vos logs. Les métadonnées (Titre de publication , ISSN, Publication_date,..) récupérées depuis Crossref sont alors insérées dans les ECs (événements de consultations).

taylor et francis nouvelles urls article et abs

Après la mise à jour du parseur, les tests avec ezLOGGER montrent la bonne reconnaissance de ces requêtes dans ezPAARSE.

 

DeGruyter

logo Degruyter

Une correction dans l’expression régulière (regex) a été faite pour que la consultation ARTICLE en PDF prenne en compte l’identifiant DOI avec des caractères spéciaux comme « . »

degruyter analyse article PDF

 

Yannick, qui a corrigé le code, en a profité pour ré-écrire certaines expressions régulières (on appelle cela dans le jargon un refactoring, une mise au propre du parseur en quelque sorte).

degruyter parseur modifié

degruyter ezlogger

 

Enfin, le test dans ezLOGGER montre que cette requête est bien reconnue quand le DOI est présent dans le format qui contient des « . »

A noter que le DOI est reconstitué avec le préfixe de la plateforme 10.1515 suivi du suffixe 9783110239423.121 présent dans l’URL.

 

gale cengage logo

Nous avons ajouté une URL de consultation BOOK dans le parseur, qui correspond à l’ouverture d’un EBOOK (quelque soit le nombre de pages visualisées) :

gale cengage ouverture d'un book

 

 

gale cengage analyse book

 

L’URL analysée est assez complexe, mais on a pu localiser un identifiant de type unit_id  GALE|CB0132160943 qui va permettre le dédoublonnage éventuel des accès.

gale cengage ezlogger

Le test dans ezLOGGER montre que la consultation BOOK en HTML est bien reconnue.

Nous vous invitons maintenant à mettre à jour les parseurs de votre instance locale ezPAARSE et à tester dans votre établissement ces modifications de parseurs, avec ezLOGGER, ou en traitant un échantillon de logs.

Bonne journée.

Frédéric Truong pour ezTEAM.