Analyses de plateformes : journée parseurs pour les plateformes Emerald, Springer, WOS et Statista (partie 2)

journee parseurs

 

Bonjour,

Chaque mois Yannick Schurter, Steven Wilmouth et moi-même nous réunissons pendant une journée pour faire le point sur les plateformes qui sont listées dans le Trello « Suivi des plateformes ».

L’objectif de ces sessions est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée » dans le tableau Trello) et de procéder à la création ou à la mise à jour de leur parseur dans ezPAARSE.

Voici le bilan de cette dernière session (partie 2) :

 

emerald insight

 

La plateforme emerald évolue avec de nouvelles URLs :

Cela concerne les consultations ARTICLE en HTML/PDF et les sommaires (TOC). Les nouvelles analyses ont été faites pour permettre la mise à jour du parseur.

 

Le parseur modifié par Yannick Schurter tient compte des nouveaux paramètres de l’URL « insight/content » ainsi que la présence de l’identifiant DOI.

Les tests avec ezLOGGER montre que ces nouvelles URLs sont bien reconnues dans ezPAARSE.

 

 

springer logo

Le domaine de la platforme a été modifié par l’éditeur et devient rd.springer.com

 

Nous avons rajouté ce domaine dans le fichier manifest.json du parseur de Springer.

 

wos logo

 

Nous avons corrigé le nom du champs en sortie d’ezPAARSE contenant  l’information de la base de donnée consultée. Cette donnée n’est plus dans le champs « title_id » mais dans « db_id » (database identifier).

 

Si vous souhaitez réaliser une visualisation dans ezMESURE, il faudra penser à utiliser le champs « db_id » pour afficher les informations de bases de données.

 

 

Notre partenaire américain Alex Cooper a développé un parseur pour cette plateforme de données statistiques internationale. Les URLs de consultations aux USA ont des paramètres en anglais.

Cependant, notre collègue Mylène Basset qui consulte également cette base en France,  a pu constater que certaines URLs n’étaient pas reconnues dans ezPAARSE. Certains éléments de ces URLs sont traduits en français et ne sont pas déclarés dans le parseur.

 

Exemple :

SEARCH / RECHERCHE

DOWNLOAD / TELECHARGEMENT

STATISTICS / STATISTIQUES

Nous avons donc modifié le parseur pour qu’il puisse reconnaître la version anglaise ou française. Le test avec ezLOGGER montre que le parseur détecte bien les deux versions.

 

Nous vous invitons à tester également ces mises à jour avec ezLOGGER ou avec un fichier de logs traité dans votre instance locale ezPAARSE mise à jour au préalable.

Nous vous conseillons également de retraiter tous vos logs de l’année 2019 au vue des mises à jours présentées dans les articles partie 1 et 2.

 

Bonne journée

Frédéric Truong pour ezTEAM.