Analyses de plateformes : Journée parseurs pour 4 plateformes en open-access

journee parseurs

 

Une fois par mois Yannick Schurter, Steven Wilmouth et moi-même nous réunissons pour faire le point sur les plateformes qui sont listées sur AnalogIST (et dans le Trello « Suivi des plateformes »).

L’objectif de ces sessions mensuelles est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée ») et de procéder à la création ou à la mise à jour des parseurs pour les rendre disponibles dans ezPAARSE.

Pourquoi les plateformes en Open Access ?

Au départ ezPAARSE était uniquement dédié à la mesure des usages des ressources payantes. En effet, pour mesurer les usages avec ezPAARSE, il faut disposer de fichiers de traces (les fichiers de log) et dans le contexte de l’Open Access où aucune authentification n’est nécessaire, il n’y a pas d’intermédiaire pour gérer les droits d’accès et les traces ne sont disponibles que chez l’opérateur du service, à savoir : l’éditeur/opérateur lui même. Les gestionnaires de la documentation électronique n’y ont pas accès.

Un outil pour la migration du modèle de publication

Mais dans l’absolu, ezPAARSE peut être utilisé par les éditeurs eux-même ou par les opérateurs d’archives ouvertes qui disposent des log de leurs propres serveurs. Un seul parseur est alors nécessaire, celui qui sait reconnaitre les URL de la plateforme en question.

C’est dans ce sens qu’a travaillé l’équipe depuis plusieurs mois en collaborant avec HAL et Open Edition en leur permettant d’utiliser ezPAARSE pour renforcer les fonctionnalités de détection des robots, qui polluent les consultations « utiles » dans ce contexte. Il est alors possible pour ces sites de produire des évènements de consultations pour l’usage « humain » des ressources et le mettre en rapport avec l’usage fait dans un contexte payant. Et ceci avec le même outil.

Un autre cas d’usage pour évaluer l’Open Access

hclyon logo

Récemment l’équipe a travaillé avec l’équipe documentaire des Hospices Civils de Lyon sur un autre cas d’usage. Dans le contexte des Hospices Civils de Lyon, les logs de l’ensemble du trafic internet peut être analysé, et celui-ci comprend à la fois les accès au payant ET au gratuit. La rapidité de traitement et la conception « privacy by design » d’ezPAARSE permet de traiter sans problème l’énorme volume de données que peut représenter ce type de trafic.

Il devient alors envisageable d’écrire des parseurs permettant l’analyse des usages des sites en Open Access de manière identique à celle faite pour les sites payants. L’équipe documentaire des Hospices Civil de Lyon a accepté d’être pilote sur ce cas d’usage et nous faire un retour sur la cohérence des usages mesurés de cette façon.

Nous avons donc consacré une journée parseur dédiées à ce type de plateformes en Open Access en choisissant les principales susceptibles d’intéresser nos partenaires.

Si vous aussi souhaitez tester, parce que vous avez accès à ce type de log, n’hésitez pas à contacter l’équipe.

Les plateformes Open Access analysées

plateformes open access dans ezPAARSE

Voici le bilan de cette dernière session :

PLOS

 

Cette nouvelle plateforme contient plusieurs déclinaisons de revues. Elle est en accès gratuit. Nous avons analysé les consultations suivantes :

plos ezlogger 2020

Le sommaire d’une revue est pris en compte avec le Rtype TOC. Ensuite, les consultations d’un ARTICLE aux formats HTML, PDF et XML sont prises en compte par ce nouveau parseur.

On note la présence du DOI et les informations d’enrichissement bibliographiques qui en découlent avec l’interrogation à l’API Crossref  (Titre, ISSN, année de publication).

 

MDPI

mdpi logo

 

mdpi ezlogger 2020

Les analyses de cette plateformes permettent de détecter des consultations ARTICLE en HTML et PDF ainsi que des résumés (ABS). L’identifiant est l’ISSN. C’est la seule information bibliographique disponible pour le moment.

 

 

FRONTIERSIN

frontiersin logo

frontiersin ezlogger 20201020

 

En revanche, pour cette plateforme, l’identifiant DOI est présent dans les URL de consultation ARTICLE aux formats HTML, EPUB et XML.

Comme pour la plateforme PLOS, les métadonnées sont retournées gràce à l’API Crossref pendant le traitement des logs dans ezPAARSE.

A noter que la consultation SEARCH (recherche) a été prise en compte dans l’analyse de la plateforme.

 

MEDRXIV

medrxiv logo

 

medrixiv ezlogger 20201020

 

 

Cette quatrième plateforme contient également un DOI comme identifiant des consultations ARTICLE dans les formats HTML et PDF.

Comme pour les plateformes PLOS, FRONTIERS, il sera possible dans ezMESURE d’afficher des listes de titres de revues, ISSN, année de publication par le biais des métadonnées issues de CROSSREF.

 

Tous les tests avec ezLOGGER montrent que ces 4 nouvelles plateformes  sont reconnues dans ezPAARSE.

Nous vous invitons maintenant à tester ces plateformes avec ezLOGGER, ou directement avec vos logs que vous traiterez dans votre instance locale ezPAARSE préalablement mise à jour.

 

Bonne journée.

Frédéric Truong  et Dominique Lechaudel pour ezTEAM.