Analyses de plateformes : Contrôle du parseur ACS avec les informations fournies par l ‘éditeur

Bonjour,

 

Dans l’objectif d’améliorer les parseurs et d’être cohérents avec les recommandations COUNTER, nous avons envoyé un courrier aux éditeurs scientifiques afin de connaître la structure des URLS d’accès aux documents  de leur plateforme.

acs courrier aux editeurs

 

L’éditeur ACS nous a répondu positivement et nous a communiqué les différents formats d’URLs de consultations de sa plateforme pour chaque type de document :

acs publications link formats

Le parseur

 

Nous avons comparé les formats d’URLs avec les expressions régulières (regex) du parseur dans ezPAARSE.

acs parseurs control

Nous pouvons constater que le parseur prend en compte toutes les URLs de la plateforme ACS .

L’identifiant des ressources en ligne est le DOI. Le suffixe du DOI de l’article est différent de celui d’un chapitre de book,  par exemple :

DOI d’un article :      10.1021/acssensors.6b00528

DOI d’un chapître :   10.1021/bk-2012-1121.ch001

Cette différence de format du suffixe nous permet d’attribuer le rtype ARTICLE ou BOOK_SECTION dans le parseur par le biais de deux expressions régulières distinctes (lignes 55 à 63).

Tests du parseur

acs ezlogger test

Toutes les analyses de la plateforme ACS sont prises en compte dans le parseur, et le test avec ezLOGGER montre que les URLS annoncées par l’éditeur dans son document sont reconnues dans ezPAARSE.

 

Nous espérons avoir des réponses d’autres éditeurs pour compléter nos tests.

Des échanges techniques et constructifs avec Cairn et OpenEdition nous permettent aussi d’améliorer la fiabilité des parseurs dans ezPAARSE.

Nous ne manquerons pas de vous en informer dans un prochain article.

 

Bonne journée.

Frédéric Truong pour ezTEAM.