Mise à jour de parseur: CellPress

cellpress logo grand

 

Bonjour,

Nous avons modifié le parseur de la plateforme CellPress. Nous avons pu remarquer que les premières premières analyses ne permettaient pas de qualifier la consultation ARTICLE au format HTML et PDF.

Le PII

cellpress article html

 

Nous avons constaté la présence de l’identifiant PII (Publisher Item Identifier) dans l’url de consultation ARTICLE au format HTML.

Un article intéressant sur les identifiants (PII, DOI, PMID) a été publié sur le blog ISTEX.

cellpress article pdf

Le PII est également présent pour la consultation ARTICLE au format PDF.

Les analyses

Dans analogIST, nous avons fait 2 nouvelles analyses pour que le parseur puisse reconnaître la présence de l’indentifiant PII. On peut constater aussi que le PII est constitué en partie par l’ISSN de la revue précédé de la la lettre S.

Problème de format

L’identifiant présent dans l’url de consultation n’a pas le format requis pour permettre un enrichissement dans l’API Crossref.

http://www.cell.com/molecular-cell/fulltext/S1097-2765(10)00169-3

Nous avons donc tenu compte dans la modification du parseur de la suppression des caractères non alphanumériques.

Dans l’API Crossref, l’interrogation se fait sous cette forme

cellpress crossref search

 

 

La recherche peut donc aboutir

cellpress crossref result

Les métadonnées sont ainsi collectées et complètent les champs en sortie d’ezPAARSE (publication_title, publication_date, DOI…)

Test avec ezLOGGER

cellpress ezlogger

 

Voici un exemple d’événement de consultation de type ARTICLE HTML.  L’enrichissement avec le PII a parfaitement fonctionné. La consultation est qualifiée.

 

Nous vous invitons à tester le parseur CellPress sur votre instance locale mise à jour.

Merci par avance pour vos retours et commentaires.

 

Frédéric Truong pour ezTEAM.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *