L’enrichissement par les middlewares : pour que ça fonctionne correctement

Bonjour, certain.e.s d’entre vous y ont été confronté récemment et ce problème d’enrichissement peut avoir plusieurs causes, que nous avons tâché de documenter (en anglais) dans la documentation en ligne du logiciel. Ici, nous nous penchons dessus en détail.

Le problème rencontré

ezPAARSE commence à traiter vos logs puis s’arrête en erreur à cause d’un problème d’enrichissement des événements de consultation (EC).

Traitement en erreur, Exemple 1 :

 

Exemple 2 :

error: Crossref: CrossRef error: [0] ETIMEDOUT
error: Crossref: CrossRef error: [0] ETIMEDOUT
error: Crossref: CrossRef error: [0] ETIMEDOUT
error: Crossref: CrossRef error: [0] ETIMEDOUT
error: Crossref: CrossRef error: [0] ETIMEDOUT
error: Failed to query Crossref 5 times in a row

 

Exemple 3 :

{"level":"error","message":"Crossref: CrossRef error: [503] Service Unavailable","timestamp":"2017-09-18T20:28:37.728Z"}
{"level":"error","message":"Crossref: CrossRef error: [503] Service Unavailable","timestamp":"2017-09-18T20:28:48.391Z"}
{"level":"error","message":"Crossref: CrossRef error: [503] Service Unavailable","timestamp":"2017-09-18T20:28:59.061Z"}
{"level":"error","message":"Crossref: CrossRef error: [503] Service Unavailable","timestamp":"2017-09-18T20:33:20.938Z"}
{"level":"error","message":"Crossref: CrossRef error: [503] Service Unavailable","timestamp":"2017-09-18T20:45:31.473Z"}

C’est l’exemple de l’enrichissement Crossref qui est pris, car c’est lui qui pose aussi le plus régulièrement problème, étant aussi le plus intensivement mis à contribution par ezPAARSE.

Pour rappel : après avoir filtré, nettoyé vos logs et déclenché ses parseurs, ezPAARSE lance l’enrichissement à l’aide de middlewares qui s’adressent à des services extérieurs (istex, crossref, sudoc, hal). Ces enrichissements rendent les EC plus intéressants et permettent la mise en forme de tableaux de bord très détaillés d’un point bibliographique.

Le Diagnostic et la résolution

Les requêtes émises par l’instance ezPAARSE pour récupérer les enrichissements bibliographiques depuis l’API Crossref échouent.

Il y a trois explications et pistes de résolution, de la plus fréquente à la moins fréquente :
  1.  l’API de Crossref peut être momentanément inaccessible. Il faudra relancer un traitement ezPAARSE plus tard ou désactiver momentanément l’enrichissement Crossref (activé par défaut)
  2. Votre proxy générique (le proxy de l’établissement) n’est pas déclaré dans les variables d’environnement (vérifiez les variables d’environnement HTTP_PROXY et HTTPS_PROXY et leurs variantes en minuscule) de la machine qui héberge votre instance ezPAARSE. Dans ce cas, déclarez les et relancez ezPAARSE : ‘make stop’ puis ‘make start’ pour qu’elles soient prises en compte.
  3. votre proxy est déclaré mais ne laisse pas sortir les requêtes vers Crossref (c’est un paramétrage du proxy à modifier) : relancez un traitementezPAARSE dès que votre proxy est configuré pour laisser les requêtes passer

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *