Tutoriel : Filtrer les plateformes à traiter dans ezPAARSE (maj janvier 2021)

ezpaarse tutos 2020

La fonctionnalité a évolué, à lire dans le dernier paragraphe de l’article (janvier 2021)

 

 

Bonjour,

 

Nous vous proposons une nouvelle fonctionnalité dans ezPAARSE : le traitement ciblé de plateformes.

En quoi cela consiste ?

Par défaut, lors d’un traitement de logs dans ezPAARSE, l’ensemble des parseurs des plateformes éditeurs reconnues (308 à l’heure actuelle) est utilisé. Retrouvez la liste des parseurs dans le dépôt Github.

L’ajout de ce header dans les paramètres d’un traitement de logs va permettre de faire un filtrage sur une ou plusieurs plateformes ciblées. La durée du traitement en sera considérablement réduite, ainsi que la taille du fichier résultat.

Quelle est la procédure à suivre dans l’interface d’ezPAARSE ?

Tout d’abord, déposez un fichier de logs à traiter.

 

EZPAARSE HEADER FILTER PLATFORM 2020

  • Sélectionnez si nécessaire un paramétrage prédéfini (INIST-BIBCNRS dans l’exemple ci-dessus)
  • Ensuite, dans la section « headers avancés » située plus bas, cliquez sur « + AJOUTER« 
  • Entrez « filter-platforms » dans le champ « Nom« . En tapant les premières lettres, une liste d’auto-complétion apparaît.
  • Dans le champ « Valeur« , saisissez la forme abrégée du nom de(s) plateforme(s).

 

ezpaarse github selection npg 2020

La liste des plateformes est au format abrégé

Dans cet exemple, nous souhaitons obtenir un résultat pour les plateformes Science Direct (sd) et Nature Publishing Group (npg).
Pour cela, nous devons saisir les deux noms abrégés, séparés par une virgule.

ezpaarse detail header filter platforms saisi 2020

 

ezpaarse filter platform selection lancer traitement

Cliquez ensuite sur « lancer le traitement« .

 

ezpaarse resultat traitement filter platform 2020

 

Sur le tableau de contrôle, on peut constater que le filtre a bien fonctionné. Le traitement s’est opéré sur 2 plateformes. La durée du traitement est réduite car par défaut, un traitement de logs se fait sur une moyenne de 190 parseurs.

Cliquer sur « Téléchargez le résultat« .

ezpaarse ecs sd et npg 2020

 

Le fichier résultat au format CSV contient uniquement les ECs de Science Direct et Nature Publishing Group.

Les avantages

  • Un traitement ciblé est bien plus rapide qu’un traitement classique, car il ignore l’analyse et l’enrichissement d’un grand nombre d’ECs.
  • Il est possible de choisir une ou plusieurs plateformes dans le champ de valeur du header « filter-platforms« .
  • Le fichier résultat partiel obtenu peut être téléversé dans ezMESURE. Le champ log_id garantit une mise à jours des ECs déjà présents, sans créer de doublons.

Cette fonctionnalité est amenée à évoluer. Une saisie avec auto-complétion du nom des plateformes est d’ores et déjà prévue dans une prochaine version d’ezPAARSE.

 

Evolution par filtrage des plateformes dans Paramètres – en sortie

ezpaarse filtrer les plateformes en sortie

zpaarse selection en sortie filtre plateforme janvier 2021

La fonctionnalité est simplifiée. Il n’est plus nécessaire d’utiliser le header « filter-platforms ».

Dans « Paramètres » – en sortie – filtrer les plateformes

en cliquant dans le champ, un menu déroulant vous propose toute la liste des plateformes dans ezPAARSE. Il suffit de cocher la case des plateformes que vous souhaitez filtrer.

Ensuite, lancez votre traitement.

cette vidéo vous montre la procédure simplifiée en détail.

N’hésitez pas à tester ce type de traitement et à faire part de vos retour à l’équipe ezTEAM.

 

Bonne journée.

Frédéric Truong pour ezTEAM.