Analyses de plateformes : bilan des journées parseurs 2022

journee parseurs

Bonjour,

Une fois par mois Yannick Schurter, Léo Felix et moi-même nous nous réunissons pour faire le point sur les plateformes qui sont listées sur AnalogIST (et dans le Trello « Suivi des plateformes »).

L’objectif de ces sessions mensuelles est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée ») et de procéder à la création ou à la mise à jour des parseurs pour les rendre disponibles dans ezPAARSE.

Nous avons procédé à la création et à la mise à jours de parseurs pour les plateformes renseignées dans le tableau récapitulatif suivant :

Année 2022
Date d’intégration ezPAARSE Plateforme Création / Révision du parseur RTYPE – type d’accès validés

(ARTICLE, ABS, BOOK,…)

formats validés (HTML, PDF,…) Présence du DOI

dans l’url (oui/non)

Commentaires
12/01/2022 OMEKA création SEARCH, REF, TOC HTML non données de la recherche Inist-CNRS
12/01/2022 ISTEX API révision QUERY HTML non
12/01/2022 ISTEX API révision METADA_BUNDLE ZIP non
12/01/2022 AAAS création ARTICLE HTML, PDF oui ancienne plateforme agrégée HIGHWIRE
12/01/2022 AAAS création TOC HTML non ancienne plateforme agrégée HIGHWIRE
12/01/2022 WANFAN_data création ARTICLE PDF non
12/01/2022 WANFAN_data création ABS HTML non
16/02/2022 ISTEX API révision METADATA_BUNDLE ZIP non
16/02/2022 OECD Ilibrary révision ARTICLE PDF non BOOK_SECTION n’est pas différenciable de ARTICLE
16/02/2022 DeGruyter révision RECORD_VIEW HTML non
23/03/2022 ISTEX API révision ISTEXDL_BUNDLE, SINGLE_DOC_BUNDLE ZIP non renommage de METADA_BUNDLE et BUNDLE
23/02/2022 CAP FINANCIAL création SEARCH, FICHE_ENTREPRISE HTML non
23/02/2022 BIOCYC création SEARCH, RECORD_VIEW HTML non
27/04/2022 SCIENCE DIRECT révision SEARCH, TOC HTML non
27/04/2022 SILVERCHAIR (AACR) révision ARTICLE HTML oui
27/04/2022 SILVERCHAIR (AACR) révision ARTICLE PDF non domaine watermark.silverchair

sans DOI

27/04/2022 SILVERCHAIR (AACR) révision ARTICLE HTML non
27/04/2022 PNAS création ARTICLE HTML, PDF oui ancienne plateforme agrégée HIGHWIRE
27/04/2022 PNAS création TOC HTML non ancienne plateforme agrégée HIGHWIRE
27/04/2022 NUMILOG révision SEARCH HTML non
27/04/2022 LEGALNEWS création SEARCH HTML non
27/04/2022 EUROPRESSE révision SEARCH HTML non
27/04/2022 LE MONDE révision ISSUE,ARTICLE HTML non
27/04/2022 LE PROGRES création SEARCH, ISSUE, ARTICLE HTML non
27/04/2022 TDM création SEARCH HTML non
08/06/2022 DORANUM création SEARCH HTML non données de la recherche – Inist-CNRS
08/06/2022 DORANUM création RECORD HTML, ZIP oui
08/06/2022 MEDIACITES création SEARCH, ARTICLE HTML non
08/06/2022 TRIBUNE DE LYON création SEARCH HTML non
08/06/2022 LES ECHOS création SEARCH, ISSUE, ARTICLE HTML non
08/06/2022 LE QUOTIDIEN DU MEDECIN création SEARCH, ARTICLE HTML non
08/06/2022 LE FIGARO création SEARCH, ISSUE, ARTICLE HTML non
08/06/2022 EGORA création SEARCH, ARTICLE HTML non
08/06/2022 BECK ONLINE révision SEARCH, ARTICLE, BOOK_SECTION HTML oui
08/06/2022 BECK ONLINE révision BOOK_SECTION PDF oui
24/08/2022 ISTEX API révision ISTEX BUNDLE SIZE non mise à jour de la valeur du champ
24/08/2022 ASCB révision ARTICLE PDF, HTML oui ancienne plateforme agrégée Highwire
24/08/2022 SCIFINDER-N création SEARCH, RECORD_VIEW, FULL_TEXT_USE HTML non
24/08/2022 BIBLIOTHEQUE ENI révision SEARCH, VIDEO, BOOK_SECTION, BOOK HTML non
24/08/2022 LYELL COLLECTION révision ARTICLE HTML, PDF oui ancienne plateforme agrégée HIGHWIRE
05/10/2022 SILVERCHAIR révision SEARCH HTML non
05/10/2022 SILVERCHAIR révision ARTICLE HTML non GSW, ASME problème du domaine WWW.
05/10/2022 TRIBUNE DE LYON révision ARTICLE HTML non
05/10/2022 ISTEX API révision OPENURL HTML non multiopenurl méthode POST
16/11/2022 Prairial création non défini HTML oui (TOC ou ARTICLE) url similaire
16/11/2022 Prairial création ARTICLE PDF oui reconstitution DOI avec 10.35562
16/11/2022 Prairial création ARTICLE PDF oui Revue Bacaly
16/11/2022 Demeter création TOC HTML non Base de Theses de L’UCO
16/11/2022 Demeter création SEARCH HTML non
16/11/2022 Demeter création MASTER_THESIS PDF non
16/11/2022 Demeter création RECORD_VIEW HTML non
16/11/2022 MEDIATHEQUE NUMERIQUE création SEARCH HTML non
16/11/2022 MEDIATHEQUE NUMERIQUE création VIDEO MISC non
16/11/2022 MEDIATHEQUE NUMERIQUE création ABS HTML non
16/11/2022 ARTE CAMPUS création ABS HTML non
16/11/2022 ARTE CAMPUS création SEARCH HTML non
16/11/2022 JOHN LIBBEY révision SUPPL PDF non
16/11/2022 JOHN LIBBEY révision ABS HTML non
16/11/2022 JOHN LIBBEY révision ARTICLE HTML non
16/11/2022 JOHN LIBBEY révision ARTICLE PDF non

Le tableau est mis à jour après chaque journées parseurs pour avoir une vision annuelle des développements opérés.

Chaque carte du Trello contient les informations d’une plateforme éditeur ainsi que l’avancée de son traitement. Une plateforme mise à jour atteint le statut « 5 parseur à tester avec de vrais logs ».

Vous pouvez retrouver toutes les informations, les commentaires et les échanges avec l’équipe de développement dans le Trello « Suivi des plateformes »

trello analyses plateformes juillet 2021

 

Nous vous invitons maintenant à tester ces plateformes avec ezLOGGER, ou directement avec vos logs que vous traiterez dans votre instance locale ezPAARSE elle même mise-à-jour.

Retraitement des logs d’une année complète :

Pour bénéficier de données d’usages à jour, obtenues par l’ensemble des intégrations des parseurs dans ezPAARSE renseignés dans le tableau , nous vous conseillons de retraiter vos logs d’une année complète au mois de janvier de l’année suivante. Vérifiez que votre instance ezPAARSE est à jour et effectuez un redémarrage de l’application avant le retraitement.

 

 

Frédéric Truong pour ezTEAM