Classiques Garnier: mise à jour de la plateforme

 

Bonjour à toutes et à tous,

Lors de la dernière sprint Review de décembre 2016, nous avons évoqué l’analyse de la plateforme Classique Garnier.

En effet, la consultation des bases de données des dictionnaires comporte une URL unique affichée dans la barre d’adresse du navigateur. Cela posait problème et il a fallu passer par une analyse des URLs cachées (celles qui apparaissent dans les logs de consultation) pour en dégager des identifiants utilisables dans le parseur.

 

Dans ce cas précis, nous avons déjà pu identifier les consultations suivantes :

Consultation d’un article en HTML

http://www.classiques-garnier.com:80/numerique-bases/index.php?module=App&action=PanelText&link=jmp_article_17%09-A-%0A

L’élément “jmp_article” permet d’attribuer le RTYPE “ARTICLE”

Consultation d’une table des matières en HTML

http://www.classiques-garnier.com/numerique-bases/index.php?module=App&action=PanelTabmat&link=jmp_tabmat__tmxa_007

l’élément “jmp_tabmat” permet d’attribuer le RTYPE “TOC”

Dans la section “Open access” de la plateforme, nous avons pu également détecter une

Consultation d’un article en PDF

http://www.classiques-garnier.com.inshs.bib.cnrs.fr/doi/article-pdf?article=HpeMS02_9

les éléments “article” et “pdf” définissent le RTYPE “ARTICLE” et le mime “PDF”

Nous avons donc développé un premier parseur avec ces informations qui nous paraissent les plus fiables pour le moment.

 

Nous souhaitons une participation de votre part pour tester ce parseur et nous communiquer votre avis. N’hésitez pas à venir commenter ou compléter l’analyse de la plateforme directement sur  Analyses de la plateforme Classique Garnier .

 

Merci de votre participation

 

Bonne fin de journée.

Fréderic pour ezTEAM

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *