GPLv2
IBMM
CNRS, Université Montpellier1 & 2
La base de données HAL sert de base de production des publications pour le CNRS sur le plan national.
Wikindx est un logiciel de type PHP/MySQL qui nous permet d’avoir une base de données locale de nos publications facilement exploitable. Pour l’instant, l’import des données provenant de la base nationale, bien que perfectible, est opérationnel. Il se base sur le protocole OAI et un parser XML.
HAL : http://hal.archives-ouvertes.fr/
Wikindx : http://wikindx.sourceforge.net/
OAI : http://www.culture.gouv.fr/culture/dll/OAI-PMH.htm
L’objectif à terme est de pouvoir non seulement importer, mais aussi :
– finaliser ce module avec les développeurs de Wikindx via le système de module Wikindx :
http://wikindx.sourceforge.net/extras.html
– Dans un second temps, il faudra pouvoir envoyer des données à HAL, directement à partir de notre base, afin que le rajout et la manipulation des publications se retrouvent simplifiés pour
l’utilisateur final : le chercheur.
- Le module permet également de rechercher les doublons, ce que ne permet pas HAL…
Ce type de projet permettrait, à terme :
- D’exporter rapidement les publications du laboratoire, d’une équipe, ou d’une personne, pour :
* Un site Web (fonctionne déjà),
* Un rapport d’activité (facile à réaliser à partir du système d’export vers html)….
* De suivre l’activité de recherche du laboratoire et de ses membres entre 2 rapports d’activité.
La nouvelle politique de recherche française, où les financements sont de plus en plus obtenus sur des appels à projets, nécessite toujours plus de travail administratif pour les chercheurs. Un des objectifs de ce type de projet est de créer une base unique permettant de réduire au maximum la partie non scientifique de l’activité des chercheurs.
Il n’y a, actuellement, que très peu de système connu permettant de faire ceci.
A ma connaissance, il n’y a que le logiciel "AIGLe" (Aide Intéractive à la Gestion de Laboratoire) de Dominique Caron :
http://aigle.sourceforge.net/
Cependant, nous ne l’utilisons pas pour les raisons suivantes :
– Trop complexe et trop complet (usine à gaz).
– Wikindx est prévu et conçu pour l’administration d’une base de données spécifiquement orienté pour les publications.
Wikindx permet de réaliser de nombreux imports/exports à partir de données locales (type EndNote ou BibTeX), ce que ne permet pas AIGLe actuellement.
Nous cherchions un moyen d’avoir nos listes de publication localement, pour pouvoir travailler dessus rapidement et simplement.
Les avantages d’avoir une base en interne sont nombreux… Rapports d’activité, mi-parcours, extractions multiples pour les chercheurs, le site Web… Le besoin était là, il manquait le logiciel (ou bien il en existait : trop complet ou bien pas assez…). D’où le développement d’un module. Un premier stagiaire de niveau IUT a codé l’import. Il manque l’export et à finaliser l’import auprès de Wikindx (officiellement).
Pour Wikindx, répertoire docs, une fois installée.
Pour notre module : un fichier README…
Pour HAL : le site du CCSD : http://ccsd.cnrs.fr/
Pour l’instant il n’y a donc pas beaucoup de documentation pour notre module…
Wikindx, (d’origine) permet de récupérer des données EndNote (XML) ou bien BibTeX. Il permet de faire des exports rtf, ris, EndNote Tab/XML, BibTeX, HTML.
Cela permet d’améliorer grandement l’interopérabilité.
Apache, PHP5, MYSQL, Wikindx3.
LAMP ((Linux), Apache, MySQL, PHP5)
PHP5, SQL
En l’heure actuelle, 2500 lignes de code simplement pour notre module.
Dans l’optique d’un développement ultérieur, j’ai insisté sur les points suivants : Algorithme, aération du code, commentaires, pertinence des noms utilisés (tables, fichiers, variables…). Le projet, dans le cadre de sa finalisation, avec l’équipe de Wikindx, lui assurera une certaine pérennité.
D’un point de vue de la portabilité, il y a un fichier config.php dans Wikindx, réutilisé par notre module pour récupérer les
informations de connexions à la base. Un autre fichier de configuration est utilisé par notre module pour connaitre :
- Le nom de la collection correspondant au laboratoire dans
HAL (préalablement créée par le tamponneur ou par le service technique CCSD de HAL).
- La date de création du laboratoire (optionnel : permet de distinguer les publications d’un chercheur avant son arrivée dans un laboratoire de ses autres publications).
3.8.2 pour Wikindx / 0.6 pour notre module
Début mars 2008
0
En test, sur deux laboratoires.
Travaux à réaliser :
- Réaliser l’export des données vers HAL, grâce à SOAP, via le bon format XML, pour ne plus avoir à travailler qu’à partir de notre base.
- finaliser le module avec l’équipe de développement de Wikindx.
1 personne à temps plein pendant 3/4 mois (contractuel ou stagiaire de niveau licence/maitrise minimum.)
1 poste de travail.
Les éventuelles évolutions futures, suite à ce projet, sont :
– Intégrer l’authentification via un annuaire LDAP dans le code de base de Wikindx (le code existe mais n’est pas assez finalisé).
– Intégration à un Intranet plus général (mais module séparé),
– scripts PERL pour « parser » les fichiers word des chercheurs qui ont encore leur base sous cette forme…
Commentaires
Fiche logiciel en test
Ce logiciel est maintenant décrit par une fiche PLUME de logiciel en test (accessible uniquement aux membres PLUME)
http://www.projet-plume.org/fiche/halwkx