Taverna

Fiche logiciel validé
  • Création ou MAJ importante : 12/10/11
  • Correction mineure : 17/02/12
  • Rédacteur de la fiche : Jérôme Pansanel - IPHC (CNRS / Université de Strasbourg)
  • Relecteur(s) : Caroline Bidot (MIA Jouy-en-Josas)
    Mark Hoebeke (Laboratoire Mathématique, Informatique & Génome)
    François Moreews (SIGENAE)
  • Contributions importantes : Marc Wessner a rédigé la première version de cette fiche, puis il a été remplacé par Raphaël Flores, qui a passé le flambeau en Septembre 2011 à Jérôme Pansanel
  • Responsable thématique : Emmanuel Courcelle (LIPM)

Taverna : Conception de workflows et moteur d'exécution

Description
Fonctionnalités générales

Taverna est une application qui permet de construire et d'exécuter des workflows (enchaînements de tâches élémentaires). Chaque étape de ces chaînes de traitements correspond à l'exécution d'un outil disponible localement ou sous forme de service web. L'outil, fortement typé bio-informatique, propose en standard de nombreux services spécifiques, tels que NCBI, Kegg, SoapLab, BioMoby, Biomart et WSDL.

Autres fonctionnalités
  • Exécution des workflows depuis le workbench, la ligne de commande, ou bien à distance sur un serveur Taverna.
  • Plusieurs types de services compatibles : web-services de type WSDL, BioMart, BioMoby, SoapLab, R, Beanshell, REST, XPath services...
  • Suivi détaillé de l'exécution d'un workflow (statut, temps d'exécution des différents processus) et de ses résultats (avec entrées/sorties intermédiaires).
  • Recherche et chargement des workflows stockés sur le site MyExperiment depuis une perspective dédiée.
  • Partage de workflows sur le site MyExperiment.
  • Recherche et chargement des services web recensés sur le site BioCatalogue depuis une perspective dédiée.
  • Ouverture d'un workflow à partir d'une URL ou d'un fichier local.
  • Interface organisée en perspectives (Design, Results, myExperiment, BioCatalogue, etc.)
  • Personnalisation poussée des fonctionnalités et de l'interface (ie. création de nouvelles perspectives).
  • Support des services sécurisés.
  • L'architecture par plugin garantit l'intégration des développements externes.
  • Mise à jour automatique possible des plugins et composants internes, intégrée à l'application.
  • La plupart des services web utilisant WSDL peut être exécutée dans un workflow Taverna (voir exceptions).
  • Les résultats typés par MIME sont directement visualisés dans Taverna si un plugin est disponible (HTML, molécule 3D, text brut...).
Interopérabilité
  • Les workflows créés sont sauvegardés sous un format XML propre à Taverna : le SCUFL2 (Simple Conceptual Unified Flow Language).
  • La version 2 de Taverna reste compatible avec la version 1 du format SCUFL.
  • Il est possible de générer automatiquement des outils Galaxy à partir d'un workflow Taverna 2 via l'outil associé Taverna-Galaxy.
  • Les API Java tierces peuvent être intégrées dans des workflows Taverna en utilisant l'API Consumer Tool.
  • Les autres langages de description de workflows ne sont pas gérés.
  • L'export des formats de provenance OPM et Janus est disponible, à titre expérimental.
Contexte d'utilisation dans mon laboratoire/service
  • Au CNRS, Taverna est utilisé par un public de bio-informaticiens et d'informaticiens.
  • A l'IPHC, Taverna est utilisé pour la soumission de calculs sur la grille de calcul EGI, ainsi que pour le traitement automatique de données en chémoinformatique.
  • Une liste des organisations / laboratoires utilisateurs de Taverna est disponible, précisant le contexte scientifique.
Limitations, difficultés, fonctionnalités importantes non couvertes
  • Les webservices déjà intégrés sont souvent peu documentés. Il n'est pas toujours évident de comprendre les données d'entrée attendues ni le format des données de sortie.
  • Le format de certaines données d'entrée spécifiques (ie. objets BioMoby) reste peu intuitif.
  • Toute mise à jour ou installation d'un plugin nécessite le redémarrage de l'application pour être prise en compte.
Environnement du logiciel
Distributions dans lesquelles ce logiciel est intégré

Taverna est distribué avec la distribution Bio-Linux.

Plates-formes

Linux & Unix-like : Taverna 2.3.0 - anglais
Windows : Taverna 2.3.0 - anglais
Mac OS X : Taverna 2.3.0 - anglais

Logiciels connexes
  • SoapLab est la solution serveur proposée par Martin Senger. Elle permet le déploiement d'outils sous la forme de web services à partir d'un fichier ACD les décrivant. Une fois déployés, ces services peuvent être intégrés dans un workflow en tant qu' étape de traitement, viaTaverna.

    De nombreux plugins sont disponibles pour Taverna (Feta, LogBook, SoapLab, ...)
    Certains plugins apportent de nouvelles fonctionnalités(recherche...), d'autres des nouveaux types de services.

Autres logiciels aux fonctionnalités équivalentes
Environnement de développement
Type de structure associée au développement

L'Université de Manchester (UK) est principalement impliquée dans le développement de Taverna (plus de détails).

Eléments de pérennité

Le développement de Taverna est mené par Tom OINN à l'EBI (European Bioinformatics Institute, Cambridge UK).
Le projet est une collaboration qui fait intervenir les entités suivantes : School of Computer Science Université de Manchester, IT Innovation, the School of Computer Science, Université de Newcastle, Newcastle Centre for Life, Nottingham University Mixed Reality Lab.
Les contributions communautaires sont intégrées notamment sous la forme de plugins.

Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
Documentation utilisateur

La documentation écrite en anglais est disponible sur le site du logiciel (FAQ, doc pour Taverna 1.7 et 2.x, plugins). Elle comporte également un guide de démarrage rapide.
Des tutoriels (pdf & video) et webinars sont recensés dans la partie dédiée.
Un pack de démarrage est mis à la disposition des nouveaux utilisateurs.

Divers (astuces, actualités, sécurité)

L'activité autour de ce logiciel reste toujours importante :

  • La version 2.3 workbench a été publiée en juillet 2011.
  • La version 3 beta a été publiée en avril 2011.
  • La version 2.3 server est prévue pour octobre 2011.
  • La version 3 finale est prévue pour novembre 2011.
  • L'équipe de développement est très réactive aux besoins des utilisateurs, surtout sur la mailing list. La roadmap, qui montre les objectifs à venir du projet, est très chargée.
Contributions