base de données

Bases de données, annuaires...
Fiche logiciel validé
  • Création ou MAJ importante : 04/11/13
  • Correction mineure : 04/11/13
  • Rédacteur de la fiche : Pascal Mietlicki - Service informatique vice-rectorat de Nouvelle-Calédonie (Ministère de l'éducation nationale)
  • Relecteur(s) : Stéphane Deraco (DSI CNRS)
  • Responsable thématique : David Rousse (CNRS DSI)
Mots-clés

Talend Open Studio : solution d’intégration de données open source

Description
Fonctionnalités générales

Talend Open Studio for Data Integration est une solution d’intégration de données open source flexible et puissante. C'est un ETL (Extract Transform Load) open source basé sur Eclipse.

Il permet d'interagir avec les données de votre Système d'Information, les intégrer, les mettre en forme, les transformer, ...

L'interface générale vous permet de créer des "jobs" qui contiendront le workflow voulu, un workflow étant un ensemble d'activités qui s’enchaînent via l'utilisation de "composants". Comme dans un système standard d'entrée / sortie, vous avez des composants en entrée (input) et en sortie (output) qui vous permettent d'obtenir le résultat voulu (export CSV, envoi d'email pour indiquer les erreurs le cas échéant, etc). Ces composants s'interfacent entre eux via un ensemble d'"interactions" (linéaire, en cas d'erreur, en parallèle).

Un exemple typique est le fait de vouloir alimenter une base de données à partir d'autres bases tout en adaptant les données à votre convenance. Pour ce faire, vous créez un ou plusieurs "jobs", puis des composants d'entrée de base de données (tMysqlInput par exemple), puis vous récupérez le contenu de la table désirée pour laquelle vous transformez vos données (par exemple, passer d'un champ texte vers un champ date) via un composant de type tMap dont le résultat en sortie alimentera une autre base de données (tPostgresqlOutput par exemple).

Une fois terminé, il ne vous reste plus qu'à exécuter le job soit en mode débogage soit en mode normal, ce dernier étant évidemment plus rapide, avec les variables d'entrée voulues (nom de la base, nom du serveur, autres paramètres) en utilisant des variables de "contextes". En effet, vos "jobs" peuvent être paramétrés, et vous pouvez également avoir différents types de "contextes" (par exemple dév, pré-prod, prod).

Une des fonctionnalités les plus intéressantes est le fait de pouvoir générer des scripts en Perl ou Java pour exécuter vos "jobs" directement sur vos serveurs. Ainsi vous pouvez les exporter et les planifier pour s'exécuter aux heures voulues. Vous pouvez même créer un "job" qui sera en écoute d'une modification (par exemple modification d'un fichier) et qui sera alors exécuté lorsque cet événement surviendra.

Autres fonctionnalités

Talend Open Studio vous permet de créer et de générer toute la documentation de votre projet. Il utilise, pour cela, le formalisme UML. Vous pouvez indiquer des commentaires, des informations sur chaque composant de votre projet.

Etant basé sur Eclipse, vous pouvez aussi intégrer votre propre code à votre projet. Vous pouvez également y intégrer des classes ou objets ce qui vous permet de les utiliser sur plusieurs jobs différents.

Talend Open Studio permet également de traiter des problématiques proches de l'intégration des données, comme des projets de MDM (Master Data Management) et de qualité de données.

Interopérabilité

Compatible avec quasiment tous les standards du marché, une liste est visible sur :
http://www.talendforge.org/components/

Si, toutefois, un composant n'existait pas, vous pouvez le créer vous-même et le proposer à la communauté (http://www.talendforge.org).

Contexte d'utilisation dans mon laboratoire/service
  • Nous l'utilisons comme un générateur de script. Le grand atout de Talend Open Studio est de pouvoir générer des scripts très facilement, son interface est intuitive et vous permet d'effectuer très rapidement ce que vous auriez mis des semaines à coder.
  • Exemple typique : alimentation d'une base de données à partir de plusieurs bases de données différentes, création de Web Services, export LDIF paramétré du LDAP, enchaînement de tâches, création d'une IHM Java pour alimenter une base depuis un fichier CSV, ...
Limitations, difficultés, fonctionnalités importantes non couvertes
  • En cas de difficultés, il y a pléthore d'informations sur le Web :
    http://www.talendforge.org
    https://help.talend.com

  • Talend étant une entreprise française, vous n'aurez donc pas de difficultés à trouver des informations dans la langue de Molière.

Environnement du logiciel
Plates-formes

Logiciel Java

Logiciels connexes

Eclipse

Autres logiciels aux fonctionnalités équivalentes
Environnement de développement
Type de structure associée au développement

Éditeur professionnel, communauté associée.

Eléments de pérennité

Basé sur Eclipse, forte communauté d'utilisateurs et de contributeurs. De plus, Talend est une entreprise en expansion et propose tout un ensemble de services tiers, autour de l'ESB en particulier (services qui, si cela vous intéresse, sont payants).

Références d'utilisateurs institutionnels

Entre autres utilisateurs institutionnels, on peut citer :
- L'Université Toulouse 1.
- L'INRA.

Environnement utilisateur
Liste de diffusion ou de discussion, support et forums
Documentation utilisateur
Divers (astuces, actualités, sécurité)
  • Une multitude de composants existent :
    http://www.talendforge.org/components/

  • Un projet intéressant à créer serait d'avoir un composant IHM qui permettrait d'exporter une fonctionnalité présente sur Talend Open Studio (lorsque le job est exécuté depuis Open Studio), mais actuellement non présente quand le job est exporté et exécuté, qui est de renseigner les paramètres d'entrée du job. Ce composant afficherait une IHM dynamique permettant à l'utilisateur de saisir ces paramètres (une fenêtre avec les différents types de variables en entrée tel qu'un calendrier pour les dates, une zone de saisie pour le texte, un champ adresse IP ou DNS pour le serveur, etc).

Contributions

Principalement via Talend Exchange (informations sur http://www.talendforge.org/) :
http://www.talendforge.org/exchange/

Mots-clés

Journées réseau Bases de données - 20/21/22 novembre 2013 - Paris

Les journées de rencontres du réseau RBDD se tiendront du 20 au 22 novembre 2013 à Paris (délégation du CNRS Paris Michel-Ange). Le pré-programme et ainsi que la fiche d'inscription sont disponibles ici : http://rbdd.cnrs.fr/spip.php?article134

La date limite d’inscription est fixée au 17 octobre prochain (le nombre de places est limité !).

FindStat : the Combinatorial Statistic Finder

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 07/10/13
  • Correction mineure : 07/10/13
Mots-clés

FindStat : the Combinatorial Statistic Finder

FindStat est à la fois une base de données et un service web pour les chercheurs en combinatoire.

La combinatoire est l'étude des ensembles finis d'objets. A ces objets, on associe souvent des nombres qu'on appelle des statistiques. Par exemple, à une permutation [2,4,1,3], on associe le nombre d'inversion (ici 3 inversions : 2 et 1, 4 et 1, 4 et 3). FindStat se propose de répertorier les différents objets combinatoires et les statistiques qui leur sont associées.

Le service web permet à un chercheur de savoir si les nombres qu'il obtient dans ses calculs correspondent à une statistique connue dans la base de données. Par ailleurs, les objets combinatoires sont liés par de nombreuses bijections et certaines statistiques se comprennent mieux sur certains objets que sur d'autres. FindStat utilise Sage et Sage-Combinat pour appliquer toutes les transformations connues sur les objets entrés par l'utilisateur et ainsi décupler le nombre de statistiques à comparer.

Publications associées :

Sarah Biley and Bridget E. Tenner
Fingerprint Databases for Theorems
AMS Notices, September 2013,
http://www.ams.org/notices/201308/rnoti-p1034.pdf

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 03/09/13
  • Correction mineure : 03/09/13
Mots-clés

tabwebexp : tableur web de saisie d'expériences multi-utilisateurs

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 1 - 2012
  • Licence(s) : choix en cours, contacter l'auteur
  • Etat : utilisé en interne
  • Support : maintenu, sans développement en cours
  • Concepteur(s) : Gérard Henry
  • Contact concepteur(s) : www.latp.univ-mrs.fr/~henry
  • Laboratoire(s), service(s)... : LATP

 

Fonctionnalités générales du logiciel

Cette application est destinée à stocker les données d'une expérience. Par rapport à un simple tableur, elle permet de réunir simplement les saisies faites par plusieurs expérimentateurs, et de garder un historique des saisies. Cette caractéristique est essentielle dans le post-traitement. Les données à saisir sont variées et en grande quantité.

Pendant le post-traitement, il est important de différencier les mesures de chaque expérimentateur. Cet aspect multi-utilisateurs a conduit au choix d'une application web, et à la mise en œuvre d'une base de données.

Les fonctionnalités sont :

  • authentification et gestion de session par utilisateur
  • saisie pour tous les sujets par jour ou pour tous les jours par sujet
  • extraction des données selon certains critères (par utilisateur, pour tous les utilisateurs, les plus récentes)
  • plusieurs formats d'exportation (txt, csv, monolix)
  • graphiques avec choix des courbes par sujet, expérimentateur, site, ...

L'installation de cette application nécessite un serveur web et le module python. Le développement s'appuie sur le framework Django.

Contexte d’utilisation du logiciel

L'application est en cours d'utilisation depuis le printemps 2012, par des pharmaciens et des mathématiciens, et dans le projet ANR Memorex.

L'application est déployée sur un serveur d'applications de mon laboratoire, le LATP.

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 03/09/13
  • Correction mineure : 03/09/13
Mots-clés

solvqual : qualification de solveurs pour matrices creuses

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like
  • Version actuelle : 1.1.0 - février 2011
  • Licence(s) : choix en cours, contacter l'auteur
  • Etat : en développement
  • Support : maintenu, développement en cours
  • Concepteur(s) : Gérard Henry
  • Contact concepteur(s) : www.latp.univ-mrs.fr/~henry
  • Laboratoire(s), service(s)... : LATP, GDR Momas

 

Fonctionnalités générales du logiciel

Il s'agit de permettre à des utilisateurs d'expérimenter différents solveurs sans autre contrainte que l'écriture de leur matrice dans le format XDR.

Les fonctionnalités principales sont :

  • authentification
  • stockage des matrices et des résultats à long terme
  • garantie d'exécution dans un environnent précis afin de procéder à des comparaisons
  • possibilité de soumission en masse
  • état des ressources
  • réception d'un mail lorsque les résultats sont disponibles
  • graphes des résultats
  • publication pour comparaison avec d'autres utilisateurs (sous réserve que les méthodes employées pour générer la matrice le permettent)
  • disponibilité de solveurs UMFPACK, DUNE-ISTL, et PETSc (pour éviter une installation locale)
Contexte d’utilisation du logiciel

Cette application a été développée à l'occasion de la conférence FVCA6 (The International Symposium on Finite Volumes for Complex Applications) qui a eu lieu en juin 2011.

Une nouvelle version est en cours de développement, des matrices (au format XDR) pour le Benchmark 3D pourront être testées, et l'accès à des librairies parallèles sera proposé. Elle est déployée sur le serveur d'applications de mon laboratoire, le LATP.

Publications liées au logiciel

Robert Eymard, Gerard Henry, Raphaele Herbin, Florence Hubert, Robert Klöfkorn, Gianmarco Manzini, 3D Benchmark on Discretization Schemes for Anisotropic Diffusion Problems on General Grid, Proceedings Finite Volumes for Complex Applications VI (June 2011), Editors: J. Fořt, J. Fürst, J. Halama, R. Herbin, F. Hubert, en cours de publication.

La présentation dans la séance Benchmark est disponible ici : http://marian.fsik.cvut.cz/~fvca6/slides/142/.

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 06/06/13
  • Correction mineure : 24/06/13
  • Auteur de la fiche : Eric Hivon (IAP)
  • Responsable thématique : Dirk Hoffmann (Centre de Physique des Particules de Marseille (CPPM-IN2P3))

HEALPix : analyse de données, simulation et visualisation sur la sphère

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : 3.11 - avril 2013
  • Licence(s) : GPL - GPLv2
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Eric Hivon; Martin Reinecke; Krzysztof M. Gorski; Anthony J. Banday; Benjamin D. Wandelt; Emmanuel Joliet; William O'Mullane; Cyrille Rosset; Andrea Zonca
  • Contact concepteur(s) : hivon at iap.fr
  • Laboratoire(s), service(s)... : APC, IAP, IRAP, Labo à l'étranger, MPA (Garching, Allemagne), Caltech (Pasadena, CA,Etats-Unis), TAC (Copenhague, Danemark), ESAC (Madrid, Espagne), JPL (Pasadena, CA, Etats-Unis), ESO (Garching, Allemagne)

 

Fonctionnalités générales du logiciel

Le logiciel HEALPix met en œuvre la pixellisation de la sphère HEALPix (Hierarchical Equal Area iso-Latitude Pixelation ou pixellisation hiérarchique iso-latitude de surface égale). Initialement développés pour la simulation et l'analyse des observations du satellite européen Planck (dédié à l'étude du fond diffus cosmologique (ou CMB) dont les résultats ont été livrés en mars 2013), cette pixellisation et ce logiciel, sont devenus un standard dans l'analyse et la simulation de données sur la sphère, y compris le satellite WMAP de la NASA pour l'observation du CMB, et l'observatoire Pierre Auger (dédié à l'étude des rayons cosmiques de très haute énergie), et sont utilisés pour d'autres études astrophysiques et géologiques.

Spécificités de la pixellisation

A une résolution donnée, tous les pixels HEALPix ont la même surface, même si leur forme diffère légèrement. Le caractère hiérarchique de la pixellisation permet de passer à la résolution supérieure en divisant chaque pixel en 4 sous-pixels de même surface. Cette propriété permet d'effectuer efficacement et rapidement les opérations de dégradation ou d'amélioration en résolution.

L'arrangement en cercles de latitude constante des pixels permet un calcul extrêmement efficace des harmoniques sphériques réduisant le nombre d’opérations nécessaires pour une synthèse ou une analyse d'une carte de Npix pixels jusqu'au multipôle Lmax de Npix Lmax2 à Npix½ Lmax2.

Fonctionnalités du logiciel

Le logiciel HEALPix permet la représentation de données sur la sphère, et d'effectuer des analyses ou simulations de ces cartes en harmoniques sphériques (scalaires ou spinnées) ainsi que différents types d'analyses statistiques et de manipulations. Les entrées et sorties des données se font par des fichiers FITS. Sont par exemple possibles :

  • la génération de cartes aléatoires (gaussiennes ou pas) à partir d'un spectre de puissance angulaire,
  • le calcul du spectre de puissance angulaire (ou fonction de corrélation angulaire) d'une carte,
  • le filtrage spectral arbitraire d'une carte sur la sphère,
  • la pixellisation de la sphere et la manipulation des pixels jusqu'à des tailles de pixels de 0.4 milliarcsecond (ce qui équivaudrait à 3.5 1018 pixels sur la sphere),
  • l'application d'un filtre médian sur une carte,
  • l'identification des extrema locaux d'une carte,
  • la recherche de tous les pixels dans une région donnée (disque, triangle, polygone, ...),
  • la manipulation de masques binaires afin d'identifier les 'trous' pour les boucher, ou d'apodiser les masques,
  • la visualisation des cartes HEALPix, que ce soit sur tout le ciel (projections de Mollweide et orthographique) ou une partie du ciel (projections gnomonique et cartesienne),
  • la sortie des cartes produites au format Google Map/Google Sky et DomeMaster.

Les opérations les plus coûteuses (en particulier le calcul des Harmoniques Sphériques) ont été particulièrement optimisées et sont parallelisées pour les architectures à mémoire partagée (grace à OpenMP).

Contenu du logiciel

Le logiciel est disponible sous forme de codes sources en C, C++, Fortran90, IDL/GDL, java et python. Dans chacun de ces languages sont disponibles

  • une librairie d'outils (subroutines, fonctions, procédures, modules, classes, ... suivant les langages) couvrant l'ensemble des fonctionnalités décrites ci-dessus, ainsi que certaines tâches ancillaires (eg, lecture de fichiers de parametres),
  • un jeu d'applications "prêtes à servir" basées sur cette librairie et mettant chacune en oeuvre une des fonctionnalités majeures d'HEALPix (génération ou analyse de cartes, filtrages, changements de résolution, visualisation, ...). Ces applications ont généralement pour interface un dialogue interactif ou un simple fichier ASCII de parametres. Les codes sources de ces applications peuvent servir de point de départ aux développements spécifiques des utilisateurs,
  • une documentation en PDF et/ou HTML décrivant en détail l'interface de programmation, le fonctionnement et les limitations de chaque outil et de chaque application.

Enfin des outils (script interactif et Makefile) sont fournis pour prendre en charge et faciliter la compilation et l'installation d'une ou plusieurs des différentes librairies et applications, pour différentes combinaisons de materiels informatiques, systemes d'exploitations, compilateurs, ...

Developpements exterieurs

Deux types de développements exterieurs (définis comme ne faisant pas (encore) partie du logiciel HEALPix officiel décrit ci-dessus) peuvent etre distingués:

  • additions de nouvelles fonctionnalités: par exemple de nombreux outils d'analyses basés sur les fonctionnelles de Minkowski, les ondelettes (iSAP, MRS, S2LET, SphereLab) ou l'identification de structure (DisPerSE) developpés par d'autres équipes de recherche peuvent être appliqués à des données pixellisées avec HEALPix,
  • des traductions ou re-implementations d'une partie des fonctionnalités existantes: par exemple en Matlab/Octave (Mealpix) et Yorick (YHeal), voir liste (presque) complète.
Contexte d’utilisation du logiciel

Logiciel utilisé pour l'analyse des données du satellite Planck.

Format supporté par l'outil de visualisation Aladin pour la représentation de données astronomiques étendues sur le ciel.

Publications liées au logiciel

Mots-clés

Formation : bases de données XML natives

Cette formation de 3 jours est organisée par MutEC et PLUME. Elle se tiendra à Lyon les 22-23-24 mai 2013.

La formation a pour objectif de faire découvrir les bases de données XML natives aux chercheur-es et ingénieur-es qui manipulent des données XML (corpus textuels, éditions critiques, etc.) mais qui pour diverses raisons n'utilisent pas actuellement de bases de données XML natives. La formation présentera les logiciels BaseX et eXist-db.

Le nombre de places étant limité, la priorité sera donnée aux candidat-es impliqué-es dans des projets de recherche en cours manipulant des données XML.

Date limite d'inscription : 28 avril 2013

Contacts :
- Maud Ingarao maud [dot] ingarao [at] ens-lyon [dot] fr
- Nathalie Arlin nathalie [dot] arlin [at] ens-lyon [dot] fr

Fiche dév Ens Sup - Recherche
  • Création ou MAJ importante : 12/04/13
  • Correction mineure : 22/05/13
Mots-clés

Pulman : gestion des publications scientifiques d'un laboratoire

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
  • Site web
  • Système : UNIX-like, Windows, MacOS X
  • Version actuelle : version 2.0.10 - mars 2013
  • Licence(s) : GPL - http://projects.laas.fr/ezpublish/index.php/pulman_public/A-propos
  • Etat : diffusé, stable
  • Support : maintenu, développement en cours
  • Concepteur(s) : Thierry Danard, Gérald Cavallini, Jean-Marc Larré, Laurent Lequièvre, Jean-Michel Pons, Laurent Thomassin
  • Contact concepteur(s) : Jean-Marc.Larre@laas.fr
  • Laboratoire(s), service(s)... : LAAS

 

Fonctionnalités générales du logiciel

Pulman est un logiciel développé au LAAS-CNRS pour gérer toutes les publications du laboratoire.

Les laboratoires produisant une grande quantité de publications doivent automatiser des traitements sur ces publications afin de proposer aux chercheurs, aux directions et aux instances d'évaluations des données précises sur la production scientifique. Pulman permet de classifier les publications en tenant compte d'éléments complexes qui caractérisent les publications (revues, conférences, auteurs, etc).

Voici quelques fonctionnalités de l'outil :

  • gestion des auteurs internes et externes avec leur affectation dans une équipe et un pôle (deux niveaux de l'organigramme)
  • gestion des mots clés,
  • gestion des revues et de leur importance (bases de données internationales),
  • gestion des conférences,
  • plusieurs formes de recherches dans la base de données sont possibles ainsi que des exports.

D'autres fonctionnalités sont décrites sur le site du projet :

Pulman est organisé en documents, chaque document possède au moins un support. Un support est la forme qu'a prise l'information scientifique pour être rendue publique, par exemple l'information scientifique a été publiée dans une revue et a fait l'objet d'une présentation dans une conférence (ici deux supports sont déclarés).

Pulman est un logiciel développé en Java avec une base de données Oracle.

Voici une copie d'écran présentant la modification d'une publication avec trois types de support :

Contexte d’utilisation du logiciel

Pulman est utilisé depuis une dizaine d'années au LAAS-CNRS. Aujourd'hui environ 15000 documents sont liés à 27000 supports. Seul le service de documentation du laboratoire est habilité à saisir les publications dans Pulman. L'accès aux publications est public, les utlisateurs peuvent interroger la base de données des publications en utilisant un logiciel de type client léger depuis un navigateur Web.
La Base de Données Pulman du LAAS est accessible à cette adresse : http://www.laas.fr/pulman/pulman-isens/web/app.php/

Au LAAS, la base de données est hébergée sur un serveur Oracle 11G, le service de documentation utilise la version 2.0.10 du client Pulman en version Mac et Windows.

Publications liées au logiciel

La documentation complète (installation, licence, configuration, etc) est accessible à cette adresse : http://projects.laas.fr/pulman

La liste de diffusion pulman [at] laas [dot] fr est disponible. L'abonnement est libre et peut se réaliser depuis le serveur sympa du Laas.

 

Action de formation - Bases de données XML natives

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 24/04/13
  • Correction mineure : 10/07/13
  • Auteur : Maud Ingarao (Institut d'Histoire de la Pensée Classique - ENS Lyon)
Mots-clés

Action de formation - Bases de données XML natives

  • Type de ressource : formation / cours
  • Date de publication du document ou de l'événement : mai 2013
  • Auteur(s) ou responsable(s) : Maud Ingarao (maud.ingarao @ ens-lyon.fr) (ENS-Lyon) et Nathalie Arlin (nathalie.arlin @ ens-lyon.fr) (ENS-Lyon)
  • Contact pour plus d'informations : Maud Ingarao (maud.ingarao @ ens-lyon.fr) (ENS-Lyon) et Nathalie Arlin (nathalie.arlin @ ens-lyon.fr) (ENS-Lyon)

MutEC Projet PlumeARC5

MutEC et le Projet Plume, avec le soutien de la Région Rhône-Alpes, organisent une

Formation aux bases de données XML natives

du 22 au 24 mai 2013

au Centre Blaise Pascal, ENS de Lyon
Salle des travaux pratiques
Bâtiment LR6
46 allée d'Italie
69007 Lyon
Plan d'accès

Cette formation a pour objectif de faire découvrir les bases de données XML natives aux chercheur-es et ingénieur-es qui manipulent des données XML (corpus textuels, éditions critiques, etc.) mais qui pour diverses raisons n'utilisent pas actuellement de bases de données XML natives.

La formation présentera les logiciels BaseX (enseignement en anglais) et eXist-db (enseignement en français), et se déroulera en trois temps :

Mercredi 22 mai 2013 - Ma première application web avec eXist-db - 9h30-17h30

Formateurs
Michel Jacobson (Service interministériel des Archives de France)
Clément Plancq (Laboratoire de linguistique formelle, UMR 7110)

Jeudi 23 mai 2013 - Ma première application web avec BaseX - 9h30-17h30 (enseignement en anglais)

Formateurs
Christian Grün (Université de Constance, Société BaseX)
Sous réserve : Michael Seiferle (Société BaseX)
Sous réserve : Alexander Holupirek (Université de Constance, Société BaseX)

Vendredi 24 mai 2013 - 9h30-15h30

Présentation de MutEc et du Projet PLUME et sa plate-forme - présentation en PDF Présentation au  format  PDF
Temps encadré où les stagiaires pourront travailler avec leurs propres données XML.
Evaluation de la formation

Le nombre de places étant limité (20 places), une sélection sera effectuée et la priorité sera donnée aux candidat-es impliqué-es dans des projets de recherche en cours manipulant des données XML.

Pré-requis : XML, XPath. Connaissances en XSL et/ou XQuery recommandées.

La formation est gratuite. Les frais de déplacement, d'hébergement et de repas sont à la charge des participant-es.

Date limite d'inscription : 28 avril 2013

Formulaire d'inscription : https://a2l.projet-plume.org/limesurvey/index.php?sid=16172

Contacts :
- Maud Ingarao maud.ingarao @ ens-lyon.fr
- Nathalie Arlin nathalie.arlin @ ens-lyon.fr

MutEC - http://www.mutec-shs.fr/
PLUME - https://www.projet-plume.org/

Voir aussi : http://www.mutec-shs.fr/action-formation-bases-don...

Fichier attachéTaille
2013maimutecplateforemplume.pdf442.11 Ko
Fiche logiciel validé
  • Création ou MAJ importante : 26/10/13
  • Correction mineure : 26/10/13
Mots-clés

X!TandemPipeline : filtrage, édition, regroupement de résultats d'identifications MS

Une fiche Dév Ens Sup est en relation avec cette fiche, consultez-la pour plus d'informations : X!TandemPipeline
Description
Fonctionnalités générales

X!TandemPipeline est une interface graphique permettant la visualisation, l'analyse et l'export des résultats de recherche en banque de données, produits par le logiciel X!Tandem à partir d'informations MS/MS.

X!TandemPipeline utilise le logiciel X!Tandem pour le traitement des spectres MS/MS et l'identification des peptides dans une banque de données de séquences protéiques. Il offre la possibilité de définir facilement une liste complète de paramètres d'interrogation des banques de données et permet d'interroger plusieurs banques simultanément. Il permet de lancer plusieurs interrogations simultanément.

X!TandemPipeline permet également de filtrer les résultats d'identification selon des seuils statistiques ajustables, et de gérer efficacement la redondance d'information dans de très larges quantités de données grâce à un algorithme de regroupement original.

X!TandemPipeline est aussi une interface qui offre la possibilité de visualiser et d'éditer les résultats MS/MS.

Autres fonctionnalités
  • L'interrogation des listes de spectres peut être réalisée à partir de formats de "peak-lists" libres tels que mzXML, mgf, mzDATA, etc.
  • Le filtrage des résultats peut être effectué à partir de fichiers XML générés par X!Tandem ou à partir de fichiers DAT générés par le logiciel MASCOT
  • X!TandemPipeline est une interface permettant de filtrer des données de phosphoprotéomique complexes
  • X!TandemPipeline permet l'export des résultats sous différents formats (Microsoft Office 2010, OpenOffice et LibreOffice)
  • X!TandemPipeline permet l'export des résultats au format MassChroQml (compatible avec le logiciel MassChroQ) pour la quantification des peptides identifiés
  • X!TandemPipeline permet l'export des séquences des protéines identifiées dans un format standardisé de type FASTA
Contexte d'utilisation dans mon laboratoire/service
  • Analyse large-échelle des protéomes et phosphoprotéomes
  • Analyse comparée de grandes séries d'échantillons de type bandes de gel SDS-PAGE
Environnement du logiciel
Logiciels connexes

X!Tandem

Environnement de développement
Type de structure associée au développement

Plateforme PAPPSO

Références d'utilisateurs institutionnels
  • INRA
  • UR1268 BIA - Plate-forme IBiSA « Biopolymères, Biologie Structurale » (BIBS)
Environnement utilisateur
Liste de diffusion ou de discussion, support et forums

Souscription possible à la liste de diffusion "pappso-tool" à http://pappso.inra.fr/mailinglist.php

Documentation utilisateur

Documentation en anglais disponible à http://pappso.inra.fr/bioinfo/xtandempipeline/docu...

Contributions
Syndiquer le contenu