cluster

Fiche logiciel validé
  • Création ou MAJ importante : 21/09/13
  • Correction mineure : 21/09/13
Mots-clés

cluster : classification hiérarchique, k-means... pour données de puces à ADN

Description
Fonctionnalités générales

Logiciel qui permet de réaliser différentes méthodes d'analyses non-supervisées de données de puces à ADN, cela comprend la classification hiérarchique, les cartes de Kohonen (SOMs), les nuées dynamiques (k-means) et l'analyse en composantes principales. Les méthodes de classification hiérarchique (lien unique, lien moyen et lien complet) peuvent être notamment réalisées en utilisant différentes mesures de similarité (distance de corrélation centrée ou non centrée, corrélation des rangs de Spearman, Tau de Kendall, ...). L'application originale de ce logiciel aux données de puces à ADN est publiée : http://www.ncbi.nlm.nih.gov/pubmed/9843981

Autres fonctionnalités

Le logiciel permet aussi de filtrer les données (pourcentage de valeurs présentes, écart type, ...) et d'appliquer divers traitements (centrage médian des gènes, transformation logarithmique, ...) avant classification.

Interopérabilité

Les données d'expression initiales (fichier texte tabulé standard) correspondent à une matrice (gènes, échantillons) où chaque colonne correspond à une condition expérimentale et chaque ligne correspond à un gène. Généralement, la première colonne est réservée aux identifiants de sondes (ou gènes) et la première ligne aux identifiants des échantillons. Chaque élément de la matrice correspond à la valeur d’expression d'un gène dans un échantillon.

Pour réaliser une classification hiérarchique sur des données de RNA-Seq, se référer à la documentation de DESeq, DESeq2 et EdgeR (bioconductor, R) : http://www.bioconductor.org/

Limitations, difficultés, fonctionnalités importantes non couvertes

Gourmand en mémoire vive - RAM : 4N² octets avec N = nombre de gènes

Environnement du logiciel
Logiciels connexes

Visualisation des résultats avec Treeview (http://rana.lbl.gov/EisenSoftware.htm) ou JavaTreeview (http://jtreeview.sourceforge.net/)

Autres logiciels aux fonctionnalités équivalentes
Environnement de développement
Références d'utilisateurs institutionnels
  • Plate-forme Montpellier GenomiX
  • Plate-forme Puces à ADN de Nantes
  • Équipe Génomique et Biothérapies - Institut du thorax
Environnement utilisateur