Saada
Saada (Système Automatique d’Archivage de Données Astronomiques) est un générateur de bases de données astronomiques. Il permet à des équipes ne disposant pas de moyens de développement de construire sans avoir à écrire de code, des bases de données complexes, comprenant des données hétérogènes (images, spectres…) organisées dans des collections multiples et éventuellement interconnectées.
Le rôle de Saada est de créer des bases de données vides, les Saada-DBs. Cette opération ainsi que les opérations de gestion des Saada-DBs ne requièrent pas de privilèges d'administrateur sur la machine hôte. La Saada-DB peut être hébergée sur n'importe quelle plateforme. Elle est indépendante de tout serveur central.
La Saada-DB se compose de plusieurs collections définies par l'opérateur. Chaque collection est constituée d'une sous-collection pour chaque catégorie de données (images, spectre, liste de sources...).
Une fois créée, la Saada-DB peut être remplie avec des fichiers de données dont chaque mot-clé sera projeté dans une colonne de la base. La projection du format des fichiers lus dans la base relationnelle sous-jacente est automatique. Elle peut toutefois être paramétrée.
Les Saada-DBs peuvent être accédées par une interface WEB, par une API Java ou par des protocoles relevant de l'Observatoire Virtuel.
Les données chargées dans la base peuvent être reliées par des relations N-M persistantes. Les liens de ces relations sont utilisés pour la navigation ou pour des requêtes complexes.
Saada possède un langage de requêtes propre (SaadaQL) adapté au modèle de données. Une requête SaadaQL peut couvrir de multiples collections. Elle peut inclure des contraintes sur les attributs des éléments recherchés ainsi que des contraintes sur les liens partant de ces éléments. Cette dernière caractéristique dote les Saada-DBs d'une capacité de 'data-mining'.
Toutes les fonctionnalités des Saada-DB peuvent être invoquées soit depuis l'interface graphique soit par script (ant). Cela permet d'intégrer la gestion d'une Saada-DB (création, peuplement et accès) dans un workflow.
A partir de la version 1.6 :
-
Saada peut s'appuyer sur une base embarquée (SQLite) de manière à dispenser l'utilisateur d'avoir à déployer une infrastructure client serveur.
-
Saada est doté d'une nouvelle interface WEB utilisant largement AJAX. Cette interface est capable d'interagir avec des outils d'analyse externes via le protocole SAMP de l'Observatoire Virtuel.
- Une Saada-DB peut référencer n'importe quel fichier de données, mais seul le contenu des fichiers au format FITS ou VOTable sera ingéré.
- La Saada-DB est construite sur une base relationnelle (PostgresQL, MySQL ou SQLite) qui reste accessible par des moyens standards.
- Les Saada-DBs viennent avec 4 services OV natifs (SIA, SSA, Cone Search et TAP/ObsTap).
- Les sélections de données peuvent être exportées au format FITS ou VOTable.
- Les fichiers ingérés peuvent être téléchargés depuis l'interface Web.
- Les fichiers sélectionnés peuvent être transmis à des application tiers via le protocole SAMP
Le projet Saada est dédié à des équipes souhaitant mettre en ligne des données avec un minimum de développements.
Saada est capable de gérer des bases de tailles moyennes (~10e7 lignes/table)
Saada ne peut charger des fichiers ASCII (TSV p.e.) que s'ils sont d'abords convertis en VOTable.
Commentaires
Responsable thématique précédent
Cette fiche a d'abord été suivie par le responsable thématique Jean-Luc Archimbaud. David Rousse l'a reprise en mai 2012.