Format CIF : Crystallographic Information File (cristallographie)

Fiche ressource Article, événement, site web...
  • Création ou MAJ importante : 07/06/10
  • Correction mineure : 08/11/10
Mots-clés

Format CIF : Crystallographic Information File (cristallographie)

Acronyme : CIF

Nom complet : Crystallographic Information File

Description courte : Fichier texte
Le format CIF a été défini par l'IUCr (Union Internationale des Cristallographes) pour échanger des informations entre les logiciels de cristallographie. C'est un fichier ascii qui est régi par une orthographe et une grammaire spécifiques.

Extension par convention : .cif parfois .acc (Acta Crystallographica C)

Document de standardisation :

La version 1.0 de la spécification CIF est décrite dans:
S. R. Hall, F. H. Allen and I. D. Brow
The crystallographic information file (CIF): a new standard archive file for crystallography
Acta Cryst. (1991). A47, 655-685
doi:10.1107/S010876739101067X

La revision 1.1, actuellement en vigueur, est maintenue par la COMCIF, la commission de l'IUCr pour la promotion et la maintenance du format CIF.

Avantages : C'est un standard ouvert, bien défini, extensible et largement répandu.

Inconvénients :

  • Beaucoup d'informations peuvent être décrites de différentes façons, limitant parfois la compatibilité entre les logiciels.
  • Beaucoup de fichiers corrompus (édités à la main et non re-validés)

Utilisations recommandées :

  • Archivage et publication des structures cristallographiques, après validation.
  • Vecteur d'informations cristallographiques au sein d'un pipeline de traitement d'information entre les logiciels de cristallographie (semblable à l'XML).

Logiciels de traitement les plus connus :

  • Edition : enCIFer (édité par le CCDC ) est un éditeur de texte avec validation syntaxique et grammaticale des fichiers CIF ainsi qu'un visionneur des structures 3D.

  • Visualisation des structures : Mercury (du CCDC), sans doute un des plus conviviaux.
  • Validation : Platon est le logiciel sur lequel s'appuie l'IUCr pour valider les fichiers CIF avec CheckCIF.
  • Création des structures : ShelX (affinement des structures aux moindres carrés), Fox (résolution des structures sur poudre), FullProf (affinement de Rietveld).

Tous ces logiciels sont libres, gratuits ou en licence académique et donc méritent la promotion par Plume.

Structure du fichier CIF

  • Grammaire

    La grammaire est celle du format STAR, un peu simplifiée: il s'agit d'un format texte en ASCII éditable à la main (avec un simple éditeur de texte) qui est composé soit de paires {clé, valeur}, soit d'une liste ordonnée de ces paires, appelées boucles (loop_).
    Toutes les clés commencent par "_" et peuvent contenir plusieurs underscores, les autres mots réservés sont "data_" (pour délimiter les blocs de données) et "loop_" pour définir les boucles.

    • Les boucles :
      Un seul niveau de boucle est autorisé. Elles débutent par la liste des clés puis continuent avec toutes les valeurs. Le nombre de valeurs doit donc être un multiple du nombre de clés de la boucle.

    • Les séparateurs :
      Les espaces, tabulations et retours à la ligne (\n et \r\n) sont des séparateurs de champs, il faut utiliser des guillemets ' ou " pour les valeurs si elles contiennent des espaces ou des tabulations. Des valeurs multi-lignes sont possibles entre deux ";" en début de ligne.

  • Orthographe du CIF :

    La liste des mots clés est validée par la COMCIF, ces mots-clés sont rangés dans des dictionnaires consultables en ligne, par exemple le dictionnaire général "core" (le plus important) ainsi que des dictionnaires spécialisés pour les macromolécules (mmCIF), pour les images (imgCIF ou CBF), la diffraction des poudres (PowderCif) ...