Unitex : traitement de corpus utilisant des technologies à états finis

Ce logiciel a été développé (ou est en cours de développement) dans la communauté de l'Enseignement Supérieur et de la Recherche. Son état peut être variable (cf champs ci-dessous) donc sans garantie de bon fonctionnement.
Fiche dév Ens Sup - Recherche
Mots-clés
Fonctionnalités générales du logiciel

Le système Unitex permet de construire des ressources linguistiques telles que des dictionnaires électroniques et des grammaires, de les utiliser pour effectuer des recherches complexes dans des textes et de construire des concordances.

La fiche de logiciel validé indiquée dans le pavé supérieur décrit en détail le logiciel.

Contexte d’utilisation du logiciel

Outil d’exploration pour les recherches de l’équipe de informatique linguistique du laboratoire d'informatique.
Il est aussi utilisé dans plusieurs universités au niveau international, comme outil de recherche et d'enseignement dans l'informatique linguistique.

Publications liées au logiciel
  • Sébastien Paumier. 2000. Nouvelles méthodes pour la recherche d'expressions dans de grands corpus. In A. Dister (ed.), Actes des 3èmes Journées INTEX. Revue Informatique et Statistique dans les Sciences Humaines, 36ème année, n° 1 à 4.
  • Sébastien Paumier. 2003. A Time-Efficient Token Representation for Parsers, Proceedings of the EACL Workshop on Finite-State Methods in Natural Language Processing, Budapest, pp. 83-90.
  • D'autres publications associées au projet se trouvent dans son site web.