GATE, boite à outils pour le traitement du langage
GATE (General Architecture for Text Engineering) est une infrastructure développée par l’université de Sheffield, dédiée à l’extraction d’information composée d’une architecture, d’une interface d’API, et d’un environnement de programmation graphique.
Son système d’extraction ANNIE dispose lui-même de plusieurs modules : analyseur lexical, analyseur syntaxique, extracteur d’entités nommées, gestionnaire de listes de termes par type sémantique (gazeeters),…
GATE propose également :
- Cloud.net pour le traitement de texte à grande échelle
- Mimir (Multi-paradigm Information Management Index and Repository) pour l’indexation et la recherche dans du texte, des annotations, des ontologies.
De nombreux formats d’entrée sont supportés : texte brut, pdf, xml, Lucène, Oracle,…
GATE interopère avec d’autres systèmes : LingPipe, OpenNLP, UIMA, …
Cet outil a été présenté le 2 octobre 2012 lors du séminaire Inria-IST « Le document numérique à l’heure du web de données » par Nathalie Aussenac (IRIT). Pour plus d’informations, se référer à la présentation disponible à cette adresse : http://fr.slideshare.net/aussenac/ist2012-aussenacontologieannotationweb
Editeur : University of Sheffield
Site web : http://gate.ac.uk/
Téléchargement : http://gate.ac.uk/download/
Aide en ligne : http://gate.ac.uk/documentation.html