GATE

Logo de GateGATE, boite à outils pour le traitement du langage

GATE (General Architecture for Text Engineering) est une infrastructure développée par l’université de Sheffield, dédiée à l’extraction d’information composée d’une architecture, d’une interface d’API, et d’un environnement de programmation graphique.

Son système d’extraction ANNIE dispose lui-même de plusieurs modules : analyseur lexical, analyseur syntaxique, extracteur d’entités nommées, gestionnaire de listes de termes par type sémantique (gazeeters),…

GATE propose également :

  • Cloud.net pour le traitement de texte à grande échelle
  • Mimir (Multi-paradigm Information Management Index and Repository) pour l’indexation et la recherche dans du texte, des annotations, des ontologies.

De nombreux formats d’entrée sont supportés : texte brut, pdf, xml, Lucène, Oracle,…

GATE interopère avec d’autres systèmes : LingPipe, OpenNLP, UIMA, …

Cet outil a été présenté le 2 octobre 2012 lors du séminaire Inria-IST « Le document numérique à l’heure du web de données » par Nathalie Aussenac (IRIT). Pour plus d’informations, se référer à la présentation disponible à cette adresse : http://fr.slideshare.net/aussenac/ist2012-aussenacontologieannotationweb

Editeur : University of Sheffield

Site web : http://gate.ac.uk/

Téléchargement : http://gate.ac.uk/download/

Aide en ligne : http://gate.ac.uk/documentation.html

Les commentaires sont fermés