Logiciels et ressources Alpage


Aide à l'installation des logiciels et ressources Alpage

alpi (ALPage Installer)

alpi est un script Perl ayant pour but d'aider les utilisateurs à installer localement certains outils et logiciels ALPAGE. Il peut être également utilisé pour installer la chaîne de traitement linguistique complète pour le français d'Alpage. Ce script est relativement pratique car il détecte les dépendances et les installe automatiquement.


Logiciels Alpage

alpc (Alpage Linguistic Processing Chain)

L'équipe Alpage développe et maintient une chaine de traitement linguistique complète pour le français (consulter notre démo en ligne) . Cette chaine repose sur DyALog, FRMG, Lefff et SxPipe (cf. ci-dessous pour une description de ces outils et ressources).

DyALog

DyALog est un environnement pour compiler et utiliser des programmes logiques et des analyseurs syntaxiques tabulaires pour les langues naturelles, prenant en charge divers formalismes grammaticaux (DCG, TAG, TIG, RCG).

SYNTAX

Ensemble d'outils permettant la construction automatique d'analyseurs syntaxiques à partir de leur description grammaticale. Les formalismes reconnus vont des CFG (déterministes ou ambiguës) aux TAG, LFG, RCG, ...

ALPAGE Linguistic Workbench

ALPAGE Linguistic Workbench fournit divers composants pour mettre en place et exploiter une chaîne de traitement linguistique, en particulier pour le français, dont la chaîne de traitements de surface SxPipe et l'étiqueteur morphosyntaxique MElt.

BONSAI

BONSAI est une chaîne complète d'analyse statistique en dépendances pour le français, basée sur un apprentissage machine à partir du French Treebank.

MElt

MElt est un étiqueteur statistique librement disponible (LGPL) prévu notamment pour entraîner des étiqueteurs morphosyntaxiques sur des corpus annotés et des lexiques externes. MElt est fourni avec un modèle d'étiquetage morphosyntaxique pour le français qui est à l'état de l'art, mais également avec des modèles pour d'autres langues (français, anglais, italien, espagnol, allemand). MElt comprend aussi un wrappeur de normalisation destiné à aider au traitement de texte bruité, comme les contenus textuels issus du Web (pour l'anglais et le français seulement).

MetaGrammar Toolkit

MetaGrammar Toolkit fournit plusieurs outils pour développer et compiler des métagrammaires en TAG. Il inclut également une métagrammaire du français à large couverture. (Page principale)

SxLFG

SxLFG est un générateur d'analyseurs syntaxiques qui repose sur le formalisme des Grammaires Lexicales Fonctionnelles (Lexical Functional Grammars, LFG).


Ressources lexicales

Alexina

Atelier pour les LEXiques INformatiques et leur Acquisition - Développement de lexiques morphologiques et syntaxiques pour le TAL. Inclut divers outils ainsi que les lexiques Lefff (français), Leffe (espagnol), Pollex (polonais), Sklex (slovaque), DeLex (allemand), PerLex (persan), KurLex (kurde kurmanji) et SoraLex (kurde sorani). Ont été également importés dans l'architecture Alexina les lexiques morphologiques pour le néerlandais et l'italien distribués respectivement au sein du projet Alpino et du lexique Morph-it!

WOLF

Le WOLF (Wordnet Libre du Français) est une ressource lexicale sémantique (wordnet) libre pour le français.


Corpus

French Social Media Bank

Corpus arboré constitué de données extraites de réseaux sociaux (Facebook, Twitter) et de forums de discussion (Doctissimo, JeuxVideos.com). L'intérêt principal de ce corpus est de fournir des données annotées sur des textes de qualité moyenne à très bruitée.

Sequoia Treebank

Corpus arboré de 3200 phrases, provenant d'Europarl, du corpus l'Est Republicain, de la Wikipedia française, et de l'agence européenne du médicament (documents extraits du corpus EMEA). Chaque phrase a été manuellement annotée pour les catégories morpho-syntaxiques et la structure syntagmatique, en suivant les guides d'annotation du French Treebank. Les arbres de constituants ont ensuite été automatiquement convertis en arbres de dépendances de surface.


LANGUE/LANGUAGE

Calendrier

Lu Ma Me Je Ve Sa Di
26 27 28 29 01 02 03
04 05 06 07 08 09 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
01 02 03 04 05 06 07