Bienvenue sur la page web d'Alpage

Analyse Linguistique Profonde A Grande Echelle

Alpage est une UMR INRIAUniversité Paris–Diderot (Paris 7), dont le domaine de recherche est le TAL (Traitement Automatique des Langues). Elle centre ses intérêts scientifiques autour de l'analyse syntaxique automatique, le développement de ressources lexicales et le traitement du discours pour la langue française.


Actualités (Dec. 2016): Deux fiches de poste sont ouvertes pour des stages M2/ingénieurs en Text Mining.


Actualités : L'architecture proposée par Alpage pour l'analyse syntaxique de l'anglais pour les textes bruités en provenance du web a permis à l'équipe de se classer deuxième et troisième lors de la shared task organisée par Google sur ce sujet en mai.


Problématique scientifique

Le domaine du traitement automatique des langues (TAL) est à la croisée de l'informatique, de la linguistique, mais également des mathématiques probabilistes et de la cognition. Il a pour enjeu la compréhension et la génération automatiques des langues humaines, sous forme textuelle ou orale. Alpage travaille principalement sur la compréhension automatique de textes en français, tout en travaillant également sur la génération automatique et sur d'autres langues, dont l'anglais.

La forte dynamique du projet Alpage est liée en partie à la complémentarité de ses membres: de nombreuses avancées importantes en TAL n'ont été possibles que par une étroite collaboration entre informaticiens (issus du projet Atoll) et linguistes spécialistes du TAL (issus de l'équipe Talana de Paris 7). Alpage, qui est une équipe mixte (UMR-I) entre le Centre de Recherche INRIA Paris-Rocquencourt et l'UFR de linguistique de l'Université Paris 7, ambitionne de faire avancer de façon significative l'état de l'art en analyse automatique du français. Ceci passe par une meilleure compréhension et une meilleure formalisation des phénomènes linguistiques, y compris les plus complexes, puis leur prise en compte dans des modèles lexicaux et grammaticaux, eux-mêmes mis en oeuvre à l'aide de technologies algorithmiques et logicielles avancées, à la fois symboliques et probabilistes, pour l'analyse lexicale et syntaxique, voire la génération automatique et, à terme, la traduction automatique.

Les applications du TAL sont nombreuses et importantes pour Alpage, en particulier pour la recherche d'informations, la fouille de textes et la linguistique expérimentale.

Statut

ALPAGE a été créée comme équipe INRIA en Juillet 2007 puis comme équipe-projet (EPI) au 1er janvier 2008, au Centre de Recherche INRIA Paris-Rocquencourt. ALPAGE provient de la fusion de l'ex-EPI ATOLL (ATelier d'Outils Logiciels pour le Langage naturel), dirigée par Éric de La Clergerie, et de l'équipe TALANA (Traitement Automatique de la LAngue NAturelle), dirigée par Laurence Danlos d'abord en tant que Jeune Equipe puis au sein de l'UMR LATTICE (UMR CNRS 8094).

Au 1er Janvier 2009, ALPAGE est devenue une UMR INRIA – Université Paris 7 (UMR-I 001) inscrite au contrat quadriennal de Paris 7, au sein de l'UFR de Linguistique.

ALPAGE relève de deux écoles doctorales: l'ED de Sciences du Langage de Paris 7 et l'ED Sciences mathématiques de Paris Centre.

Enfin, ALPAGE est membre du LabEx EFL (Empirical Foundations of Linguistics), qui rassemble une douzaine de laboratoires de recherche dans tous les domaines impliquant la linguistique, y compris le traitement automatique des langues.


LANGUE/LANGUAGE

Calendrier

Lu Ma Me Je Ve Sa Di
28 29 30 01 02 03 04
05 06 07 08 09 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 01