Axes de réflexion

Modèles computationnels de la langue écrite, de la langue orale et de la langue des signes

  • Modèles classiques de la langue :
    • Langue écrite : morphologie, syntaxe, sémantique, pragmatique
    • Parole : phonologie, prosodie
  • Modèles multi-niveaux :
    • Expressions polylexicales
    • Anaphores
  • Analyse multi-niveaux

Ressources linguistiques (données et outils)

  • Développement de ressources : format, description, documentation, normes
  • Annotation de ressources
  • Evaluation de ressources
  • Outils et API pour le TAL
  • Ressources pour le web sémantique

Apprentissage et modélisation statistique pour le TAL

  • Modèles statistiques pour le TAL
  • Modèles de l’acquisition du langage
  • Modèles de l’émergence des langues

Intermodalité et multimodalité

  • Contexte multimedia : audio/image/vidéo/document numérique
  • Contexte dialogique : discours/dialogue/interaction
  • OCR, reconnaissance vocale (incluant émotions, attitudes, identification des langues et des locuteurs, etc.)

Multilinguisme, multiplicité des langues

  • Traduction automatique de l’écrit et de l’oral
  • Alignement, transfert, similarité entre langues
  • Traitement automatique des langues peu dotées, dialectes, et des langues régionales
  • TAL et apprentissage des langues, TAL et dialectologie, problèmes d’alternance de codes

Sémantique et compréhension

  • Sémantique formelle
  • Sémantique distributionnelle
  • Modélisation des préférences, des points de vue
  • Construction d’ontologies à partir de textes

Accès à l’information et recherche d’informations

  • Fouille de textes
  • Recherche d’informations
  • Extraction d’informations

Productions langagières

  • Génération automatique d’énoncés et de textes, de légendes d’image, de sous-titrage
  • Résumé mono et multi-documents
  • Synthèse vocale
  • Génération d’énoncés en langue des signes