Axes de réflexion
Modèles computationnels de la langue écrite, de la langue orale et de la langue des signes
- Modèles classiques de la langue :
- Langue écrite : morphologie, syntaxe, sémantique, pragmatique
- Parole : phonologie, prosodie
- Modèles multi-niveaux :
- Expressions polylexicales
- Anaphores
- Analyse multi-niveaux
Ressources linguistiques (données et outils)
- Développement de ressources : format, description, documentation, normes
- Annotation de ressources
- Evaluation de ressources
- Outils et API pour le TAL
- Ressources pour le web sémantique
Apprentissage et modélisation statistique pour le TAL
- Modèles statistiques pour le TAL
- Modèles de l’acquisition du langage
- Modèles de l’émergence des langues
Intermodalité et multimodalité
- Contexte multimedia : audio/image/vidéo/document numérique
- Contexte dialogique : discours/dialogue/interaction
- OCR, reconnaissance vocale (incluant émotions, attitudes, identification des langues et des locuteurs, etc.)
Multilinguisme, multiplicité des langues
- Traduction automatique de l’écrit et de l’oral
- Alignement, transfert, similarité entre langues
- Traitement automatique des langues peu dotées, dialectes, et des langues régionales
- TAL et apprentissage des langues, TAL et dialectologie, problèmes d’alternance de codes
Sémantique et compréhension
- Sémantique formelle
- Sémantique distributionnelle
- Modélisation des préférences, des points de vue
- Construction d’ontologies à partir de textes
Accès à l’information et recherche d’informations
- Fouille de textes
- Recherche d’informations
- Extraction d’informations
Productions langagières
- Génération automatique d’énoncés et de textes, de légendes d’image, de sous-titrage
- Résumé mono et multi-documents
- Synthèse vocale
- Génération d’énoncés en langue des signes