Les travaux de plusieurs chercheurs relèvent du domaine du lexique.

Dany Amiot et Natalia Grabar travaillent sur un projet de lexique médical en Traitement Automatique de Langues. D'une part, il s'agit de proposer des méthodes automatiques et/ou manuelles pour construire les lexiques sémantiques qui conviennent à une tâche donnée et au domaine étudié. La détection des unités linguistiques et leur typages sémantiques font partie de cette problématique. D'autre part, il s'agit de pouvoir exploiter efficacement les lexiques construits pour effectuer l'annotation des documents (voir Application). De ce point de vue, les outils et leur capacité de reconnaître les variantes linguistiques, de même que la résolution des ambiguïtés et des lacunes, sont au centre des travaux de recherche.

Nathalie Gasiglia et Pierre Corbin poursuivront leurs travaux dans le domaine des descriptions syntaxico-sémantiques d’unités lexicales. Celles-ci peuvent être menées soit dans le cadre d’études méta-lexicographiques (afin de comparer les indications de constructions fournies par les dictionnaires aux emplois observés dans des compilations d’exemples dictionnairiques ou des énoncés extraits de corpus) (voir Application), soit dans le cadre d’études à des fins lexicographiques d’emplois attestés (comme c’est le cas, à partir de corpus de commentaires de matchs de football – qui permettent d’étudier des énoncés spécialisés destinés à un large public –, pour la description, au sein d’un dictionnaire des actions de jeu du football, d’unités prédicatives employées par les commentateurs pour narrer les actions de jeu).

À l'instigation de Dany Amiot, porteuse du projet « Autour des Constructions » soutenu par la MESHS (2011-12), un groupe de travail composé de Bert Cappelle, Cédric Patin, Fayssal Tayalati, Maarten Lemmens et de Kristel Van Goethem (Université de Louvain-la-Neuve) a commencé depuis juin 2012 à examiner les propriétés de deux groupes de constructions non-compositionnelles: (1) les constructions correspondant à X let alone Y en néerlandais (X laat staan Y) et en français (X encore moins/plus Y) et (2) les constructions (X) mais alors X et X maar dan ook X (néerlandais). Les analyses, fondées sur des corpus oraux et écrits, tiennent compte des données prosodiques (sur la base d’expérimentations) et sont effectuées dans une perspective contrastive (voir Représentation).