Le groupe MILC (Modèles Informatiques pour le Langage et la Cognition), au sein du Département Informatique de TELECOM-Paris, concentre ses efforts de recherche sur certains aspects du langage et de la cognition. Les modèles que nous développons font appel aussi bien au connexionnisme qu'aux techniques symboliques.
Les réseaux de neurones classiques reposent sur une transmission de l'activité des neurones à travers un réseau à l'architecture parfaitement définie. La dynamique de cette transmission est généralement laissée de côté. Pourtant, nous avons des raisons de penser que l'état d'équilibre final, en termes d'activités de neurones particuliers, est peut-être moins intéressant que le fonctionnement dynamique d'un réseau dont l'architecture (i.e. le câblage) serait en partie laissée au hasard. Le comportement d'un tel réseau se définit alors par l'évolution au cours du temps de l'activité coordonnée d'assemblées de neurones, et non de l'activité de neurones isolés. Nous étudions le comportement temporel de telles architectures, ainsi que les perspectives qu'elles ouvrent sur le plan du traitement de l'information (traitement perceptif, traitement du mouvement, traitement des concepts).
Une grande partie de nos efforts de recherche est consacrée à l'analyse et à la reproduction de la performance linguistique. Nous sommes bien entendu conscients de l'immensité de la tâche, aussi concentrons-nous nos efforts sur des angles d'attaque bien précis.
Au niveau de la phonologie, nous cherchons à faire découvrir par la machine, à partir d'exemples, un ensemble limité de règles qui permettent d'accéder à la prononciation d'un mot (par ex. un nom propre) à partir de sa forme écrite. Au niveau syntaxique et sémantique, nous cherchons à repérer des invariances dans un corpus vaste, en travaillant sur l'ensemble des mots de la langue. Par exemple, gouvernement et président (en tant que noms communs) pourront se révéler proches dans un corpus issu des éditoriaux d'un grand quotidien, parce qu'ils apparaissent dans les mêmes constructions syntaxiques. On en déduit des relations de substituabilité en contexte, qui sont très utiles lorsqu'on veut faire par exemple de la correction orthographique ou amplifier une requête de recherche bibliographique. Au niveau de l'utilisation du langage en situation (le niveau dit pragmatique), nous cherchons, par l'observation et la simulation des conversations spontanées, à dégager les contraintes portant sur le rôle logique des arguments. Cette recherche nous ouvre la voie vers des systèmes d'aide capables d'argumenter, vers des modules d'explication efficaces pour les Systèmes à base de connaissances, vers la génération de textes structurés, etc.
De nombreuses performances, dont l'automatisation représente pourtant un intérêt économique crucial, restent inaccessibles aux ordinateurs, non parce que nous manquons de machines puissantes ou de mémoire, mais parce qu'ils supposent une compréhension du fonctionnement humain que nous n'avons pas encore. Nous avons déjà évoqué le langage, on peut citer aussi l'enseignement. Les recherches en matière d'E.A.O. (enseignement assisté par ordinateur) butent sur notre ignorance de la manière dont les connaissances conceptuelles sont acquises et manipulées par les élèves. Une part de nos travaux de recherche vise à réaliser des modèles, connexionnistes et symboliques, d'un fonctionnement cognitif qui permet l'émergence de nouveaux concepts et de nouvelles relations conceptuelles. Le concept apparaît, dans ces modèles, comme un invariant perceptif auquel est associé un symbole, ou comme un " capteur cognitif ". Ces modèles trouvent leur application en psychologie ou en E.A.O.