Lexiques

nom du projet

Lexiques bi- et tri-lingues

 

type du projet

partenariat avec les Presses Universitaires de France (www.puf.com)

 

date debut - date fin

01/2003 - 01/2009

 

partenaires

Crim/inalco, PUF, Sylvie Chraïbi (professeur agrégée d'arabe)

 

objectifs

Utiliser l'Internet comme réservoir de traduction et sélectionner, pour des domaines particuliers, les terminologies bilingues ou trilingues en vigueur.

 

description du projet

Le projet Lexiques bi- et tri-lingues est motivé par la volonté de mettre en oeuvre un projet éditorial combinant les spécificités du Centre de Recherche en Ingénierie Multilingue, à savoir :

  • le multilinguisme
  • la linguistique de corpus
  • les méthodes de "fouille du web"
  • la conduite de projet en partenariat avec un acteur économique réputé du secteur

Il s'agit de publier environ trois lexiques par an, à partir des données électroniques disponibles sur le web, auxquelles s'ajouteraient éventuellement des données provenant d'autres sources, comme des manuscrits disponibles sous format électronique. Les premiers titres à réaliser sont :

  • Lexique français-anglais-arabe des Relations Internationales
  • Lexique français-anglais des Affaires
  • Lexique français-anglais des Médias

Les compétences requises sont à l'image de celles que le CRIM cherche à transmettre puisqu'il s'agit bien ici d'ingénierie multilingue, à savoir la mise en oeuvre de méthodes informatiques éprouvées permettant d'acquérir des données multilingues sur le web, de les formater, de les analyser, de les mettre en parallèle avec leurs traductions, d'extraire les segments pertinents se rapportant au domaine visé. Les données ainsi obtenues sont ensuite avalisées par des experts du domaine, avant d'être incluses dans les lexiques.

Ce projet recouvre donc un grand nombre de disciplines reliées à la linguistique, parmi lesquelles on peut citer, sans être exhaustif : la lexicologie, la linguistique de corpus, l'informatique, la traductique, la sémantique, etc

role du crim dans le projet

Le CRIM est à l'initiative du projet, les PUF jouant ici le rôle classique de l'éditeur, à savoir la diffusion d'ouvrages. C'est donc au CRIM que revient la gestion de l'ensemble du projet, depuis la sélection des données jusqu'à l'envoi de la disquette à l'éditeur.

Les PUF et l'INaLCO ont également convenu de permettre un accès en ligne aux lexiques, ce qui permettra d'être plus exhaustif quant à la couverture des données et à la proposition systématique d'un contexte pertinent.
 

communications et publications

Il est prévu que les étudiants prennent une part active au projet, dans le cadre des activités liées aux MASTER.

 

perspectives

Le CRIM, au travers du projet Lexiques, veut démontrer qu'il se situe au carrefour de la théorie et de la pratique. On sait qu'il existe une abondance d'articles académiques sur l'utilisation des corpus parallèles comme aide à la traduction (cf. Resnik, Gaussier, Church...) et le but du CRIM est de mettre cette matière grise à l'épreuve des faits. 

L'INaLCO cherche actuellement à diversifier ses canaux de diffusion en matière éditoriale et le projet Lexiques s'inscrit dans la droite ligne d'un tel souhait. D'autre part, en termes de notoriété, on espère que le projet Lexiques permettra aux PUF comme à l'INalCO de démontrer leur savoir-faire respectifs.