Lexiques
nom du projet
Lexiques bi- et tri-lingues
type du projet
partenariat avec les Presses Universitaires de France (www.puf.com)
date debut - date fin
01/2003 - 01/2009
partenaires
Crim/inalco, PUF, Sylvie Chraïbi (professeur agrégée d'arabe)
objectifs
Utiliser l'Internet comme réservoir de traduction et sélectionner, pour des domaines particuliers, les terminologies bilingues ou trilingues en vigueur.
description du projet
Le projet Lexiques bi- et tri-lingues est motivé par la volonté de mettre en oeuvre un projet éditorial combinant les spécificités du Centre de Recherche en Ingénierie Multilingue, à savoir :
- le multilinguisme
- la linguistique de corpus
- les méthodes de "fouille du web"
- la conduite de projet en partenariat avec un acteur économique réputé du secteur
Il s'agit de publier environ trois lexiques par an, à partir des données électroniques disponibles sur le web, auxquelles s'ajouteraient éventuellement des données provenant d'autres sources, comme des manuscrits disponibles sous format électronique. Les premiers titres à réaliser sont :
- Lexique français-anglais-arabe des Relations Internationales
- Lexique français-anglais des Affaires
- Lexique français-anglais des Médias
Les compétences requises sont à l'image de celles que le CRIM cherche à transmettre puisqu'il s'agit bien ici d'ingénierie multilingue, à savoir la mise en oeuvre de méthodes informatiques éprouvées permettant d'acquérir des données multilingues sur le web, de les formater, de les analyser, de les mettre en parallèle avec leurs traductions, d'extraire les segments pertinents se rapportant au domaine visé. Les données ainsi obtenues sont ensuite avalisées par des experts du domaine, avant d'être incluses dans les lexiques.
Ce projet recouvre donc un grand nombre de disciplines reliées à la linguistique, parmi lesquelles on peut citer, sans être exhaustif : la lexicologie, la linguistique de corpus, l'informatique, la traductique, la sémantique, etc
role du crim dans le projet
Le CRIM est à l'initiative du projet, les PUF jouant ici le rôle classique de l'éditeur, à savoir la diffusion d'ouvrages. C'est donc au CRIM que revient la gestion de l'ensemble du projet, depuis la sélection des données jusqu'à l'envoi de la disquette à l'éditeur.
Les PUF et l'INaLCO ont également convenu de permettre un accès en ligne aux lexiques, ce qui permettra d'être plus exhaustif quant à la couverture des données et à la proposition systématique d'un contexte pertinent.
communications et publications
Il est prévu que les étudiants prennent une part active au projet, dans le cadre des activités liées aux MASTER.
perspectives
Le CRIM, au travers du projet Lexiques, veut démontrer qu'il se situe au carrefour de la théorie et de la pratique. On sait qu'il existe une abondance d'articles académiques sur l'utilisation des corpus parallèles comme aide à la traduction (cf. Resnik, Gaussier, Church...) et le but du CRIM est de mettre cette matière grise à l'épreuve des faits.
L'INaLCO cherche actuellement à diversifier ses canaux de diffusion en matière éditoriale et le projet Lexiques s'inscrit dans la droite ligne d'un tel souhait. D'autre part, en termes de notoriété, on espère que le projet Lexiques permettra aux PUF comme à l'INalCO de démontrer leur savoir-faire respectifs.