Traitement Automatique du Langage Naturel

Master 1 (1ère année de Master)

L'intitulé du diplôme est MASTER "Spécialité Ingénierie Linguistique".

Pour les étudiants inscrits à l'INaLCO, le domaine est "Langues, cultures et sociétés du monde", la mention est "Sciences du langage et langues appliquées", la spécialité est "Ingénierie linguistique".

Les étudiants issus de la licence LMFA de l'INaLCO sont admis de droit en M1.
Les étudiants en langues et civilisations ou sciences du langage ne peuvent s'inscrire au MASTER "Spécialité Linguistique" que s'ils ont une certaine appétence pour l'outil informatique.

Traitement automatique de l’arabe – Problématique de l’étiquetage grammaticale

Nom: 
NC
Prénom: 
-
Année: 
2003
Résumé du mémoire: 

Notre étude consistera à traiter la question de l’étiquetage grammaticale de la langue arabe en insistant sur la problématique que posent les deux spécificités inhérentes à cette langue, à savoir : l’agglutination et la non voyellation ou la voyellation partielle des textes. L’étiquetage d’un texte en arabe requiert la restitution des voyelles. Mais comment restituer les voyelles puisque cette opération dépend de la détermination des étiquettes grammaticales ? Nous sommes donc confronté à un cercle vicieux. Le problème d’ambiguïté est ainsi posé. En effet, étiqueter un texte dépourvu de voyelles, c’est étiqueter un texte grammaticalement ambigu. Il s’agit donc de lever cette ambiguïté, qu’elle soit lexicale ou grammaticale. De nombreux efforts ont été déployés dans ce sens. Nous ferons donc un état de l’art, présentant les différentes approches appliquées jusqu’à ce jour, les différentes grammaires et modèles adoptés ainsi que les différents outils développés en vue d’effectuer une analyse syntaxique, voire morphosyntaxique d’un texte donné, dans le but de venir à bout de ce problème. Nous mettrons en évidence les points forts, mais également, les limites des travaux effectués. A partir de là nous tenterons de proposer une solution potentielle.

Syndiquer le contenu