La segmentation en unités pertinentes et leur étiquetage en catégories morphosyntaxiques constituent les tâches basiques de l’analyse automatique des langues. Dès que l’on travaille sur des fragments de données ou de textes multilingues, des incertitudes surgissent : la simple comparaison physique de lexies en allemand, en anglais et en français révèle l’ampleur des problèmes épistémologiques sous-jacents.