Thèmes

L'atelier DiLiTAL s'articulera autour des axes suivants :

 

1. Ressources et corpus : production, standardisation et archivage

Cet axe ambitionne d’explorer les initiatives actuelles et futures qui ont pour but de collecter et de structurer des données langagières (spécialisées ou généralistes) des LPD. Ces données (lexiques, corpus etc.) sont souvent utilisées pour l’entraînement des étiqueteurs morphosyntaxiques qui représentent, à leur tour, une étape préalable à des tâches plus complexes comme l’analyse syntaxique ou la traduction. Il insistera, en particulier, sur l’accessibilité et la portabilité des données linguistiques, qui s’avèrent être des problèmes majeurs dans les travaux consacrées aux LPD. Par conséquent, les contributions concernant la création des ressources open source seront particulièrement appréciées.

2. Outils pour le traitement des LPD

Les interrogations de ce second axe portent sur la pertinence de l’utilisation d’outils existants pour les LPD et sur la manière dont ils gèrent le multilinguisme. En effet, depuis l’arrivée d’UTF-8 (Unicode), le TAL s’est doté de la possibilité de diversifier son terrain d’action-recherche, permettant de traiter d’autres langues que celles dites « majoritaires » (et bien dotées), comme l’anglais, l’espagnol, le français, le chinois etc. Dans une telle perspective, il s’avère nécessaire de réfléchir à une amélioration de la gestion du multilinguisme par l’inclusion de nouvelles graphies et de nouveaux standards, tout en identifiant les contraintes méthodologiques auxquelles se heurtent les chercheurs dans le cadre d’un travail sur une LPD avec des outils existants.

3. Questions sociales, culturelles et éthiques

DiLiTAL sera également une occasion d’examiner les possibilités de coopérations transfrontalières pour encourager l’échange d’expériences et dynamiser la recherche en TAL dans les pays où les LPD sont en usage. Il est important d’entamer une réflexion concernant des aspects éthiques de la collecte, de l’archivage et du traitement des données linguistiques qui, eux, se trouvent ancrés dans des contextes sociétaux où les codes et les mœurs sont méconnus ou sensiblement différents de ceux du chercheur. Le but est de réfléchir à une méthodologie de terrain qui ne vise pas uniquement à ménager la science, mais qui prend aussi en compte le contexte global, à savoir, le sujet parlant qui fait partie d’une culture, voire d’une catégorie sociale. Cet atelier sera donc également une occasion de discuter du TAL en termes de moteur des changements linguistiques. En effet, ce problème se pose dans le cadre des commissions terminologiques qui jouent un rôle prépondérant dans le processus de codification des langues dans différents pays du monde.

4. Retours d’expérience

Les contributions qui mettent en lumière des expériences de traitement des LPD seront particulièrement appréciées. La synthèse d’expertises acquises par des chercheurs ayant participé à ce genre de travaux permettra de nourrir la réflexion épistémologique nécessaire au développement des outils pour dépasser le cadre d’un seul type de langues. Ces expériences pourront s’avérer utiles pour identifier les domaines auxquels la recherche en TAL pourra contribuer. Quelle que soit la langue, un retour d’expérience sera toujours précieux pour permettre d’identifier les convergences et les divergences dans les approches, constituant, de ce fait, un apport considérable pour cet atelier et pour la recherche-action qui en découlera.

Liste des thémes traités

 
 • Outils et ressources pour les LPD : mise en place et évaluation ;

• Systèmes d’écriture et gestion du multilinguisme ;

• Méthodologies (feuilles de route) pour la numérisation des LPD ;

• Traitement des néologismes ;

• TAL pour la normalisation et la codification des LPD ;

• Intégration des LPD dans les systèmes éducatifs numériques ;

• Place et fonction(s) du TAL dans le changement linguistique ;

• etc.

Personnes connectées : 1