Atelier PAPILLON-2005
sur les bases lexicales multilingues
Thaïlande, 12 et 14 décembre 2005
En parallèle avec SNLP 2005 - Chiang Rai
12 décembre et 14 décembre à Chiang Rai
Lieu : Chiang Rai, Thaïlande
NOUVELLE Date limite de soumission 15 septembre 2005
Présentation
Les bases lexicales multilingues sont des (i) serveurs de base de (ii) données lexicales structurées dont les données peuvent être utilisées (iii) soit par des humains pour définir leur propre dictionnaire (iv) soit par des applications de traitement automatique des langues (TAL). Ces bases deviennent incontournables dans les sciences du langage pour le développement des technologies de la langue. A l'instar des bases de données génomiques, les bases lexicales constituent des serveurs richement annotés. Elles sont complexes et sujettes à évolution.
Papillon est un projet de collaboration, par l'intermédiaire de la Toile, pour la construction et l'usage d'une base lexicale multilingue en source ouverte (français, allemand, anglais, japonais, lao, malais, thaï et vietnamien). Cette base devra contenir assez d'information pour être utilisée aussi bien par des humains pour consultation, production de dictionnaires dérivés personnalisés, ou apprentissage des langues, que par des programmes de traitement automatique des langues en vue d'extraction automatique d'ensembles de données ou d'exploitation directe de données ponctuelles.
Papillon-2005, sixième édition d'un atelier annuel organisé par les membres du projet, a pour but d'identifier les problèmes qui se posent à la nouvelle "communauté des bases lexicales multilingues". Il vise à promouvoir les échanges entre spécialistes de plusieurs communautés. Il est donc ouvert à des participants de toute specialité relative aux bases lexicales : bases de données, interfaces hommes-machine de consultation de dictionnaires annotation, XML, standardisation de dictionnaires ou de données lexicales ; lexicographie, traduction, linguistique informatique ; etc. L'atelier se veut ouvert et encourage particulièrement les contributions de chercheurs extérieurs au projet Papillon.
L'atelier "Papillon 2005" encourage les contributions portant sur les points généraux suivants :
(i) Aspect : bases de données
- Macrostructures des dictionnaires et architecture générale
- Bases de données et bases lexicales : divergences et points communs
- Langages de requêtes (XML, XQL, etc.)
- Méthodes d'indexation efficaces et archivage
- Normes pour les bases lexicales
(ii) Aspect : données lexicales
- Microstructures d'entrées lexicales et particularités linguistiques
- Récupération et production automatique de dictionnaires
- Enrichissement automatique de bases lexicales
- Internationalisation/localisation de données lexicales multilingues
- Intégration de données multimodales et métadonnées
- Interactions entres données lexicales et données linguistiques (corpus, bases d'exemples, illustrations, etc.)
- Interaction grammaire-lexique
(iii) Aspect : utilisation humaine
- Nouvelles formes de consultation de données lexicales
- Interfaces d'interrogation de dictionnaires, ergonomie
- Aspects légaux relatifs aux dictionnaires (copyright, etc.)
- Adéquation/inadéquation de dictionnaires existants à certains usagers
(iv) Aspect : usage en TAL
- Systèmes de TAL utilisant des bases de données lexicales
- Exploitation directe de dictionnaires par des systémes de TAL
- Construction de données lexicales pour des systèmes particuliers
- Interchangeabilité de données lexicales
- Neutralité des systèmes vis-à-vis des données lexicales
L'atelier accueillera aussi des contributions plus spécifiques au projet Papillon :
Théorie sens-texte et lexicographie
- Problèmes linguistiques
- Ecriture de la formule sémantique des lexies
- Problèmes pratiques de description d'entrées
- Exemples de lexies ou d'axies
Proposition de collaboration à Papillon
- Interfaces d'interrogation
- Automatisation de l'indexation
- Enrichissement du paradis, du purgatoire, des limbes
Résultat de collaboration à Papillon
- Apport de données au paradis, au purgatoire, aux limbes
- Attractivité du site web de Papillon
Travail collaboratif
- Méthodes/Services pour le travail lexical collaboratif
- Motivations des contributeurs volontaires
- Reconnaissance et tracabilité du travail fourni
Les contributions attendues feront au plus 10 pages.
Programme
Le programme sera varié et prévu pour maximiser la coopération entre les spécialités, et pour permettre des discussions ouvertes étendues. Les composantes du programme seront entre autres :
- Des ateliers sur les différents modèles et structures linguistiques et lexicales par exemple, la structure des articles monolingues, les langages de requêtes semi-structurés;
- Des sessions de posters sur des lexiques et textes annotés (et peut être d'autres);
- Des présentations de papiers rapportant des nouvelles recherches;
- Des démonstrations de systèmes pour créer et gérer les données lexicales.
DATES IMPORTANTES
- Date limite de soumission: 15 septembre août 2005
- Notification d'acceptation: 15 octobre 2005
- Version finale: 15 novembre 2005
Appel à communications
Les contributions devront être envoyées après compression avec zip ou gzip par courrier électronique à l'adresse : mailto:papillon2005_submission@lirmm.fr.
Elles consisteront en un papier complet, de 10 pages maximum (bibliographies, illustration et équations comprises) rédigé en anglais au format PDF uniquement. Prière d'inclure les polices utilisées dans votre document PDF s'il utilise des caractères accentués ou des polices de caractères non latines. Vous pouvez vérifier que votre fichier PDF est correct en désactivant le menu "Utiliser les Polices locales" lorsque vous visualisez votre document avec Adobe Acrobat Reader.
Pour convertir des documents Word, vous pouvez utiliser, par exemple, les outils proposés sur les sites suivants : CRI74 ou CERN.
Nous vous conseillons fortement d'utiliser le modèle de Springer Verlag disponible à l'adresse suivante : http://www.springer.de/comp/lncs/authors.html
Comité d'organisation local
Président : Me. Asanee Kawtrakul, Kasetsart University, Bangkok, Thailand
- Me. Mukda Suktarachan (mukda@vivaldi.cpe.ku.ac.th)
- Mr.Worapoj Peerawit
- ...
Comité de programme
Président : Mr. Mathieu Lafourcade, LIRMM, Montpellier, France
- Mr. Christian Boitet, GETA-CLIPS-IMAG, Grenoble, France
- Mr. Francis Bond, NTT, Keihanna, Japon
- Mr. Jacques Chauché, LIRMM, Montpellier, France.
- Ms. Chuah Choy Kim, Malaysia.
- Mr. Jim Breen, Université Monash, Australie
- Mr. François Brown de Colstoun, INRIA, Rocquencourt, France
- Ms. Asanee Kawtrakul, Université Kasetsart, Bangkok, Thaïlande
- Mr. Mathieu Lafourcade, LIRMM, Montpellier, France
- Mr. Yves Lepage, ATR, Keihanna, Japon
- Mr. Emmanuel Planas, GETA-CLIPS-IMAG, Grenoble, France
- Mr. Alain Polguère, OLST, Université de Montréal, Montreal, France
- Me. Violaine Prince, LIRMM, Montpellier, France
- Mr. Gilles Sérasset, GETA-CLIPS-IMAG, Grenoble, France
- Mr. Michael Zock, LIMSI, Orsay, France
Informations diverses