Blog Onyme
GWC 2012 : Conférence sur les Wordnets à Matsue au Japon…13 février 2012IntroductionUn petit billet pour vous faire un retour d’expérience de la conférence GWC 2012 à laquelle j’ai pu participer en ce début d’année. La conférence et ma présentationCitation : Benoît Trouvilliez (2012). Linking specific and generalist knowledge – Building terminological resources from sales catalogues and generalist resources. In Actes de la 6ème Global Wordnet Conference, Matsue, Japon. Comme je l’avais annoncé en fin d’année dernière, j’ai présenté un article à la conférence GWC, édition 2012, qui s’est déroulée à Matsue au Japon du 9 au 13 janvier 2012. Le but de ce deuxième article est de vous faire un rapide retour sur quelques unes des choses dont j’ai entendu parler là bas et qui ont particulièrement retenues mon attention. Avant toute chose, une première information statistique : nous n’étions “que” trois projets francophones à présenter nos travaux sur Wordnet à la conférence GWC. Le “que” que j’emploie ici est relatif car bien que ce chiffre soit relativement faible, si l’on prend en compte la distance à parcourir pour s’y rendre, cela montre au contraire un certain intérêt de la communauté francophone pour Wordnet. En comparaison, seul deux projets japonnais nous ont été présentés alors que nous étions sur place. Cela s’explique en partie par la difficulté d’appliquer le principe de Wordnet sur la langue japonnaise. Pour ceux qui ne connaissent pas Wordnet, j’ai écris un billet sur ces ressources. Pourquoi faut-il de nouveaux domaines pour Wordnet?Citation : Xiaojuan Ma and Christiane Fellbaum (2012). Rethinking WordNet’s Domains. In Actes de la 6ème Global Wordnet Conference, Matsue, Japon. Cette thématique abordée par les développeurs de Wordnet sous la forme d’une question a retenue particulièrement mon attention par sa correspondance avec un constat que nous avions nous même fait sur les domaines du Wordnet Domains : ils sont assez généralistes, plutôt vagues et de ce fait difficilement exploitables dans un contexte industrielle où l’on chercherait à identifier des thématiques précises. Le but de l’étude présentée est donc à la fois de montrer ce manque de domaines exploitables à un niveau industrielle mais aussi de donner les premières pistes pour identifier de nouveaux domaines de manière semi automatique dans les synsets de Wordnet. Une piste intéressante concerne l’utilisation de ressources en ligne comme Wikipedia par exemple. A suivre…. Enrichissement automatique du WOLFCitation : Sagot Benoît et Fišer Darja (2012). Automatic extension of WOLF. In Actes de la 6ème Global Wordnet Conference, Matsue, Japon. Nous avons déjà eu l’occasion d’aborder cette ressource qu’est le WOrdnet Libre du Français. La conférence GWC a été l’occasion pour l’équipe de l’Inria qui développe ce projet de nous présenter les dernières avancées de cette ressource pour atteindre la version 0.2. A l’heure où j’écris ces lignes cependant, c’est toujours la version 0.1.5 qui est en ligne sur la page officielle. Cependant, on peut dire que cette présentation comportait de bonnes nouvelles pour les utilisateurs du WOLF. En effet, entre la version 0.1.5 distribuée actuellement et la nouvelle version 0.2, une campagne d’enrichissement de la ressource a été menée. De nouveaux lexèmes ont ainsi été ajoutés automatiquement aux synsets du WOLF. Cela a eu deux impacts notoires sur la ressource :
Des évolutions qui seront donc à suivre de près… Le mot de la fin…Et pour conclure cet article, je vous donne le lien vers les photos de la conférence : Plein d’autres photos Mots clefs : GWC, GWC 2012, linguistique, ressources linguistiques, TAL, WOLF, Wordnet, Wordnet Domains, WOrdnet Libre du Français |
Le projet WOLF semble évoluer pas mal cette année. Après cette présentation à laquelle j’ai assisté en début d’année, quatre publications et présentations ont eu lieu à la conférence LREC 2012 à Istanbul sur le projet :
Hanoka Valérie et Sagot Benoît (2012). Wordnet creation and extension made simple: A multilingual lexicon-based approach using wiki resources. In Proceedings of LREC 2012, Istanbul, Turquie
Apidianaki Marianna et Sagot Benoît (2012). Applying Cross-Lingual WSD to Wordnet Development. In Proceedings of LREC 2012, Istanbul, Turquie
Gábor Kata, Apidianaki Marianna, Sagot Benoît et Villemonte de La Clergerie Éric (2012). Boosting the Coverage of a Semantic Lexicon by Automatically Extracted Event Nominalizations. In Proceedings of LREC 2012, Istanbul, Turquie
Sagot Benoît et Fišer Darja (2012). Cleaning noisy wordnets. In Proceedings of LREC 2012, Istanbul, Turquie
En attente donc de la publication de la nouvelle release….