Par: Benoît TROUVILLIEZ

Introduction

Ce nouvel article a pour but de vous faire partager mon expérience sur les ateliers (workshops) de la conférence TIA, édition 2011 auxquels j’ai pu assister début novembre à Paris.

TIA

C’est quoi TIA?
D’abord, c’est quoi TIA? C’est l’acronyme de “Terminologies et Intelligence Artificielle”. C’est une conférence qui a lieu tous les deux ans et a pour thème principal la construction de terminologies pour une application dans le cadre de l’intelligence artificielle.

Terminologie? Intelligence artificielle?
Une terminologie est une ressource visant à fournir des connaissances sur ce que l’on appelle des termes. Les termes étant des mots ou parfois des expressions ayant une sémantique propre par rapport à un domaine. Par exemple, le terme souris dans le domaine informatique n’a pas le même sens que le terme souris du domaine animalier. Dans les travaux récents, la terminologie en plus de s’intéresser à l’étude des domaines s’oriente également vers l’étude des applications particulières dans chacun de ces domaines. D’où le lien entre terminologies et intelligence artificielle…

L’intelligence artificielle (IA) désigne les procédés et algorithmes visant à faire réaliser des traitements “complexes” à un ordinateur, traitements réputés réalisables uniquement par des humains. L’apport des terminologies dans les domaines touchés par l’IA est de ce fait considérable. Plus d’infos sur l’IA et autres termes relatifs sur cette page du blog.

Où et quand cela a t-il eu lieu?
La conférence TIA, édition 2011, s’est déroulée à Paris du 8 au 10 novembre. Le workshop auquel j’ai assisté et dont je parle ici s’est déroulé le 10 novembre toute la journée au pôle des langues et civilisations de l’INALCO situé au 65 rue des Grands Moulins à Paris.

Quel est le but de cet article?
Le but n’est pas de vous faire un compte rendu de ce qui a été dit lors du workshop mais uniquement de vous faire partager quelques remarques concernant l’analyse d’opinions.

Où peut on trouver des informations supplémentaires sur l’événement?
Sur le site de l’édition de la conférence. Si vous vous intéressez plus particulièrement aux ateliers, vous pouvez télécharger les proceedings des ateliers.

Construction d’un lexique translingue de sentiments à base de ressources existantes

Auteur : Meng Sun
pdf / bib

Comment construire une ressource pour une langue lorsqu’on en possède dans d’autres langues?
J’ai trouvé cet exposé intéressant car il présentait une application de la transcription de ressources lexicales d’une langue source vers une langue cible à une ressource cherchant à décrire les sentiments comme par exemple le sentiWordnet.

Les deux approches par traduction et par alignement ont été abordées. J’avais déjà eu l’occasion de voir le couplage de ces deux techniques auparavant pour construire une ressource dans une langue cible existante déjà dans une langue source autre que celle désirée. C’était à l’occasion de mes études sur les adaptions du Wordnet de Princeton au français. Le WOLF a été construit dans cette même logique.

Subjectivité et sentiments : l’éclairage de la sémantique de corpus

Auteurs : Évelyne Bourion et Jugurtha Aït-Hamlat
pdf / bib

C’est quoi une sémantique de corpus?
Avant de nous intéresser au contenu de l’exposé, faisons d’abord un détour du côté des différentes sémantiques existantes. Lorsque l’on parle de sémantique, nous pouvons en fait désigner :

  • la sémantique des mots : Que veut dire tel mot? Le but est de comprendre le sens des mots selon leur contexte dans la phrase (contexte phrastique).
  • la sémantique des textes : Que veut dire tel texte? On cherche à comprendre le sens au niveau des textes en eu mêmes.
  • la sémantique de corpus : Que veut dire tel corpus de textes? Le but est de comprendre le sens au niveau du corpus de textes.

Et quel est l’éclairage de la sémantique de corpus pour les sentiments?
Revenons à l’exposé présenté lors du workshop. L’accent a été mis sur l’apport de la sémantique de corpus par rapport à la problématique de subjectivité des sentiments exprimés par un mot.
La question que l’on est alors amenée à se poser est est ce que le corpus joue un rôle sur les sentiments exprimés par un mot et sur la subjectivité de la perception de ce sentiment.

Prenons un exemple pour clarifier la chose. Si l’on prend le mot ‘toujours’, exprime t-il un sentiment? La plupart des personnes diront certainement non car la sémantique du mot ‘toujours’ ne lui prête guère un sens exprimant un sentiment. Si l’on prend maintenant ce mot dans le contexte d’une phrase (contexte phrastique) tel que celui de la phrase “je suis toujours dépendant des drogues”, plus de personnes lui prêteront un sentiment négatif de par le contexte de la phrase dans lequel il est exprimé. Enfin, si l’on prend un corpus de textes exclusivement consacré aux addictions, où le mot toujours n’apparaît que pour désigner “une dépendance de longue durée”, beaucoup de personnes lui prêteront dans ce cas un sentiment négatif.

Cette réflexion laisse à penser que les sentiments exprimés (ou ressentis exprimés) par les mots ne sont pas dépendant tant du mot lui même que du contexte dans lequel nous le percevons. C’est là l’éclairage de la sémantique de corpus

Et après?

Dans un article ultérieur, nous nous intéresserons à d’autres exposés tel que ceux consacrés aux LEMON (LExical Model for ONtologies).

Mots clefs : , , , , , , , ,