<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog Onyme &#187; Conférences</title>
	<atom:link href="http://blog.onyme.com/feed/?cat=57" rel="self" type="application/rss+xml" />
	<link>http://blog.onyme.com</link>
	<description>Analyse sémantique et Traitement Automatisé de la Langue</description>
	<lastBuildDate>Mon, 14 Mar 2016 23:26:30 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>TALN 2014 : Marseille sous le signe de l&#8217;innovation en TAL pour les 20 ans de TALN</title>
		<link>http://blog.onyme.com/taln-2014-marseille-20-ans/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=taln-2014-marseille-20-ans</link>
		<comments>http://blog.onyme.com/taln-2014-marseille-20-ans/#comments</comments>
		<pubDate>Tue, 27 May 2014 09:48:49 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[Conférences]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[Marseille TALN]]></category>
		<category><![CDATA[Recital 2014]]></category>
		<category><![CDATA[salon de l'innovation en TAL]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[TALN 20 ans]]></category>
		<category><![CDATA[TALN 2014]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=2726</guid>
		<description><![CDATA[Un petit billet pour vous faire part de la tenue prochaine de la <b>conférence TALN, édition 2014</b>. Édition qui se déroulera à <b>Marseille</b> du <b>1er au 4 juillet 2014</b>.

Le petit plus cette année pour célébrer les 20 ans de TALN : le <b>salon de l'innovation en TAL</b>.]]></description>
				<content:encoded><![CDATA[<p><a target="_blank" href="http://www.taln2014.org"><img src="http://blog.onyme.com/wp-content/uploads/2014/05/Bandeau_TALN2014_long.png" alt="Bandeau_TALN2014_long" width="100%" class="aligncenter size-full wp-image-2741" /></a></p>
<p>Un petit billet pour vous faire part de la tenue prochaine de la <b>conférence TALN, édition 2014</b>. Comme tous les ans depuis 2010, j&#8217;y assisterai mais cette édition réserve <u>quelques surprises</u>.</p>
<p>Attention, <b>teasing</b>&#8230;</p>
<h4 style="color: #AA3D43">TALN / RECITAL / Ateliers : le cœur de l&#8217;évènement</h4>
<p>Cette édition très particulière se déroulera à <b>Marseille</b> du <u>1er au 4 juillet 2014</u>. La conférence <b>RECITAL</b>, destinée à la présentation de travaux de jeunes chercheurs, se tiendra comme habituellement en même temps ainsi que les ateliers <b>DEFT, SemDis, FondamenTAL, TALaf et RLTLN</b> qui auront lieu le premier jour : le <b>mardi 1er juillet</b>.</p>
<p>Mais alors quoi d&#8217;inhabituel / d&#8217;exceptionnel? Marseille est la ville d&#8217;origine de la conférence où se sont déroulés les trois premières éditions de 1994 à 1996 : il y a donc <b>tout juste 20 ans cette année</b>!!</p>
<p>Après ce bref moment historique, revenons au cœur du contenu de la présente édition de la conférence : <b>46 articles</b> ont d&#8217;ores et déjà été acceptés (on en attend d&#8217;autres) dont 34 articles longs à TALN, 6 présentations orales à RECITAL et 6 présentations posters à RECITAL. </p>
<p>Voici comme tous les ans ma petite pré-liste personnelle d&#8217;articles choisis (même s&#8217;il est difficile d&#8217;avoir un choix très arrêté uniquement en connaissant le titre <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> ) :</p>
<ul>
<li>Quoc-Khanh Do, Alexandre Allauzen and François Yvon. <b>Modèles de langue neuronaux: une comparaison de plusieurs stratégies d’apprentissage</b></li>
<li>Maud Pironneau, Éric Brunelle and Simon Charest. <b>Correction automatique par résolution d’anaphores pronominales</b></li>
<li>Iris Eshkol, Isabelle Tellier, Yoann Dupont and Ilaine Wang. <b>Peut-on bien chunker avec de mauvaises étiquettes POS ?</b></li>
<li>Morgane Marchand, Olivier Mesnard, Romaric Besançon and Anne Vilnat. <b>Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d’opinion au niveau du texte</b></li>
<li>Marion Baranes and Benoît Sagot. <b>Normalisation de textes par analogie: le cas des mots inconnus</b></li>
</ul>
<p>Et le lien vers la liste intégrale des <a target="_blank" href="http://www.taln2014.org/site/programme/articles-acceptes/">articles acceptés</a>.</p>
<h4 style="color: #AA3D43">Le salon de l&#8217;innovation en TAL : le grand évènement des 20 ans de TALN</h4>
<p><a target="_blank" href="http://www.taln2014.org"><img src="http://blog.onyme.com/wp-content/uploads/2014/05/FlyerTalnAnim_5_350px_2_4sec.gif" alt="FlyerTalnAnim_5_350px_2_4sec" width="50%" class="aligncenter size-full wp-image-2752" /></a></p>
<p>En plus des activités habituelles se tiendra cette année le <a target="_blank" href="http://www.taln2014.org/site/salon-de-linnovation-en-tal/" />salon de l&#8217;innovation en TAL</a> le <b>vendredi 4 juillet</b>. Ce salon, dont les frais d&#8217;accès sont compris dans les frais d&#8217;inscription à TALN, se tiendra en marge de la conférence pour célébrer l&#8217;anniversaire de la conférence en réunissant lors de cette journée tous les <b>acteurs de l&#8217;innovation en TAL</b>, des domaines privés et publics en France.</p>
<p>L&#8217;occasion de <b>rencontrer et d&#8217;échanger</b> avec d&#8217;autres acteurs du TAL sur les enjeux, les défis, les opportunités, &#8230; que constitue le traitement automatique des langues dans les logiciels d&#8217;aujourd&#8217;hui et de demain.</p>
<h4 style="color: #AA3D43">Toujours plus loin, toujours plus grand, toujours plus profond,&#8230;</h4>
<p><a target="_blank" href="http://147.94.196.239/wordpress/wp-content/uploads/2014/04/SortiePlong%C3%A9eTALN2014-small.pdf"><img src="http://blog.onyme.com/wp-content/uploads/2014/05/sortie-plongee.jpeg" alt="sortie-plongee" width="50%" class="aligncenter size-full wp-image-2763" /></a></p>
<p>Afin de marquer encore davantage l&#8217;évènement des 20 ans de TALN et parce qu&#8217;une conférence ne saurait être réussie sans une activité de loisir, une <a target="_blank" href="http://147.94.196.239/wordpress/wp-content/uploads/2014/04/SortiePlong%C3%A9eTALN2014-small.pdf"><b>sortie plongée</b></a> est organisée pour les amateurs de ce sport. <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_surprised.gif' alt=':o' class='wp-smiley' /> </p>
<p>De la plongée baptême accompagné d&#8217;un moniteur à celle autonome pour les expérimentés : tout a été prévu. Vous pourrez donc y participer si cela vous tente à la double condition de <b>payer un supplément</b> (et oui ce n&#8217;est pas compris dans le prix de la conférence) et d&#8217;<b>arriver une journée avant</b> puisque l&#8217;excursion est prévue pour le <b>lundi 30 juin après midi</b>.</p>
<p>Un moment fun et inoubliable en perspective! <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
<h4 style="color: #AA3D43">Un dernier mot?</h4>
<p>Les inscriptions sont déjà ouvertes et comme d&#8217;habitude un <b>tarif préférentiel</b> s&#8217;applique pour ceux qui s&#8217;inscrivent tôt (avant le <b>6 juin</b>). Ne tardez donc pas si le TAL et l&#8217;innovation dans ce secteur vous intéressent. Toutes les informations utiles et le formulaire d&#8217;inscription sont sur le <a target="_blank" href="http://www.taln2014.org">site de la conférence</a>.</p>
<p>Si vous souhaitez faire de la plongée, vous devez également procéder à une inscription séparée et ce au plus vite car les places sont limitées : <a target="_blank" href="http://www.taln2014.org/site/activite-sociale/" />http://www.taln2014.org/site/activite-sociale/</a></p>
<p>Si vous le souhaitez, vous pouvez également lire (ou relire) les billets concernant les éditions précédentes de la conférence :</p>
<ul>
<li><a target="_blank" href="taln-2013-direct/">TALN 2013 : Le TAL en direct des Sables d’Olonne</a></li>
<li><a target="_blank" href="taln-2013-les-sables-d-olonne/">TALN 2013 : Les Sables d’Olonne</a></li>
<li><a target="_blank" href="jep-taln-2012-retour">JEP-TALN 2012 : Retour sur la conférence de Grenoble</a></li>
<li><a target="_blank" href="taln-2012-grenoble">TALN 2012 : Grenoble</a></li>
<li><a target="_blank" href="taln-recital-deft-2010-quand-le-tal-sinvite-a-montreal">TALN / Recital / DEFT 2010 : Quand le TAL s’invite à Montréal</a></li>
<li><a target="_blank" href="recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions">Recital 2010 : Onyme présente un article sur la fouille d’opinions</a></li>
</ul>
<div style="text-align:center;color: #AA3D43">Je vous dis donc à très bientôt à Marseille pour les 20 ans de TALN <br />et n&#8217;hésitez pas à nous suivre durant l&#8217;évènement sur Twitter <br /><a target="_blank" href="https://twitter.com/Onyme_FR">@Onyme_fr</a> et <a target="_blank" href="https://twitter.com/trouvilliez">@trouvilliez</a></div>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/taln-2014-marseille-20-ans/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>TALN 2013 : Les Sables d’Olonne</title>
		<link>http://blog.onyme.com/taln-2013-les-sables-d-olonne/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=taln-2013-les-sables-d-olonne</link>
		<comments>http://blog.onyme.com/taln-2013-les-sables-d-olonne/#comments</comments>
		<pubDate>Fri, 29 Mar 2013 08:16:24 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[Conférences]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[TALN 2013]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=1866</guid>
		<description><![CDATA[Un petit billet court pour vous faire part de la tenue prochaine de la conférence TALN, édition 2013. Édition qui se déroulera aux Sables d’Olonne du 17 au 21 juin 2013.]]></description>
				<content:encoded><![CDATA[<p>Un petit billet court pour vous faire part de la tenue prochaine de la <b>conférence TALN, édition 2013</b>.</p>
<p>Cette édition se déroulera aux <b>Sables d’Olonne</b> du <u>17 au 21 juin 2013</u>. La conférence RECITAL, destinée à la présentation de travaux de jeunes chercheurs, se tiendra comme habituellement en même temps. Toutes les informations sont sur le <a target="_blank" href="http://www.taln2013.org/">site de la conférence</a></p>
<p>La première liste d&#8217;articles est déjà publiée (le contenu des articles n&#8217;est pas encore disponible) : les <a target="_blank" href="http://www.taln2013.org/programme/articles-longs-taln-2013-selectionnes/">articles longs TALN 2013</a>. Une petite liste personnelle d&#8217;articles choisis parmi eux :</p>
<ul>
<li>Isabelle Tellier and Yoann Dupont. Apprentissage symbolique et statistique pour le chunking : comparaison et combinaisons</li>
<li>Quentin Pradet, Jeanne Baguenier-Desormeaux, Gaël de Chalendar and Laurence Danlos. WoNeF : amélioration, extension et évaluation d’une traduction française automatique de WordNet</li>
<li>Nicolas Hernandez and Florian Boudin. Construction automatique d’un large corpus libre annoté morpho-syntaxiquement en français</li>
<li>Anca-Roxana Simon, Guillaume Gravier and Pascale Sébillot. Un modèle segmental probabiliste combinant cohésion lexicale et rupture lexicale pour la segmentation thématique</li>
<li>Franck Sajous, Nabil Hathout and Basilio Calderone. GLÀFF, un Gros Lexique À tout Faire du Français</li>
<li>Wei Wang, Romaric Besançon, Olivier Ferret and Brigitte Grau. Regroupement sémantique de relations pour l’extraction d’information non supervisée</li>
</ul>
<p>L&#8217;ouverture des inscriptions est attendue très prochainement avec comme d&#8217;habitude un tarif préférentiel pour ceux qui s&#8217;inscrivent tôt.</p>
<p>A suivre les articles courts TALN 2013 et les articles longs et courts RECITAL 2013. Avis aux amateurs de Traitement Automatique des Langues&#8230;.</p>
<p>Si vous le souhaitez, vous pouvez également lire (ou relire) les billets concernant les éditions précédentes de la conférence :</p>
<ul>
<li><a target="_blank" href="jep-taln-2012-retour">Retour sur l&#8217;édition 2012</a></li>
<li><a target="_blank" href="taln-2012-grenoble">Annonce de l&#8217;édition 2012</a></li>
<li><a target="_blank" href="taln-recital-deft-2010-quand-le-tal-sinvite-a-montreal">Retour sur l&#8217;édition 2010</a></li>
<li><a target="_blank" href="recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions">Annonce de l&#8217;édition 2010</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/taln-2013-les-sables-d-olonne/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>JEP-TALN 2012 : Retour sur la conférence de Grenoble</title>
		<link>http://blog.onyme.com/jep-taln-2012-retour/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=jep-taln-2012-retour</link>
		<comments>http://blog.onyme.com/jep-taln-2012-retour/#comments</comments>
		<pubDate>Tue, 19 Jun 2012 08:14:19 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Conférences]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[complexité phonologique d'une langue]]></category>
		<category><![CDATA[correction orthographique]]></category>
		<category><![CDATA[détection de la langue d'un texte]]></category>
		<category><![CDATA[JEP]]></category>
		<category><![CDATA[JEP 2012]]></category>
		<category><![CDATA[JEP-TALN]]></category>
		<category><![CDATA[JEP-TALN 2012]]></category>
		<category><![CDATA[JEP-TALN-RECITAL 2012]]></category>
		<category><![CDATA[langue d'un mot inconnu]]></category>
		<category><![CDATA[Okapi BM-25]]></category>
		<category><![CDATA[pondération d'un mot]]></category>
		<category><![CDATA[TALN Grenoble]]></category>
		<category><![CDATA[TF-IDF]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=1189</guid>
		<description><![CDATA[Comme je l'avais annoncé dans le blog en Avril, l'<u>édition 2012</u> de la conférence <b>TALN - RECITAL</b> s'est déroulée à <u>Grenoble</u> du <b>04 au 08 Juin</b>. Cette année était pourtant particulière... Je vous propose un petit tour d'horizon sur cette conférence.]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Comme je l&#8217;avais annoncé dans le <a target="_blank" href="taln-2012-grenoble">blog en Avril</a>, l&#8217;<u>édition 2012</u> de la conférence <b>TALN &#8211; RECITAL</b> s&#8217;est déroulée à <u>Grenoble</u> du <b>04 au 08 Juin</b>. Cette année était pourtant particulière&#8230; Je vous propose un petit tour d&#8217;horizon sur cette conférence.</p>
<p>Sommaire</p>
<ul>
<li><a href="#quoi">JEP-TALN, c&#8217;est quoi?</a></li>
<li><a href="#Okapi">Vectorisation, Okapi et calcul de similarité pour le TAL : pour oublier enfin le TF-IDF</a></li>
<li><a href="#correction">Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d’un mot inconnu</a></li>
<li><a href="#phonologie">The Origin and Distribution of Complexity of Phonological Structure</a></li>
<li><a href="#plus">Plus?</a></li>
</ul>
<h2><a name="quoi"></a>JEP-TALN, c&#8217;est quoi?</h2>
<p><b>JEP-TALN</b> (raccourci de <b>JEP-TALN-RECITAL</b>), ce sont deux conférences qui se déroulent sur le même lieu et en même temps <u>tous les 4 ans</u>. Si elles ont chacune une histoire qui leur est propre, les conférences se rejoignent sur la volonté de traiter du langage naturel.</p>
<h3>TALN-RECITAL</h3>
<p><b>TALN</b> (Traitement Automatique du Langage Naturel) &#8211; <b>RECITAL</b> (Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues)</p>
<p>Elle est organisée tous les ans sous l&#8217;égide de l&#8217;<a target="_blank" href="http://www.atala.org/">ATALA (Association pour le Traitement Automatique des Langues)</a>. J&#8217;ai eu l&#8217;occasion d&#8217;assister aux deux précédentes éditions qui se sont tenues à <u>Montréal</u> et <u>Montpellier</u> en <u>2010</u> et <u>2011</u>. Le domaine de la conférence est l&#8217;étude et le traitement automatique du langage naturel dans son ensemble. Cependant, le traitement du langage naturel sous sa forme &#8220;écrite&#8221; est bien souvent sur représenté par rapport aux autres styles de canaux utilisés par le langage naturel tel que les canaux oraux ou gestuels.</p>
<h3>JEP</h3>
<p><b>JEP</b> (Journées d’Études sur la Parole) </p>
<p>Elle est organisée tous les deux ans sous l&#8217;égide de l&#8217;<a target="_blank" href="http://www.afcp-parole.org/">AFCP (Association Francophone de la Communication Parlée)</a>. Le domaine de la conférence se situe sur l&#8217;étude et le traitement de la langue parlée (la parole).</p>
<h3>JEP-TALN-RECITAL</h3>
<p>Lorsque l&#8217;on réunit les deux conférences, cela donne une grande conférence sur le traitement de la langue aussi bien écrite que parlée organisée sous l&#8217;égide des deux associations tous les 4 ans : <b>JEP-TALN</b>.</p>
<h2><a name="Okapi"></a>Vectorisation, Okapi et calcul de similarité pour le TAL : pour oublier enfin le TF-IDF</h2>
<p><u>Auteur</u> : Vincent Claveau<br />
<u>Conférence</u> : TALN, pp 85-98<br />
<a href="http://www.jeptaln2012.org/actes/TALN2012/pdf/TALN2012007.pdf">PDF</a> / <a href="http://www.jeptaln2012.org/actes/TALN2012/bib/TALN2012007.bib">Bibtex</a></p>
<p><a target="_blank" href="https://twitter.com/Trouvilliez/status/210507417316892672"><img src="http://blog.onyme.com/wp-content/uploads/2012/06/tweet11.png" alt="" width="521" height="124" class="aligncenter size-full wp-image-1273" /></a></p>
<p><a target="_blank" href="https://twitter.com/Trouvilliez/status/210510220118605824"><img src="http://blog.onyme.com/wp-content/uploads/2012/06/tweet21.png" alt="" width="520" height="142" class="aligncenter size-full wp-image-1274" /></a></p>
<p>Ce premier exposé est une <u>prise de position</u> dans le domaine de la <b>recherche d&#8217;informations</b>. C&#8217;est un papier de la conférence TALN mais qui a été présenté lors de la session commune du mardi matin. Je l&#8217;ai trouvé particulièrement intéressant car il reprend les grandes méthodes utilisées fréquemment dans le domaine et les comparent à des méthodes plus récentes en s&#8217;interrogeant sur la pertinence des anciennes méthodes par rapport aux anciennes. J&#8217;ai particulièrement apprécié la mise en compétition de la très célèbre pondération <a target="_blank" href="http://fr.wikipedia.org/wiki/TF-IDF">TF-IDF</a> avec des méthodes telles que l&#8217;<a target="_blank" href="http://fr.wikipedia.org/wiki/Okapi_BM25">Okapi BM-25</a>. L&#8217;auteur est en tous cas clairement <b>en faveur</b> de l&#8217;<u>Okapi</u> qu&#8217;il juge comme &#8220;<b>un TF-IDF amélioré</b>&#8220;.</p>
<h2><a name="correction"></a>Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d’un mot inconnu</h2>
<p><u>Auteur</u> : Marion Baranes<br />
<u>Conférence</u> : RECITAL, pp 95-108<br />
<a href="http://www.jeptaln2012.org/actes/RECITAL2012/pdf/RECITAL2012008.pdf">PDF</a> / <a href="http://www.jeptaln2012.org/actes/RECITAL2012/bib/RECITAL2012008.bib">Bibtex</a></p>
<p>Cet exposé d&#8217;un travail de thèse aborde le problème de la <u>détermination de la langue des mots d&#8217;un texte</u>. Cette détermination s&#8217;effectue dans le cadre (et dans le but) d&#8217;une correction orthographique. Si certains correcteurs sont capables de détecter la <b>langue globale d&#8217;un texte</b>, il est beaucoup plus rare qu&#8217;ils s&#8217;intéressent à la <b>langue de chaque mot</b>. Pourtant comment <u>traiter correctement</u> des <b>mots anglais</b> si on les prend pour des <b>mots français</b> sous le prétexte que la majorité du texte est dans cette langue? Le travail présenté ici vise donc à repérer dans des <u>textes français</u> des <u>mots anglais</u> afin de ne pas proposer une correction erronée de ces mots. L&#8217;un des <u>buts futurs de la thèse</u> est d&#8217;<u>étendre</u> les travaux à d&#8217;<b>autres langues</b>. Une soumission en perspective à RECITAL 2013?</p>
<h2><a name="phonologie"></a>The Origin and Distribution of Complexity of Phonological Structure</h2>
<p><u>Auteur</u> : Ian Maddieson<br />
<u>Conférence</u> : Invités, pp 7-7<br />
<a href="http://www.jeptaln2012.org/actes/INVITED/pdf/INVITED004.pdf">PDF</a> / <a href="http://www.jeptaln2012.org/actes/INVITED/bib/INVITED004.bib">Bibtex</a></p>
<table width="100%">
<tr>
<td><a href="http://blog.onyme.com/wp-content/uploads/2012/06/Ian_Maddieson_1.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/06/Ian_Maddieson_1-210x300.jpg" alt="" width="210" height="300" class="alignleft size-medium wp-image-1212" /></td>
<td></a><a href="http://blog.onyme.com/wp-content/uploads/2012/06/Ian_Maddieson_2.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/06/Ian_Maddieson_2-300x210.jpg" alt="" width="300" height="210" class="alignright size-medium wp-image-1215" /></a></td>
</tr>
</table>
<p>Un exposé invité dans le <u>domaine de la parole</u>. A l&#8217;origine prévu en anglais (l&#8217;auteur étant anglophone, d&#8217;origine américaine), l&#8217;exposé a finalement été réalisé <b>en français</b>!! Je tiens du coup à souligner cet effort réalisé par l&#8217;auteur qui a par ailleurs une assez bonne maîtrise du français parlé. L&#8217;auteur nous a présenté dans un premier temps, ce qu&#8217;il faut entendre par <b>complexité de la phonologie d&#8217;une langue</b> et surtout les <u>différents critères</u> permettant de l&#8217;apprécier. Par exemple, le <u>nombre de consonances</u>, le <u>nombre de voyelles</u> ou encore <u>les tonalités</u>, sont autant de critères allant dans ce sens. Si l&#8217;on pourrait penser de prime abord que toutes les langues parlées ont la même complexité, il n&#8217;en ai finalement rien. On observe au contraire des <b>complexités différentes d&#8217;une langue à l&#8217;autre</b> et surtout des différences dans les différents critères énoncés pour juger de cette complexité. Une théorie intéressante qui nous a été présentée repose sur l&#8217;idée qu&#8217;il existe <u>un lien entre les caractéristiques phonologiques</u> d&#8217;une langue et le <u>milieu naturel</u> dans lequel elle est utilisée. Ainsi, il existerait une correspondance entre les caractéristiques des langues parlées et le fait que le milieu soit dégagé, montagneux, arboré,&#8230;</p>
<h2><a name="plus"></a>Plus?</h2>
<p>Je ne fais malheureusement ici qu&#8217;un très (trop?) rapide tour d&#8217;horizon des nombreux exposés dont j&#8217;aurais pu parler. Si vous êtes intéressés pour en savoir davantage, la conférence met à disposition en ligne les actes de la conférences. N&#8217;hésitez donc pas&#8230;</p>
<p>Les ressources sont déjà disponibles en ligne :</p>
<ul>
<li><a target="_blank" href="http://www.jeptaln2012.org/actes/">L&#8217;ensemble des actes</a></li>
<li><a target="_blank" href="http://www.smugmug.com/gallery/23376679_ggPZb2#!i=1887832178&amp;k=MGtspKB">Les photos officielles de la conférence dont les deux de Ian Maddieson que j&#8217;ai inclus dans ce billet</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/jep-taln-2012-retour/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>TALN 2012 : Grenoble</title>
		<link>http://blog.onyme.com/taln-2012-grenoble/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=taln-2012-grenoble</link>
		<comments>http://blog.onyme.com/taln-2012-grenoble/#comments</comments>
		<pubDate>Wed, 18 Apr 2012 07:15:15 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[Conférences]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[TALN 2012]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=1064</guid>
		<description><![CDATA[Un petit billet court pour vous faire part de la tenue prochaine de la conférence TALN, édition 2012.]]></description>
				<content:encoded><![CDATA[<p>Un petit billet court pour vous faire part de la tenue prochaine de la conférence TALN, édition 2012.</p>
<p>Cette édition se déroulera à <b>Grenoble</b> du <b>4 au 8 juin 2012</b>. Les inscriptions sont ouvertes et un tarif préférentiel d&#8217;inscription est proposé jusqu&#8217;au 1er mai : <a target="_blank" href="http://www.jeptaln2012.org/">site de la conférence</a></p>
<p>Si le Traitement Automatique des Langues vous intéresse, c&#8217;est une conférence à ne pas manquer!!</p>
<p><u>Edit</u> : La conférence est passée!! Si vous l&#8217;avez manquée, vous pouvez encore lire le <a href="./jep-taln-2012-retour">petit retour</a> que j&#8217;ai rédigée.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/taln-2012-grenoble/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Ateliers 2011 sur les Terminologies et l’Intelligence Artificielle (TIA) &#8211; la Perspective Lemon</title>
		<link>http://blog.onyme.com/tia-2011-lemon/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=tia-2011-lemon</link>
		<comments>http://blog.onyme.com/tia-2011-lemon/#comments</comments>
		<pubDate>Mon, 05 Mar 2012 11:55:57 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Conférences]]></category>
		<category><![CDATA[lemon perspective]]></category>
		<category><![CDATA[lexical model for ontologies]]></category>
		<category><![CDATA[lexicalisation d'une ontologie]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[TIA]]></category>
		<category><![CDATA[TIA 2011]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=956</guid>
		<description><![CDATA[Ce nouvel article a pour but de vous faire partager un peu plus mon expérience sur les ateliers (workshops) de la conférence TIA, édition 2011 auxquels j’ai pu assister début novembre 2011 à Paris. Il est consacré à la perspective <em>lemon</em>.]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Ce nouvel article a pour but de vous faire partager un peu plus mon expérience sur les ateliers (workshops) de la conférence TIA, édition 2011 auxquels j’ai pu assister début novembre 2011 à Paris. Il s&#8217;agit de la suite d&#8217;un <a href="tia-2011">premier billet publié en fin d&#8217;année dernière</a>.</p>
<h2>TIA</h2>
<p>J&#8217;ai présenté en détails la conférence dans le premier billet. Je vous invite donc à vous y reporter.</p>
<h2>Ontology Lexicalisation : The <em>lemon</em> Perspective</h2>
<p>Auteurs : Paul Buitelaar et al<br />
<a href="http://tia2011.crim.fr/Workshop-Proceedings/pdf/TIAW15.pdf">pdf</a>/<a href="http://tia2011.crim.fr/Workshop-Proceedings/bib/TIAW15.bib">bib</a></p>
<p>Comme promis lors du premier billet, je vous présente aujourd&#8217;hui la perspective <em>lemon</em>. <em>Lemon</em> est ici un acronyme pour LExical Model for ONtologies (modèle lexical pour des ontologies) dont nous allons voir l&#8217;intérêt dans deux cas d&#8217;utilisation présentés dans le papier.</p>
<p><u>Qu&#8217;est ce qu&#8217;une ontologie?</u><br />
Pour comprendre l&#8217;intérêt rappelons d&#8217;abord ce qu&#8217;est une ontologie dans le sens où on l&#8217;entend ici. Il s&#8217;agit de manière générale d&#8217;une <strong>ressource</strong> permettant la <strong>description d&#8217;un domaine</strong> au travers de ses <strong>concepts</strong> et des <strong>liens</strong> existants entre eux. L&#8217;auteur prend l&#8217;exemple d&#8217;une ontologie basée sur le domaine du tourisme et décrivant par conséquent (et entre autres) les monuments historiques et les œuvres d&#8217;art. Si vous voulez entrer un peu plus dans les détails de ce qu&#8217;est une ontologie, vous pouvez consulter cet <a href="ontologie">autre billet du blog</a>.</p>
<p><u>Le problème de l&#8217;extraction d&#8217;informations à partir de textes</u><br />
Le premier problème posé suppose alors qu&#8217;il faille extraire des informations pertinentes de textes par rapport à un domaine décrit par une ontologie. L&#8217;auteur nous montre alors que ce problème n&#8217;est simple à résoudre qu&#8217;à la condition que l&#8217;ontologie emploie les même termes que le texte. Dans son exemple, l&#8217;ontologie décrit les monuments historiques en tant qu&#8217;&#8221;édifice historique&#8221;. Par conséquent, un texte commençant par &#8220;l&#8217;édifice historique de l&#8217;université de Barcelone&#8230;.&#8221; sera aisément reconnu comme pertinent. Par contre, si le texte mentionne &#8220;l&#8217;édifice reconnu monument historique national&#8230;&#8221;, la pertinence est de ce fait moins triviale.</p>
<p><u>Le problème de la recherche d&#8217;informations dans l&#8217;ontologie et la gestion du multilinguisme</u><br />
Le deuxième problème posé concerne l&#8217;interrogation de la connaissance enregistrée dans l&#8217;ontologie en langage naturel. Un exemple est alors pris sur l&#8217;ontologie par une requête simple : &#8220;Qui a peint Mona Lisa?&#8221;. Encore une fois, si l&#8217;ontologie décrit pour les peintures la notion de peindre, cette requête ne présente (à priori) pas de difficultés particulières sous condition qu&#8217;elle décrive bien l’œuvre &#8220;Mona Lisa&#8221; et pas &#8220;La Joconde&#8221;. Mais dans le cas où l&#8217;ontologie comporte uniquement la description des artistes pour chaque œuvre, cela suppose d&#8217;être capable d&#8217;établir un lien entre l&#8217;action de peindre et la notion d&#8217;artiste&#8230; Cette deuxième problématique introduit également des réflexions concernant la gestion du multilinguisme. Que la question soit posée dans n&#8217;importe quelle langue, l&#8217;élément de réponse est invariant (seule la manière de l&#8217;exprimer va changer). La gestion du multilinguisme n&#8217;est cependant pas triviale si on ne dispose pas d&#8217;informations concernant les liens existants entre peint, painted, pinto&#8217;,&#8230;</p>
<p><u>La perspective <em>lemon</em></u><br />
En quoi le <em>lemon</em> va alors nous aider? Le but est de créer un <strong>lien</strong> entre les <strong>ontologies</strong> (comme celle prise en exemple auparavant) et des <strong>ressources lexicales</strong>. Typiquement, chaque <strong>entité (ou concepts) de l&#8217;ontologie</strong> est mappé sur les <strong>sens lexicaux</strong> permettant la réalisation du concept ontologique. Dans l&#8217;exemple des artistes de l&#8217;ontologie du tourisme, l&#8217;entité artiste peut ainsi mappée sur sur le sens lexical &#8220;qui réalise une œuvre d&#8217;art&#8221;. Ce sens lexical trouve sa réalisation dans des <strong>entrées lexicales</strong> comme par exemple l&#8217;entrée &#8220;peintre&#8221; qui elle même est réalisée au travers de <strong>formes lexicales</strong> comme &#8220;peintre&#8221; ou &#8220;peintres&#8221;. Il est alors possible d&#8217;établir des liens entre les différents sens lexicaux.</p>
<p><u>Cela me fait penser à quelque chose&#8230;</u><br />
Si vous avez déjà lu des billets dans le blog (et particulièrement ceux traitant de <a href="ontologies-wordnet-eurowordnet-et-wolf">Wordnet</a> et de <a href="lemmatisation-et-racinisation-en-francais-flexion-lemme-et-racine-dun-mot">lemmatisation</a>), ces notions doivent vous donner une impression de déjà vu. Cela est normal puisque Wordnet est une ressource lexicale gérant des entrées et des sens lexicaux <strong>mais dans un contexte généraliste</strong>. Ici, le but est d&#8217;obtenir une ressource semblable à wordnet sur ces points <strong>mais spécifique au domaine traité par l&#8217;ontologie et plus spécifiquement à l&#8217;ontologie elle même</strong>. L&#8217;ajout de la notion des formes lexicales relate aux travaux de lemmatisation que nous avons également étudié auparavant.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/tia-2011-lemon/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>GWC 2012 : Conférence sur les Wordnets à Matsue au Japon&#8230;</title>
		<link>http://blog.onyme.com/gwc-2012-retour/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=gwc-2012-retour</link>
		<comments>http://blog.onyme.com/gwc-2012-retour/#comments</comments>
		<pubDate>Mon, 13 Feb 2012 10:42:20 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Conférences]]></category>
		<category><![CDATA[GWC]]></category>
		<category><![CDATA[GWC 2012]]></category>
		<category><![CDATA[linguistique]]></category>
		<category><![CDATA[ressources linguistiques]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[WOLF]]></category>
		<category><![CDATA[Wordnet]]></category>
		<category><![CDATA[Wordnet Domains]]></category>
		<category><![CDATA[WOrdnet Libre du Français]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=912</guid>
		<description><![CDATA[Un petit billet pour vous faire un retour d'expérience de la conférence GWC 2012 à laquelle j'ai pu participer en ce début d'année.]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Un petit billet pour vous faire un retour d&#8217;expérience de la conférence GWC 2012 à laquelle j&#8217;ai pu participer en ce début d&#8217;année.</p>
<h2>La conférence et ma présentation</h2>
<table align="center">
<tr>
<td><a href="http://blog.onyme.com/wp-content/uploads/2012/02/P1050551.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/02/P1050551-300x225.jpg" alt="" width="300" height="225" class="aligncenter size-medium wp-image-946" /></a></td>
<td><a href="http://blog.onyme.com/wp-content/uploads/2012/02/P1050554.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/02/P1050554-300x225.jpg" alt="" width="300" height="225" class="aligncenter size-medium wp-image-945" /></a></td>
</tr>
</table>
<p><strong>Citation</strong> : Benoît Trouvilliez (2012). Linking specific and generalist knowledge &#8211; Building terminological resources from sales catalogues and generalist resources. In Actes de la 6ème Global Wordnet Conference, Matsue, Japon.</p>
<p>Comme je l&#8217;avais annoncé <a href="gwc-2012">en fin d&#8217;année dernière</a>, j&#8217;ai présenté un article à la conférence GWC, édition 2012, qui s&#8217;est déroulée à Matsue au Japon du 9 au 13 janvier 2012. Le but de ce deuxième article est de vous faire un rapide retour sur quelques unes des choses dont j&#8217;ai entendu parler là bas et qui ont particulièrement retenues mon attention.</p>
<p>Avant toute chose, une première information statistique : nous n&#8217;étions &#8220;que&#8221; trois projets francophones à présenter nos travaux sur Wordnet à la conférence GWC. Le &#8220;que&#8221; que j’emploie ici est relatif car bien que ce chiffre soit relativement faible, si l&#8217;on prend en compte la distance à parcourir pour s&#8217;y rendre, cela montre au contraire un certain intérêt de la communauté francophone pour Wordnet. En comparaison, seul deux projets japonnais nous ont été présentés alors que nous étions sur place. Cela s&#8217;explique en partie par la difficulté d&#8217;appliquer le principe de Wordnet sur la langue japonnaise.</p>
<p>Pour ceux qui ne connaissent pas Wordnet, j&#8217;ai écris <a href="ontologies-wordnet-eurowordnet-et-wolf">un billet</a> sur ces ressources.</p>
<h2>Pourquoi faut-il de nouveaux domaines pour Wordnet?</h2>
<table align="center">
<tr>
<td><a href="http://blog.onyme.com/wp-content/uploads/2012/02/P1040576.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/02/P1040576-300x225.jpg" alt="" width="300" height="225" class="aligncenter size-medium wp-image-947" /></a></td>
<td><a href="http://blog.onyme.com/wp-content/uploads/2012/02/P1040578.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/02/P1040578-300x225.jpg" alt="" width="300" height="225" class="aligncenter size-medium wp-image-948" /></a></td>
</tr>
</table>
<p><strong>Citation</strong> : Xiaojuan Ma and Christiane Fellbaum (2012). Rethinking WordNet&#8217;s Domains. In Actes de la 6ème Global Wordnet Conference, Matsue, Japon.</p>
<p>Cette thématique abordée par les développeurs de Wordnet sous la forme d&#8217;une question a retenue particulièrement mon attention par sa correspondance avec un constat que nous avions nous même fait sur les domaines du <a target="_blank" href="http://wndomains.fbk.eu/">Wordnet Domains</a> : ils sont assez généralistes, plutôt vagues et de ce fait difficilement exploitables dans un contexte industrielle où l&#8217;on chercherait à identifier des thématiques précises.</p>
<p>Le but de l&#8217;étude présentée est donc à la fois de montrer ce manque de domaines exploitables à un niveau industrielle mais aussi de donner les premières pistes pour identifier de nouveaux domaines de manière semi automatique dans les synsets de Wordnet. Une piste intéressante concerne l&#8217;utilisation de ressources en ligne comme Wikipedia par exemple. A suivre&#8230;.</p>
<h2>Enrichissement automatique du WOLF</h2>
<table align="center">
<tr>
<td><a href="http://blog.onyme.com/wp-content/uploads/2012/02/P1050594.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/02/P1050594-300x225.jpg" alt="" width="300" height="225" class="aligncenter size-medium wp-image-951" /></a></td>
<td><a href="http://blog.onyme.com/wp-content/uploads/2012/02/P1050597.jpg"><img src="http://blog.onyme.com/wp-content/uploads/2012/02/P1050597-300x225.jpg" alt="" width="300" height="225" class="aligncenter size-medium wp-image-953" /></a></td>
</tr>
</table>
<p><strong>Citation</strong> : Sagot Benoît et Fišer Darja (2012). Automatic extension of WOLF. In Actes de la 6ème Global Wordnet Conference, Matsue, Japon.</p>
<p>Nous avons déjà eu l&#8217;occasion d&#8217;aborder cette ressource qu&#8217;est le <a href="http://blog.onyme.com/etude-de-lontologie-wordnet-libre-du-francais-wolf/">WOrdnet Libre du Français</a>. La conférence GWC a été l&#8217;occasion pour l&#8217;équipe de l&#8217;Inria qui développe ce projet de nous présenter les dernières avancées de cette ressource pour atteindre la version 0.2. A l&#8217;heure où j&#8217;écris ces lignes cependant, c&#8217;est toujours la version 0.1.5 qui est en ligne sur la <a target="_blank" href="http://alpage.inria.fr/~sagot/wolf.html">page officielle</a>.</p>
<p>Cependant, on peut dire que cette présentation comportait de bonnes nouvelles pour les utilisateurs du WOLF. En effet, entre la version 0.1.5 distribuée actuellement et la nouvelle version 0.2, une campagne d&#8217;enrichissement de la ressource a été menée. De nouveaux lexèmes ont ainsi été ajoutés automatiquement aux synsets du WOLF. Cela a eu deux impacts notoires sur la ressource :</p>
<ul>
<li>En premier lieu, un enrichissement des synsets déjà renseignés dans la version 0.1.5. Cet enrichissement ramène le nombre de synsets comportant plusieurs lexèmes à un niveau voisin de celui du wordnet anglais.</li>
<li>En second lieu, une augmentation du nombre de synsets non vides (et donc une diminution des synsets vides). Cela laisse à présager une meilleure finesse de la ressource obtenue puisque plus de sens sont ainsi exprimés au travers des lexèmes.</li>
</ul>
<p>Des évolutions qui seront donc à suivre de près&#8230;</p>
<h2>Le mot de la fin&#8230;</h2>
<p>Et pour conclure cet article, je vous donne le lien vers les photos de la conférence : <a target="_blank" href="http://lang.cs.tut.ac.jp/gwc2012/photo/">Plein d&#8217;autres photos</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/gwc-2012-retour/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Ateliers 2011 sur les Terminologies et l&#8217;Intelligence Artificielle (TIA)</title>
		<link>http://blog.onyme.com/tia-2011/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=tia-2011</link>
		<comments>http://blog.onyme.com/tia-2011/#comments</comments>
		<pubDate>Thu, 15 Dec 2011 08:42:11 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Conférences]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[intelligence artificielle]]></category>
		<category><![CDATA[lexical model for ontologies]]></category>
		<category><![CDATA[lexique translingue]]></category>
		<category><![CDATA[sémantique de corpus]]></category>
		<category><![CDATA[subjectivité des sentiments]]></category>
		<category><![CDATA[terminologie]]></category>
		<category><![CDATA[TIA]]></category>
		<category><![CDATA[TIA 2011]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=804</guid>
		<description><![CDATA[Ce nouvel article a pour but de vous faire partager mon expérience sur les ateliers (workshops) de la conférence TIA, édition 2011 auxquels j'ai pu assister début novembre à Paris.]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Ce nouvel article a pour but de vous faire partager mon expérience sur les ateliers (workshops) de la conférence TIA, édition 2011 auxquels j&#8217;ai pu assister début novembre à Paris.</p>
<h2>TIA</h2>
<p><u>C&#8217;est quoi TIA?</u><br />
D&#8217;abord, c&#8217;est quoi TIA? C&#8217;est l&#8217;acronyme de &#8220;Terminologies et Intelligence Artificielle&#8221;. C&#8217;est une conférence qui a lieu tous les deux ans et a pour thème principal la construction de terminologies pour une application dans le cadre de l&#8217;intelligence artificielle.</p>
<p><u>Terminologie? Intelligence artificielle?</u><br />
Une terminologie est une ressource visant à fournir des connaissances sur ce que l&#8217;on appelle des termes. Les termes étant des mots ou parfois des expressions ayant une sémantique propre par rapport à un domaine. Par exemple, le terme souris dans le domaine informatique n&#8217;a pas le même sens que le terme souris du domaine animalier. Dans les travaux récents, la terminologie en plus de s&#8217;intéresser à l&#8217;étude des domaines s&#8217;oriente également vers l&#8217;étude des applications particulières dans chacun de ces domaines. D&#8217;où le lien entre terminologies et intelligence artificielle&#8230;</p>
<p>L&#8217;intelligence artificielle (IA) désigne les procédés et algorithmes visant à faire réaliser des traitements &#8220;complexes&#8221; à un ordinateur, traitements réputés réalisables uniquement par des humains. L&#8217;apport des terminologies dans les domaines touchés par l&#8217;IA est de ce fait considérable. Plus d&#8217;infos sur l&#8217;IA et autres termes relatifs sur <a href="http://blog.onyme.com/traitement-automatique-des-langues-tal-intelligence-artificielle-ia-analyse-semantique-et-clusterings/">cette page du blog</a>.</p>
<p><u>Où et quand cela a t-il eu lieu?</u><br />
La conférence TIA, édition 2011, s&#8217;est déroulée à Paris du 8 au 10 novembre. Le workshop auquel j&#8217;ai assisté et dont je parle ici s&#8217;est déroulé le 10 novembre toute la journée au pôle des langues et civilisations de l&#8217;<a target="_blank" href="http://www.inalco.fr/">INALCO</a> situé au <a target="_blank" href="http://maps.google.fr/maps?f=q&amp;source=embed&amp;hl=fr&amp;geocode=&amp;q=65+rue+des+grands+moulins&amp;aq=&amp;sll=48.82752,2.376201&amp;sspn=0.011866,0.033023&amp;vpsrc=6&amp;g=65+rue+des+grands+moulins&amp;ie=UTF8&amp;hq=&amp;hnear=65+Rue+des+Grands+Moulins,+75013+Paris,+%C3%8Ele-de-France&amp;ll=48.82752,2.376201&amp;spn=0.011809,0.033023&amp;t=h&amp;z=14">65 rue des Grands Moulins à Paris</a>.</p>
<p><u>Quel est le but de cet article?</u><br />
Le but n&#8217;est pas de vous faire un compte rendu de ce qui a été dit lors du workshop mais uniquement de vous faire partager quelques remarques concernant l&#8217;analyse d&#8217;opinions.</p>
<p><u>Où peut on trouver des informations supplémentaires sur l&#8217;événement?</u><br />
Sur le <a target="_blank" href="http://tia2011.crim.fr/Home.html">site de l&#8217;édition de la conférence</a>. Si vous vous intéressez plus particulièrement aux ateliers, vous pouvez télécharger les <a target="_blank" href="http://tia2011.crim.fr/Workshop_Proceedings.html">proceedings des ateliers</a>.</p>
<h2>Construction d&#8217;un lexique translingue de sentiments à base de ressources existantes</h2>
<p><u>Auteur</u> : Meng Sun<br />
<a target="_blank" href="http://tia2011.crim.fr/Workshop-Proceedings/pdf/TIAW04.pdf">pdf</a> / <a target="_blank" href="http://tia2011.crim.fr/Workshop-Proceedings/bib/TIAW04.bib">bib</a></p>
<p><u>Comment construire une ressource pour une langue lorsqu&#8217;on en possède dans d&#8217;autres langues?</u><br />
J&#8217;ai trouvé cet exposé intéressant car il présentait une application de la transcription de ressources lexicales d&#8217;une langue source vers une langue cible à une ressource cherchant à décrire les sentiments comme par exemple le sentiWordnet.</p>
<p>Les deux approches <b>par traduction</b> et <b>par alignement</b> ont été abordées. J&#8217;avais déjà eu l&#8217;occasion de voir le couplage de ces deux techniques auparavant pour construire une ressource dans une langue cible existante déjà dans une langue source autre que celle désirée. C&#8217;était à l&#8217;occasion de mes études sur les adaptions du Wordnet de Princeton au français. Le <a href="http://blog.onyme.com/etude-de-lontologie-wordnet-libre-du-francais-wolf/">WOLF</a> a été construit dans cette même logique.</p>
<h2>Subjectivité et sentiments : l&#8217;éclairage de la sémantique de corpus</h2>
<p><u>Auteurs</u> : Évelyne Bourion et Jugurtha Aït-Hamlat<br />
<a target="_blank" href="http://tia2011.crim.fr/Workshop-Proceedings/pdf/TIAW05.pdf">pdf</a> / <a target="_blank" href="http://tia2011.crim.fr/Workshop-Proceedings/bib/TIAW05.bib">bib</a></p>
<p><u>C&#8217;est quoi une sémantique de corpus?</u><br />
Avant de nous intéresser au contenu de l&#8217;exposé, faisons d&#8217;abord un détour du côté des différentes sémantiques existantes. Lorsque l&#8217;on parle de sémantique, nous pouvons en fait désigner :</p>
<ul>
<li><u>la sémantique des mots</u> : Que veut dire tel mot? Le but est de comprendre le sens des mots selon leur contexte dans la phrase (contexte phrastique).</li>
<li><u>la sémantique des textes</u> : Que veut dire tel texte? On cherche à comprendre le sens au niveau des textes en eu mêmes.</li>
<li><u>la sémantique de corpus</u> : Que veut dire tel corpus de textes? Le but est de comprendre le sens au niveau du corpus de textes.</li>
</ul>
<p><u>Et quel est l&#8217;éclairage de la sémantique de corpus pour les sentiments?</u><br />
Revenons à l&#8217;exposé présenté lors du workshop. L&#8217;accent a été mis sur l&#8217;apport de la sémantique de corpus par rapport à la problématique de subjectivité des sentiments exprimés par un mot.<br />
La question que l&#8217;on est alors amenée à se poser est est ce que <u>le corpus</u> joue un rôle sur <u>les sentiments</u> exprimés par un mot et sur <u>la subjectivité</u> de la perception de ce sentiment. </p>
<p>Prenons un exemple pour clarifier la chose. Si l&#8217;on prend le mot &#8216;toujours&#8217;, exprime t-il un sentiment? La plupart des personnes diront certainement non car <u>la sémantique du mot</u> &#8216;toujours&#8217; <b>ne lui prête guère un sens exprimant un sentiment</b>. Si l&#8217;on prend maintenant ce mot dans le contexte d&#8217;une phrase (contexte phrastique) tel que celui de la phrase &#8220;je suis toujours dépendant des drogues&#8221;, <u>plus de personnes</u> lui prêteront <b>un sentiment négatif</b> de par le contexte de la phrase dans lequel il est exprimé. Enfin, si l&#8217;on prend un corpus de textes exclusivement consacré aux addictions, où le mot toujours n&#8217;apparaît que pour désigner <i>&#8220;une dépendance de longue durée&#8221;</i>, <u>beaucoup de personnes</u> lui prêteront dans ce cas un <b>sentiment négatif</b>.</p>
<p>Cette réflexion laisse à penser que les sentiments exprimés (ou ressentis exprimés) par les mots ne sont pas dépendant tant du mot lui même que du contexte dans lequel nous le percevons. C&#8217;est là <u>l&#8217;éclairage de la sémantique de corpus</u>&#8230;</p>
<h2>Et après?</h2>
<p>Dans un article ultérieur, nous nous intéresserons à d&#8217;autres exposés tel que ceux consacrés aux <a target="_blank" href="./tia-2011-lemon">LEMON (LExical Model for ONtologies)</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/tia-2011/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>GWC 2012 : Onyme présente un article sur l&#8217;enrichissement de connaissances spécifiques par des ressources généralistes</title>
		<link>http://blog.onyme.com/gwc-2012/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=gwc-2012</link>
		<comments>http://blog.onyme.com/gwc-2012/#comments</comments>
		<pubDate>Mon, 21 Nov 2011 08:54:46 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Conférences]]></category>
		<category><![CDATA[catalogue de produits]]></category>
		<category><![CDATA[connaissances spécifiques]]></category>
		<category><![CDATA[GWC]]></category>
		<category><![CDATA[GWC 2012]]></category>
		<category><![CDATA[linguistique]]></category>
		<category><![CDATA[ressources linguistiques]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[traitements de catalogues]]></category>
		<category><![CDATA[Wordnet]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=789</guid>
		<description><![CDATA[Après un article sur la fouille d'opinions, présenté l'année dernière à la conférence RECITAL à Montréal (Canada), je présente en début d'année prochaine, un second article scientifique (et premier en conférence internationale). Cet article est présenté dans le cadre de la conférence GWC, édition 2012 qui se déroulera à Matsue (Japon). Quelques détails en avant première...]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Après un article sur la <a href="http://blog.onyme.com/recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions/">fouille d&#8217;opinions</a>, présenté l&#8217;année dernière à la conférence RECITAL à Montréal (Canada), je présente en début d&#8217;année prochaine, un second article scientifique (et premier en conférence internationale). Cet article est présenté dans le cadre de la conférence GWC, édition 2012 qui se déroulera à Matsue (Japon). Quelques détails en avant première&#8230;</p>
<h2>L&#8217;auteur</h2>
<p><span style="text-decoration: underline;">Qui es tu?</span><br />
Benoît Trouvilliez. J&#8217;ai 25 ans et je suis en troisième année de doctorat en contrat Cifre avec la société Onyme et le <a href="http://www.cril.univ-artois.fr/" target="_blank">Centre de Recherche en Informatique de Lens (CRIL)</a>. Mon sujet de recherche et de thèse porte sur le traitement automatique des langues (TAL).</p>
<h2>L&#8217;article</h2>
<p>Dans ce cadre, j&#8217;ai réalisé des travaux sur l&#8217;enrichissement de connaissances spécifiques à un domaine particulier par des ressources généralistes.</p>
<p><span style="text-decoration: underline;">C&#8217;est quoi ton but?</span><br />
Le problème initial repose sur le besoin d&#8217;interroger un catalogue de produits (se présentant sous la forme d&#8217;une base de données) avec des requêtes en langage naturel afin de récupérer les enregistrements (donc les produits) correspondants à une demande précise.</p>
<p><span style="text-decoration: underline;">Un exemple?</span><br />
&#8220;Je veux un canapé en cuir de vachette noir&#8221; doit me renvoyer les enregistrements du catalogue correspondant à des &#8220;canapés&#8221; et possédant les deux caractéristiques d&#8217;être &#8220;noirs&#8221; et d&#8217;être en &#8220;cuir de vachette&#8221;.</p>
<p><span style="text-decoration: underline;">Mais où est ce que tu as vu un problème au juste?</span><br />
A première vue, il ne semble n&#8217;y avoir aucun problème. Il &#8220;suffit&#8221; d&#8217;identifier dans la requête le terme correspondant au type de produit (un canapé, une lampe, un lit,&#8230;) et les termes correspondant à des caractéristiques connues sur le produit (une couleur pour un canapé par exemple)&#8230;</p>
<p>Là où les choses se compliquent, c&#8217;est quand il n&#8217;y a plus de correspondances exactes entre les termes employés dans le catalogue et la demande exprimée. Imaginons à présent la demande &#8220;Je veux un drap de bain&#8221; et que le catalogue contient des &#8220;draps de lits&#8221; et des &#8220;serviettes&#8221;. La démarche donnée précédemment va renvoyer les enregistrements correspondants aux &#8220;draps de lits&#8221; à cause de la présence de &#8220;draps&#8221; alors que l&#8217;on veut des &#8220;serviettes&#8221;. Pas top au final cette solution&#8230;</p>
<p><span style="text-decoration: underline;">Et elle consiste en quoi ta solution?</span><br />
L&#8217;enrichissement des catalogues par des ressources généralistes permet de résoudre ce problème en acquérant la connaissance que les draps de bain sont des serviettes et que c&#8217;est donc ce type de produit qui est ici demandé. Dans cet article, je présente une solution s&#8217;appuyant sur des ressources linguistiques généralistes, appelées &#8220;wordnets&#8221;, développées pour plus de 70 langues à travers le monde et listées par la <a href="http://www.globalwordnet.org/" target="_blank">Global Wordnet Association (GWA)</a>. Cela me permet de rendre ma solution exploitable dans de nombreuses langues même si son application première est sur le français.</p>
<h2>La conférence</h2>
<p><span style="text-decoration: underline;">C&#8217;est à quelle conférence qu&#8217;on peut voir cela?</span><br />
La conférence <a href="http://lang.cs.tut.ac.jp/gwc2012/" target="_blank">GWC, édition 2012</a>, qui se déroulera à Matsue au Japon. Elle se tiendra du 9 au 13 janvier 2012. Les inscriptions sont déjà ouvertes!!!</p>
<p><span style="text-decoration: underline;">Jamais entendu parler de cette conférence. De quoi s&#8217;agit il?</span><br />
GWC (Global Wordnet Conference) est une conférence internationale qui a lieu tous les deux ans et qui a pour thème les &#8220;wordnets&#8221; et les travaux qui peuvent être réalisés avec ou sur eux. La conférence est d&#8217;ailleurs soutenue par la GWA (Global Wordnet Association). L&#8217;édition 2012 est la 6ème édition de cette conférence.</p>
<p><u><strong>Edit</strong></u> :<br />
Le programme de la conférence est maintenant disponible sur <a target="_blank" href=http://lang.cs.tut.ac.jp/gwc2012/program/>le site web</a>. Je présente mon article le vendredi 13 à partir de 9h30.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/gwc-2012/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>TALN / Recital / DEFT 2010 : Quand le TAL s&#8217;invite à Montréal</title>
		<link>http://blog.onyme.com/taln-recital-deft-2010-quand-le-tal-sinvite-a-montreal/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=taln-recital-deft-2010-quand-le-tal-sinvite-a-montreal</link>
		<comments>http://blog.onyme.com/taln-recital-deft-2010-quand-le-tal-sinvite-a-montreal/#comments</comments>
		<pubDate>Thu, 26 Aug 2010 06:46:32 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Conférences]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[conférence Recital]]></category>
		<category><![CDATA[DEFT]]></category>
		<category><![CDATA[RECITAL]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=451</guid>
		<description><![CDATA[Les conférences TALN, RECITAL et DEFT, éditions 2010, ont eu lieu à Montréal au Canada du 19 au 23 Juillet 2010. Petit compte rendu de cette expérience enrichissante.]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Les conférences TALN, RECITAL et DEFT, éditions 2010, ont eu lieu à Montréal au Canada du 19 au 23 Juillet 2010. J&#8217;ai eu la chance d&#8217;y assister et d&#8217;y présenter mon <a href="http://blog.onyme.com/recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions/">article sur la fouille d’opinions</a>. Je vous propose un petit compte-rendu de ces 5 jours riches en contenu.</p>
<h2>Déroulement des conférences</h2>
<p>Les trois conférences se sont déroulées en deux temps principaux :</p>
<ul>
<li>Du 19 au 22, les journées ont été consacrées aux conférences <a target="_blank" href="http://www.groupes.polymtl.ca/taln2010/">TALN</a> et <a target="_blank" href="http://www.groupes.polymtl.ca/taln2010/recital.php">Recital</a> dont les différentes présentations étaient mélangées. Souvent, les présentations Recital étaient soit placées en début de séance, soit en fin. Chaque séance durait en moyenne deux heures avec une pause entre chacune.</li>
<li>La journée du 23 fut consacrée à la conférence <a target="_blank" href="http://www.groupes.polymtl.ca/taln2010/deft.php">DEFT</a> seule. La tâche &#8220;Défi Fouille de Texte&#8221; de cette année était consacrée à l&#8217;annotation de textes issus de journaux. Ces annotations étaient temporelles (décennie de publication de l&#8217;article) et géographiques (pays de publication et nom du journal).</li>
</ul>
<h2>Les thèmes abordés</h2>
<p>Beaucoup de thèmes différents du TAL ont été abordés. Parmi ceux qui ont le plus de succès (et qui m&#8217;ont le plus intéressés) :</p>
<ul>
<li>La fouille d&#8217;opinions</li>
<li>La correction automatique (orthographique et syntaxique)</li>
<li>Analyse morpho-syntaxique et syntaxique</li>
<li>Traduction automatique et résumés de textes</li>
<li>Extraction de textes (entitées nommées, indices temporelles, détermination de l&#8217;auteur)</li>
<li>Intéraction entre le TAL et le TIL</li>
</ul>
<h2>Quelques présentations&#8230;.</h2>
<p>Parmi les présentations qui nous ont été faites, quelques unes m&#8217;ont plus intéressées que les autres, en partie par leur adéquation avec mon sujet de recherche. Je vais donc ici vous présenter brièvement ces articles ainsi que les points qui ont retenu mon attention et vous invite à les lire pour avoir plus de précisions.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_14.pdf">Adaptation d&#8217;un Système de Traduction Automatique Statistique avec des Ressources monolingues</a></h3>
<p><strong>Auteur : Holger Schwenk</strong></p>
<p>Cette présentation concernait la traduction automatique statistique. Dans ce domaine, le plus important est de disposer de corpus de textes dans la langue en question qui soient suffisamment conséquents. Pour y parvenir, l&#8217;auteur a utilisé un site internet spécialisé dans la capitalisation de données linguistiques : le <a target="_blank" href="http://www.ldc.upenn.edu/">Linguistic Data Consortium (LDC)</a> qui capitalise des données linguistiques dans de multiples langues dont le français.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_87.pdf">Exploitation d&#8217;une ressource lexicale pour la construction d&#8217;un étiqueteur morphosyntaxique état-de-l&#8217;art du français</a></h3>
<p><strong>Auteurs : Pascal Denis et Benoit Sagot</strong></p>
<p>Développé par la même équipe en charge des projets <a href="http://blog.onyme.com/etude-de-lontologie-wordnet-libre-du-francais-wolf/">WOLF</a> et <a href="http://blog.onyme.com/lemmatisation-et-racinisation-en-francais-flexion-lemme-et-racine-dun-mot/">LEFFF</a> (l&#8217;équipe <a target="_blank" href="http://alpage.inria.fr/index.fr.html">ALPAGE</a>), le MElt Tagger est un étiqueteur morpho-syntaxique qui se veut concurrent de <a href="http://blog.onyme.com/lemmatisation-et-racinisation-en-francais-flexion-lemme-et-racine-dun-mot/">TreeTagger</a> mais en libre. D&#8217;après leur papier, ils sont au moins aussi bon que TreeTagger et même meilleur dans certains cas (les mots inconnus dans le lexique semblent mieux traités par MElt que par TreeTagger (91% de réussite pour MElt contre 75% pour TreeTagger)). Le formalisme utilisé par MElt pour effectuer le POS Tagging a par ailleurs été retenu pour le modèle pré-entrainé français (fremalt) de l&#8217;analyseur syntaxique <a target="_blank" href="http://maltparser.org/">Malt Parser</a> (Attention à ne pas confondre Malt et MElt).</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_23.pdf">Une approche hybride traduction/correction pour la normalisation des SMS</a></h3>
<p><strong>Auteurs : Richard Beaufort, Sophie Roekhaut, Louise-Amélie Cougnon et Cédrick Fairon</strong></p>
<p>Présentation intéressante montrant une méthode pour redresser un texte écrit en langage SMS au moyen d&#8217;un algorithme d&#8217;apprentissage. Cette algorithme procède lors de sa phase d&#8217;apprentissage par alignement entre un texte écrit en langage SMS et son homologue écrit dans un français tout à fait correct. Cette approche par apprentissage pour effectuer de la correction orthographique est assez intéressante mais elle nécessite de disposer d&#8217;un corpus d&#8217;alignement assez important pour avoir un modèle robuste en sortie de la phase d&#8217;apprentissage.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_32.pdf">Recueil et analyse d&#8217;un corpus écologique de corrections orthographiques extrait des révisions de Wikipédia</a></h3>
<p><strong>Auteurs : Guillaume Wisniewski, Aurélien Max et François Yvon</strong></p>
<p>Présentation de l&#8217;élaboration d&#8217;un corpus de fautes d&#8217;orthographes / corrections élaboré à partir des révisions de Wikipédia. La démarche de création est assez simple : on doit dans un premier temps distinguer ce que l&#8217;on appelle les révisions mineures et les révisions majeures faites sur wikipédia. On pose alors le prédicat qu&#8217;une révision mineure est souvent associée à la correction d&#8217;une erreur d&#8217;orthographe dans le texte. Afin de valider ces considérations, l&#8217;étude a consisté à vérifier que les termes écrits dans la révision de départ étaient inconnus tandis que leurs homologues dans la révisions d&#8217;arrivée étaient connus.<br />
Ce qui est assez intéressant, c&#8217;est que ce travail a donné lieu à la réalisation d&#8217;un corpus de corrections orthographiques disponible gratuitement : le <a target="_blank" href="http://wicopaco.limsi.fr/">Wicopaco</a>. Il est toutefois à noter que ce corpus a été extrait de manière automatique et n&#8217;a pas fait l&#8217;objet d&#8217;une validation manuelle. Il est donc nécessaire de prévoir des imperfections dont les auteurs citent par exemple les spams.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_106.pdf">Catégorisation automatique d&#8217;adjectifs d&#8217;opinion à partir d&#8217;une ressource linguistique générique</a></h3>
<p><strong>Auteur : Baptiste Chardon</strong></p>
<p>Présentation d&#8217;un travail sur l&#8217;extraction d&#8217;adjectifs d&#8217;opinions à partir de textes de critiques de restaurants. Dans ces textes, les auteurs expriment leurs opinions à l&#8217;aide d&#8217;adjectifs qualifiant le restaurant. On cherche alors à identifier d&#8217;une part la polarité du texte, c&#8217;est à dire à déterminer si son auteur est favorable ou non au restaurant qu&#8217;il évoque, et à identifier d&#8217;autre part, les adjectifs qui expriment cette opinion. Cela est réalisé manuellement par des annotateurs sur un corpus d&#8217;entraînement. Leur travail est ensuite mis en commun afin d&#8217;extraire les points d&#8217;accord qui serviront de données à l&#8217;algorithme d&#8217;apprentissage. Celui-ci va alors, pour chaque terme étiqueté, attribuer une polarité d&#8217;opinion en fonction du marquage de ce terme par les annotateurs. Une étude est ensuite menée pour mesurer la généricité de la ressource obtenue.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_45.pdf">Comment formule-t-on une réponse en langue naturelle ?</a></h3>
<p><strong>Auteurs : Anne Garcia-fernandez, Sophie Rosset et Anne Vilnat</strong></p>
<p>Une présentation sur la génération de langue naturelle dans le cadre d&#8217;un système de questions réponses. L&#8217;article nous présente la notion d&#8217;élément information-réponse et étudie sa position dans un texte généré en langue naturelle.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_5.pdf">La table ronde : Du TAL au TIL</a></h3>
<p><strong>Animée par : Guy Lapalme, Michael Zock, Éric Brunelle et Christian Boitet</strong></p>
<p>Ce débat a permis d&#8217;introduire la notion de TIL et sa place dans la communauté du TAL. TIL est un acronyme pour &#8220;Traitement Intéractif de la Langue&#8221;. Contrairement à l&#8217;automatique, l&#8217;interactif privilégie le contact entre l&#8217;humain et la machine. Le but final étant de permettre à la machine d&#8217;apprendre grâce à ces échanges. Bien sûr, tout bon système &#8220;intelligent&#8221; doit permettre à l&#8217;utilisateur d&#8217;ignorer les requêtes de la machine et doit donc permettre aux algorithmes déployés de fonctionner aussi bien en disposant de beaucoup d&#8217;informations en provenance de l&#8217;utilisateur qu&#8217;avec très peu d&#8217;informations.<br />
En cela, les systèmes de TAL et de TIL sont complémentaires : le TIL permet d&#8217;offrir la possibilité au traitement assisté par ordinateur de bénéficier de l&#8217;apport de l&#8217;interaction homme / machine tandis que le TAL apporte au système sa capacité à s&#8217;adapter au manque d&#8217;informations dans le cadre d&#8217;un refus d&#8217;interaction tout en étant capable de garantir le meilleur résultat possible dans ces conditions.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_51.pdf">Réécriture de graphes de dépendances pour l&#8217;interface syntaxe-sémantique</a></h3>
<p><strong>Auteurs : Guillaume Bonfante, Bruno Guillaume, Mathieu Morey et Guy Perrier</strong></p>
<p>Cette présentation concernait le passage de textes écrit en langage naturelle vers une représentation formelle et logique de la sémantique de ces derniers. Pour cela, les auteurs nous proposent de passer par une analyse syntaxique puis sémantique pour obtenir au final une représentation logique de la sémantique.</p>
<h3><a target="_blank" href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_109.pdf">Représentation vectorielle de textes courts d&#8217;opinions. Analyse de traitements sémantiques pour la fouille d&#8217;opinions par clustering</a></h3>
<p><strong>Auteur : Benoît Trouvilliez (moi <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  )</strong></p>
<p>Il s&#8217;agit de l&#8217;article que j&#8217;ai présenté lors de cette conférence. Il traite de mes travaux sur la fouille d&#8217;opinions par clustering. J&#8217;y présente différents traitements sémantiques visant à construire une représentation sémantique de la phrase exprimée afin d&#8217;en extraire les idées dégagées. Ce travail s&#8217;inscrit dans le cadre de l&#8217;application <a target="_blank" href="http://www.onyme.com/opinions.php">Onyme Opinions</a> développée par la société.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/taln-recital-deft-2010-quand-le-tal-sinvite-a-montreal/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Recital 2010 : Onyme présente un article sur la fouille d&#8217;opinions</title>
		<link>http://blog.onyme.com/recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions</link>
		<comments>http://blog.onyme.com/recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions/#comments</comments>
		<pubDate>Tue, 15 Jun 2010 08:12:41 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[Conférences]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[Analyse de traitements sémantiques]]></category>
		<category><![CDATA[ATALA]]></category>
		<category><![CDATA[conférence Recital]]></category>
		<category><![CDATA[Fouille d'opinions par clustering]]></category>
		<category><![CDATA[onyme]]></category>
		<category><![CDATA[poster conférence Recital]]></category>
		<category><![CDATA[poster Recital 2010]]></category>
		<category><![CDATA[Recital 2010]]></category>
		<category><![CDATA[Représentation vectorielle de textes]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=291</guid>
		<description><![CDATA[Cet article inaugure la catégorie "Conférences" du blog par la présentation de la conférence Recital 2010 à laquelle la société va participer à travers mon article "Représentation vectorielle de textes courts d'Opinions. Analyse de traitements sémantiques pour la fouille d'opinions par clustering" accepté au format poster.]]></description>
				<content:encoded><![CDATA[<h3>Introduction</h3>
<p>Cet article inaugure la catégorie &#8220;Conférences&#8221; du blog par la présentation de la conférence Recital 2010 à laquelle la société va participer à travers mon article &#8220;Représentation vectorielle de textes courts d&#8217;Opinions. Analyse de traitements sémantiques pour la fouille d&#8217;opinions par clustering&#8221; accepté au format poster.</p>
<h3>Présentation de l&#8217;auteur et de l&#8217;article</h3>
<h4>Présentation de l&#8217;auteur</h4>
<p>Avant de vous parler de la conférence, je vais d&#8217;abord vous parler de l&#8217;auteur (donc de moi) et de mon article. </p>
<p>Je m&#8217;appelle Benoît Trouvilliez, j&#8217;ai 23 ans et je suis en première année de doctorat en contrat Cifre avec la société Onyme et le <a href="http://www.cril.univ-artois.fr/">Centre de Recherche en Informatique de Lens (CRIL)</a>. Mon sujet de recherche et de thèse porte sur le traitement automatique des langues (TAL) et plus précisément sur l&#8217;analyse et l&#8217;amélioration du <a href="http://www.onyme-opinions.com/Analyse-semantique">moteur d&#8217;analyse sémantique d&#8217;Onyme par clustering</a>. </p>
<p>Si vous désirez plus d&#8217;informations sur ce qu&#8217;est l&#8217;analyse sémantique, le traitement automatique des langues ou le clustering, vous pouvez vous rendre sur <a href="http://blog.onyme.com/traitement-automatique-des-langues-tal-intelligence-artificielle-ia-analyse-semantique-et-clusterings/">ce billet du blog</a> que j&#8217;ai rédigé précédemment. </p>
<p>Dans ce cadre, j&#8217;ai été amené à rédiger un article scientifique concernant mes travaux que j&#8217;ai soumis à la conférence Recital 2010 qui l&#8217;a accepté sous un format poster.</p>
<h4>Présentation de l&#8217;article</h4>
<p>Mon article a pour titre &#8220;Représentation vectorielle de textes courts d&#8217;Opinions. Analyse de traitements sémantiques pour la fouille d&#8217;opinions par clustering&#8221;. Il porte sur la représentation de textes courts d&#8217;opinions sur des sujets variés comme les valeurs d&#8217;une entreprise, les prestations d&#8217;un commerçant ou la pertinence d&#8217;un site internet. L&#8217;étude a été réalisée principalement dans le contexte de la <a href="http://www.onyme-opinions.com/Accueil">solution d&#8217;analyse d&#8217;Opinions et de la satisfaction client d&#8217;Onyme</a>. </p>
<p>Un court résumé de cet article est déjà disponible sur <a href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/recital-accepte.html">le site de la conférence Recital 2010</a> dans la liste des articles acceptés en tant que poster. La publication complète de l&#8217;article sera faite sur ce même site peu après la conférence.</p>
<p><u>Edit</u> : Mon article est à présent consultable via ce <a href="http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_109.pdf">lien direct</a>.</p>
<p>Lors de la conférence, mon article sera présenté sous la forme d&#8217;un poster. Un créneau horaire est habituellement réservé durant la conférence pour permettre les échanges entre les visiteurs et les auteurs de posters.</p>
<h3>Présentation de la conférence</h3>
<p>La conférence Recital (<a href="http://www.groupes.polymtl.ca/taln2010/recital.php">Lien vers l&#8217;édition 2010</a>) (Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues) est comme son nom complet l&#8217;indique une conférence qui s&#8217;adresse aux étudiants chercheurs dans le domaine du TAL. Elle est donc l&#8217;occasion d&#8217;échanges et de publications pour les doctorants et les jeunes chercheurs (ayant obtenus leur doctorat depuis moins d&#8217;un an) dans ce domaine. Elle est organisée tous les ans dans un pays francophone sous l&#8217;égide de l&#8217;<a href="http://www.atala.org/">ATALA (Association pour le Traitement Automatique des LAngues)</a> conjointement avec la conférence TALN (Traitement Automatique des Langues Naturelles) (<a href="http://www.groupes.polymtl.ca/taln2010/">Lien vers l&#8217;édition 2010</a>) qui s&#8217;adresse principalement aux chercheurs expérimentés. </p>
<p>L&#8217;ensemble des liens vers les éditions précédentes des deux conférences sont disponibles sur le <a href="http://www.atala.org/-Conference-TALN-RECITAL-">site de l&#8217;ATALA</a>.</p>
<h3>L&#8217;édition 2010 de TALN et Recital</h3>
<p>L&#8217;édition 2010 des deux conférences aura lieu à Montréal au Canada du 19 au 22 Juillet 2010. Les inscriptions se font via le site officiel d&#8217;une de ces deux conférences ou via ce <a href="http://www.groupes.polymtl.ca/taln2010/Registration/index.php">lien direct</a>. Les deux conférences étant jumelées, l&#8217;inscription s&#8217;effectue pour les deux en même temps. </p>
<p>Si vous êtes au Canada du côté de Montréal cet été, n&#8217;hésitez donc pas à vous inscrire et à venir me rencontrer durant cette conférence.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
	</channel>
</rss>
