<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog Onyme</title>
	<atom:link href="http://blog.onyme.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.onyme.com</link>
	<description>Analyse sémantique et Traitement Automatisé de la Langue</description>
	<lastBuildDate>Mon, 14 Mar 2016 23:26:30 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>Développeur Java (H/F) qui n&#8217;en veut &#8211; poste pourvu</title>
		<link>http://blog.onyme.com/developpeur-java-hf-qui-nen-veut-2/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=developpeur-java-hf-qui-nen-veut-2</link>
		<comments>http://blog.onyme.com/developpeur-java-hf-qui-nen-veut-2/#comments</comments>
		<pubDate>Thu, 22 Jan 2015 19:23:27 +0000</pubDate>
		<dc:creator>Thibaud VIBES</dc:creator>
				<category><![CDATA[Recrutement]]></category>
		<category><![CDATA[cdi]]></category>
		<category><![CDATA[Développeur]]></category>
		<category><![CDATA[euratechnologies]]></category>
		<category><![CDATA[java]]></category>
		<category><![CDATA[job]]></category>
		<category><![CDATA[lille]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=3157</guid>
		<description><![CDATA[Tu aime écrire du code et tu voudrais pouvoir en vivre le plus longtemps possible ? Tu attaches un soin particulier à choisir tes outils de développements ? Tes relations ne comprennent pas pourquoi tu vas à des conférences le soir en dehors de tes horaires de travail ? Tu n'es plus seul(e) ! Viens nous rejoindre ...]]></description>
				<content:encoded><![CDATA[<p><em><strong>&#8211; edit &#8211;</strong></em></p>
<p><span style="font-size: 2em;width: 100%;text-align: center;float: left">Poste pourvu</span></p>
<p><em><strong>&#8211; /edit &#8211;</strong></em></p>
<p>Tu aimes <strong>écrire du code</strong> et tu voudrais pouvoir en vivre le plus longtemps possible ? Tu attaches un soin particulier <strong>à choisir</strong> tes outils de développements ? Tes relations ne comprennent pas pourquoi tu vas à des <strong>conférences</strong> le soir en dehors de tes horaires de travail ? Tu n&#8217;es plus seul(e) ! Viens nous rejoindre &#8230;</p>
<p>&nbsp;</p>
<h2>Qui sommes-nous?</h2>
<p>Je m&#8217;appelle Thibaud, je suis le directeur technique de la société Onyme et développeur Java passionné. J&#8217;en suis également le co-gérant depuis 2007. Avec mes 11 collègues nous éditons <strong>Onyme Opinions</strong> une solution SaaS de mesure et de suivi de l&#8217;expérience client.</p>
<p>Oui nous sommes un <strong>éditeur de logiciel</strong>.</p>
<p>Nous sommes basés à <strong>Euratechnologies</strong>, Lille, et plutôt fiers de nos récents locaux (Septembre 2014).</p>
<table style="width: 100%">
<tbody>
<tr>
<td style="width: 50%"><a href="http://blog.onyme.com/wp-content/uploads/2014/12/B5i1LtNCQAAO7iZ.jpg"><img class="aligncenter size-full wp-image-3146" alt="B5i1LtNCQAAO7iZ" src="http://blog.onyme.com/wp-content/uploads/2014/12/B5i1LtNCQAAO7iZ.jpg" width="300" height="169" /></a><br />
<span style="width: 100%;float: left;text-align: center">Espace présentations-BBL</span></td>
<td style="width: 50%"><a href="http://blog.onyme.com/wp-content/uploads/2015/01/20150122_195322-enlightened.jpg"><img class="aligncenter size-full wp-image-3160" alt="Espace détente" src="http://blog.onyme.com/wp-content/uploads/2015/01/20150122_195322-enlightened.jpg" width="300" height="169" /></a><br />
<span style="width: 100%;float: left;text-align: center">Espace détente</span></td>
</tr>
<tr>
<td style="text-align: center"><a href="http://blog.onyme.com/wp-content/uploads/2015/01/20150122_195406-resized.jpg"><img class="aligncenter size-full wp-image-3159" alt="20150122_195406-resized" src="http://blog.onyme.com/wp-content/uploads/2015/01/20150122_195406-resized.jpg" width="300" height="169" /></a><br />
<span style="width: 100%;float: left;text-align: center">(future) salle de réunion. Cloisons à venir prochainement.</span></td>
<td style="text-align: center"><span style="width: 100%;float: left;text-align: center"><a href="http://blog.onyme.com/wp-content/uploads/2015/01/20150127_131901.jpg"><img class="aligncenter size-full wp-image-3194" alt="20150127_131901" src="http://blog.onyme.com/wp-content/uploads/2015/01/20150127_131901.jpg" width="300" height="185" /></a>Bureaux<br />
avec Antoine (au fond) qui discute avec le développeur invisible</span></td>
</tr>
<tr>
<td style="text-align: center" colspan="2"><a href="https://placekitten.com/408/287"><br />
<img class="aligncenter size-full" alt="chaton" src="https://placekitten.com/408/287" width="408" height="287" /><br />
</a><br />
<span style="width: 100%;float: left;text-align: center">Chaton. (Ils ont pris le contrôle d&#8217;Internet, j&#8217;étais obligé) &#8211; source <a href="https://placekitten.com/">{placekittens}</a></span></td>
</tr>
</tbody>
</table>
<p><strong>L&#8217;équipe technique</strong> se compose aujourd&#8217;hui de :</p>
<ul>
<li>4 développeurs Java dont moi-même</li>
<li>Un ingénieur – docteur en informatique</li>
<li>Un ingénieur R&amp;D en traitement automatique du langage naturel</li>
</ul>
<p>&nbsp;</p>
<h2>Que faisons nous ?</h2>
<p>Que <strong>vendons</strong> nous devrais-je dire. Comme toutes les entreprises du coin, une solution miracle et innovante. Toutefois, je m&#8217;en vais te dévoiler quand même notre recette :</p>
<ul>
<li>Prends une bonne dose d’ingénierie logicielle. N&#8217;hésites pas sur les produits qui ont fait leur preuves: Java EE 6+ et PostgreSQL.</li>
<li>Ajoutes un soupçon de traitement automatique du langage: analyse sémantique, traitements morphologiques et classification automatique.</li>
<li>Verses un zest de Responsive Design à base de Javascript et CSS 3.</li>
</ul>
<p>Et il ne te reste plus qu&#8217;à saupoudrer d&#8217;intelligence et de simplicité* pour obtenir Onyme Opinions, un cocktail unique pour la mesure, le suivi et l&#8217;analyse de l&#8217;<strong>expérience client</strong> en <span style="text-decoration: underline">continu</span>.</p>
<p><em><a href="http://blog.onyme.com/wp-content/uploads/2015/01/cocktail-tom-cruise.jpg"><img class="aligncenter size-full wp-image-3168" alt="cocktail-tom-cruise" src="http://blog.onyme.com/wp-content/uploads/2015/01/cocktail-tom-cruise.jpg" width="300" height="260" /></a>*J&#8217;ai oublié la <strong>modestie</strong> chez moi ce matin. Quand je m&#8217;en suis rendu compte j&#8217;étais déjà presque arrivé au bureau.</em></p>
<p>&nbsp;</p>
<h2>Quelles sont nos valeurs ?</h2>
<p>Nos valeurs sont <strong>Service</strong>, <strong>Agilité</strong> et <strong>Solution</strong>. Elles reflètent l&#8217;histoire de la société (qui vient de fêter ses 11 ans, NDLR).</p>
<p><b>Service (nom, masculin) : </b>capacité à se rendre disponible pour le client, à être réactif, à s’investir dans la relation avec lui, à lui proposer une qualité de service. Élément indispensable pour inscrire notre relation (et notre facturation) dans la durée.</p>
<p><b>Agilité (nom, féminin) : </b>Capacité à faire évoluer les idées, voire à les <span style="text-decoration: underline">abandonner</span> s’il s’avère qu’elles n’aboutiront à rien, sans y mettre trop d’affect. L&#8217;agilité est associée à un mouvement perpétuel se traduisant par de la réadaptation et du repositionnement. Nécessite un goût prononcé pour la prise de risque et le challenge.</p>
<p><b>Solution (nom, féminin) : </b>Capacité à apporter une réponse pertinente au besoin du client. Peut s&#8217;apparenter à la quête du Graal. Élément constitutif de la force d&#8217;un développeur Jedi.</p>
<p>&nbsp;</p>
<h2>Quelle(s) mission(s) ?</h2>
<p>C&#8217;est une bonne question! Avec la croissance actuelle de la société nous avons besoin de renforts à tous les niveaux. Donc plutôt que de faire le choix à ta place, nous te laissons prendre la place de ton choix :</p>
<ul>
<li>Les problématiques de modélisation, traitement et stockage de l&#8217;information te passionne ?</li>
<li>Tu es un(e) touche à tout et mettre les mains dans du Javascript qui pique* où dans les problèmes de performance de la base de données ne te fais pas peur ?</li>
<li>Attiré(e) par la Recherche &amp; Développement parce que tu veux imaginer nos fonctionnalités et produits de demain ?</li>
<li>Tu trouves la satisfaction dans la réalisation d&#8217;interfaces utilisateurs léchées et ergonomiques ?</li>
<li><em>&#8230; (liste non exhaustive)</em></li>
</ul>
<p>Présentes nous tes domaines de prédilections, nous avons sûrement des challenges à ta hauteur.</p>
<p><em>*Ceci n&#8217;est pas un troll, le javascript ça ne pique pas toujours.</em></p>
<p>&nbsp;</p>
<h2>Concrètement, les conditions ?</h2>
<ul>
<li><strong>CDI</strong> basé à <strong>Lille</strong>,</li>
<li><strong>Expérience significative</strong>,</li>
<li>Rémunération à partir de <strong>36K </strong>(négociable selon le profil et l’expérience), tickets restaurant, prime d’intéressement (toujours versée depuis sa mise en place), mutuelle.</li>
<li>Démarrage: <strong>dès que possible</strong>.</li>
</ul>
<p>Nous fournissons :</p>
<ul>
<li>La machine de ton choix, avec l&#8217;OS de ton choix dessus (même Windows). Après, c&#8217;est à toi de défendre ces choix lors de nos séances de <em>pair-programming</em>.</li>
<li>L&#8217;IDE de ton choix. Dans l&#8217;équipe nous avons actuellement 4 Eclipse, 1 Netbeans et 1 IntelliJ IDEA. Idem ci-dessus.</li>
<li>1 ou 2 écrans</li>
<li>chaise avec accoudoirs, réglable en hauteur, dossier inclinable et appuie tête rembourré.</li>
<li>Place de parking si tu habites &#8220;hors métropole&#8221;.</li>
<li>Thé et café (et gibolin) à volonté.</li>
</ul>
<p><span style="text-decoration:line-through">Pour postuler: <a href="mailto:recrute@onyme.com">recrute@onyme.com</a></span><br />
<em><strong>&#8211; edit &#8211;</strong></em></p>
<p><span style="font-size: 2em;width: 100%;text-align: center;float: left">Poste pourvu</span></p>
<p><em><strong>&#8211; /edit &#8211;</strong></em></p>
<p>Si tu as des questions, tu peux toujours les poser ici, pas de tabous pour nous ou si tu n&#8217;oses pas, sur Twitter en DM ou par mail.</p>
<p><a href="http://blog.onyme.com/wp-content/uploads/2015/01/Deschiens059.jpg"><img class="aligncenter size-full wp-image-3188" alt="Deschiens059" src="http://blog.onyme.com/wp-content/uploads/2015/01/Deschiens059.jpg" width="320" height="240" /></a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/developpeur-java-hf-qui-nen-veut-2/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Développeur(se) JavaEE, avec le sens du service &#8211; deprecated</title>
		<link>http://blog.onyme.com/developpeurse-javaee-avec-le-sens-du-service/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=developpeurse-javaee-avec-le-sens-du-service</link>
		<comments>http://blog.onyme.com/developpeurse-javaee-avec-le-sens-du-service/#comments</comments>
		<pubDate>Fri, 21 Nov 2014 18:14:54 +0000</pubDate>
		<dc:creator>Thibaud VIBES</dc:creator>
				<category><![CDATA[Recrutement]]></category>
		<category><![CDATA[cdi]]></category>
		<category><![CDATA[Développeur]]></category>
		<category><![CDATA[Développeuse]]></category>
		<category><![CDATA[java]]></category>
		<category><![CDATA[job]]></category>
		<category><![CDATA[lille]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=3100</guid>
		<description><![CDATA[Qu'est-ce qu'un développeur qui a le sens du service?]]></description>
				<content:encoded><![CDATA[<div style="font-size:2em">
<pre>
<span style='color:#3f5fbf'>/**</span>
<span style='color:#3f5fbf'>&#xa0;</span><span style='color:#7f9fbf;font-weight:bold'>*</span><span style='color:#3f5fbf'> </span><span style='color:#7f9fbf;font-weight:bold'>@deprecated</span><span style='color:#3f5fbf'> Cette offre n'est plus valable.</span>
<span style='color:#3f5fbf'>&#xa0;</span><span style='color:#7f9fbf;font-weight:bold'>*</span><span style='color:#3f5fbf'></span>
<span style='color:#3f5fbf'>&#xa0;</span><span style='color:#7f9fbf;font-weight:bold'>*</span><span style='color:#3f5fbf'>*/</span>
</pre>
</div>
<p>&nbsp;</p>
<h2>TL;DR</h2>
<ul>
<li><strong>CDI</strong> basé à <strong>Lille</strong>, parc Euratechnologies chez un éditeur de logiciel.</li>
<li>Développement sur plateforme <strong>JavaEE</strong>.</li>
<li>En <strong>relation</strong> avec nos <strong>clients</strong>. Expérience précédente sur des projets, où vous avez été en contact direct avec le client final.</li>
<li>Rémunération à partir de <strong>36K </strong>(négociable selon le profil et l&#8217;expérience), tickets restaurant, prime d&#8217;intéressement (toujours versée depuis sa mise en place), mutuelle.</li>
<li>Démarrage: <strong>dès que possible</strong>.</li>
</ul>
<h2>Long version</h2>
<p>Qu&#8217;est-ce qu&#8217;un(e) développeur(se) qui a le sens du service, me demanderez-vous ? Je vais y venir &#8230;<br />
Un peu de contexte d&#8217;abord.</p>
<h3>Onyme Opinions, une offre SaaS, une démarche</h3>
<p>Onyme est un éditeur de logiciel qui propose un outil de suivi et d&#8217;analyse en continu de la satisfaction client:<br />
<a title="Page Onyme Opinions" href="http://www.onyme.com/onyme-opinions.php" target="_blank">Onyme Opinions</a>.<br />
Nous envoyons des questionnaires de satisfaction après un contact entre un client final et une enseigne, les clients finaux répondent, nous proposons des tableaux de bord.</p>
<p><a href="http://blog.onyme.com/wp-content/uploads/2014/11/cercle-opinions.png"><img class="aligncenter size-full wp-image-3112" alt="cercle-opinions" src="http://blog.onyme.com/wp-content/uploads/2014/11/cercle-opinions.png" width="489" height="260" /></a></p>
<p>Notre différence: le traitement des réponses aux questions <strong>ouvertes</strong>.</p>
<p>Aujourd&#8217;hui, nos clients sont principalement dans le <em>retail</em> et le domaine bancaire.<br />
Onyme Opinions est vendu via un réseau de <strong>revendeurs</strong> et proposé en mode <strong>SaaS</strong>.</p>
<p>Notre objectif commun est de placer la satisfaction client au cœur des préoccupations de l&#8217;entreprise. L&#8217;offre logiciel s&#8217;accompagne d&#8217;une démarche de management des équipes de vente, pilotée essentiellement par nos revendeurs qualifiés.</p>
<h3>Les besoins des clients</h3>
<p>Nos interlocuteurs sont des responsables relation client, responsables CRM, responsables enquête, responsables fichier clients &#8230; bref des responsables ! En général ils sont au coeur de la mise en place et de l&#8217;animation de la démarche autour d&#8217;Onyme Opinions. Une fois la démarche appropriée, nos clients commencent à avoir des demandes, à sortir des sentiers battus. Quand nous en arrivons là, c&#8217;est bon signe (le client est satisfait) mais il faut bien gérer : soit nous <span style="color: #339966"><strong>enchantons</strong> <span style="color: #000000">notre client</span></span>, soit nous le <span style="color: #ff0000"><strong>décevons</strong></span>.</p>
<p>C&#8217;est vous qui recevrez une partie des demandes, soit directement, soit via les revendeurs.</p>
<p>Petit aperçu :</p>
<blockquote><p>- Est-ce que vous pouvez générer des critères de segmentation basés sur l&#8217;heure d&#8217;achat et l&#8217;âge du capitaine ?<br />
- Pas de problème, envoyez moi les règles de segmentation par email et n&#8217;oubliez pas de demander à votre SI d&#8217;ajouter l&#8217;âge du capitaine dans les flux quotidiens.</p></blockquote>
<blockquote><p>- Nous souhaiterions interroger nos clients XYZ suite à notre campagne marketing &#8220;We are trop GREEN&#8221;, pour la semaine prochaine, c&#8217;est bon pour vous ?<br />
- Aucun problème, transmettez nous les visuels, nous les intégrons et je vous envoie un questionnaire de test.</p></blockquote>
<blockquote><p>- Nous souhaiterions fédérer les identités, est-ce que votre outil peut utiliser notre annuaire LDAP ? ( &lt;- là ce n&#8217;est pas une demande de responsable marketing <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' />  )<br />
- Votre demande est intéressante, nous allons l&#8217;étudier et vous faire une réponse de principe prochainement.</p></blockquote>
<blockquote><p>- Nous souhaitons interroger nos clients par pigeon voyageur pour être multi-canal, est-ce que vous saurez intégrer les réponses dans Onyme Opinions ? Nous avons déjà un prestataire pour les pigeons.<br />
- Tout à fait, transmettez moi les coordonnées de votre prestataire, nous allons nous mettre en relation pour définir les flux.</p></blockquote>
<p><em>Et mais c&#8217;est un poste de chef de projet en fait ?</em><br />
Non pas du tout (désolé si c&#8217;est ce que vous recherchiez). Développeur(se), lisez la suite s&#8217;il vous plaît.</p>
<h3>Eat your own dog food</h3>
<p>Vous devrez accompagner le client dans la mise en place technique d&#8217;Onyme Opinions (setup, interfaces avec le SI client, extractions de données, mise en place d&#8217;infra dédiée&#8230;) en lien avec le revendeur.<br />
Dans l&#8217;idéal, Onyme Opinions couvre le besoin et vous l&#8217;utilisez pour répondre à la demande. Votre <strong>regard critique</strong> et votre excellente <strong>vision produit</strong> vous permettrons de proposer des améliorations à nos applications.<br />
Sinon vous codez la requête / le script / le module qui couvre le besoin et qui va <strong>enrichir</strong> notre offre.</p>
<p>Votre challenge est double :</p>
<ol>
<li>Faire monter Onyme en charge en <strong>industrialisant</strong> au mieux nos outils pour éviter les tâches répétitives.</li>
<li><strong>Enchanter</strong> nos clients en répondant à un éventail toujours plus large de demandes.</li>
</ol>
<p style="text-align: center"><a href="http://blog.onyme.com/wp-content/uploads/2014/11/Tourner-autour-du-pot-450x289.jpg"><img class="aligncenter  wp-image-3119" alt="Tourner-autour-du-pot-450x289" src="http://blog.onyme.com/wp-content/uploads/2014/11/Tourner-autour-du-pot-450x289.jpg" width="270" height="173" /></a></p>
<h3>Description du poste</h3>
<h4>Missions</h4>
<ul>
<li>Répondre au téléphone</li>
<li>Rédiger des emails d&#8217;explications pour nos clients</li>
<li>Participer à des réunions de lancement de projet chez le client</li>
<li>Développer, tester, <em>releaser, proder</em></li>
<li>Effectuer des présentations pour annoncer à nos revendeurs toutes les nouveautés sur Onyme Opinions en avant-première</li>
</ul>
<h4>Compétences techniques</h4>
<p>Développeur(se) JavaEE, vous maîtrisez l&#8217;ensemble des technologies suivantes :</p>
<ul>
<li>Java 6+</li>
<li>JavaEE 6, avec des expériences sur au moins une des spécifications suivantes: JPA 2.0, EJB 3.1, CDI 1.0 et JSF 2.1</li>
<li>JUnit (et tous ses copains en *Unit), Mockito, Arquillian</li>
<li>SQL. Une expérience avec PostgreSQL serait un gros plus.</li>
</ul>
<p>Vous avez déjà utilisé un ou plusieurs des outils suivants :</p>
<ul>
<li>un gestionnaire de version (CVS, SVN ou Git)</li>
<li>Jenkins</li>
<li>Sonar</li>
<li>Un IDE</li>
<li>Votre cerveau</li>
</ul>
<p>Vous avez une bonne connaissance des problématiques Ops: packaging, monitoring, logging, automatising (ça ne se dit pas ça ?)</p>
<p>Vous êtes à l&#8217;aise dans un environnement Linux, et encore plus sur des distributions Debian(-like).</p>
<h4>Savoir-être</h4>
<ul>
<li>Vous êtes <strong>pragmatique</strong>: vous pouvez vous adapter à toute situation et êtes orienté vers l&#8217;action pratique.</li>
<li>Le goût du challenge et une bonne confiance en vos capacités vous rendent <strong>réactif(ve).</strong></li>
<li>Consciencieux(se) et <strong>organisé(e)</strong>, vous pouvez répondre à plusieurs sollicitations en parallèle.</li>
</ul>
<h4>Équipe</h4>
<p>Vous intégrerez une équipe pluridisciplinaire composée de :</p>
<ul>
<li>2 développeurs JavaEE Web</li>
<li>Un lead developper Java</li>
<li>Un ingénieur &#8211; docteur en informatique</li>
<li>Un ingénieur R&amp;D en traitement automatique du langage naturel</li>
<li>Le Directeur, qui possède la vision marketing d&#8217;Onyme Opinions et qui aujourd&#8217;hui est la personne la plus en contact avec nos clients.</li>
<li>Moi même, directeur technique, développeur, mais a fortiori un homme avant tout.</li>
</ul>
<h2>Candidature ?</h2>
<p>A travers ce billet, j&#8217;espère que vous avez entre-aperçu une partie de ce qu&#8217;est Onyme. Si cela vous a plus, laissez-nous entre-apercevoir la personne que vous êtes en :<br />
envoyant votre candidature (LM + CV): <a href="mailto:recrute@onyme.com">recrute@onyme.com</a></p>
<p>Vous pouvez me contacter par Twitter si vous souhaitez plus d&#8217;informations.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/developpeurse-javaee-avec-le-sens-du-service/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>Onyme Labs : Dessine moi un canapé chocolat</title>
		<link>http://blog.onyme.com/onyme-labs-dessine-moi-un-canape-chocolat/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=onyme-labs-dessine-moi-un-canape-chocolat</link>
		<comments>http://blog.onyme.com/onyme-labs-dessine-moi-un-canape-chocolat/#comments</comments>
		<pubDate>Thu, 12 Jun 2014 09:01:42 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Onyme Labs]]></category>
		<category><![CDATA[colorimétrie]]></category>
		<category><![CDATA[espace de couleurs]]></category>
		<category><![CDATA[labs.onyme.com]]></category>
		<category><![CDATA[modèle de couleurs]]></category>
		<category><![CDATA[recherche de couleurs]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=2685</guid>
		<description><![CDATA[Onyme Labs, c'est le <b>site web d'Onyme</b> où vous pouvez trouver des applications intéressantes et très utiles ayant un attrait avec le Traitement Automatique des Langues (TAL) comme par exemple une application permettant de visualiser le WOrdnet Libre du Français (WOLF).

L'application d'aujourd'hui nous plonge dans l'univers passionnant des couleurs avec une histoire qui vous rappellera surement quelque chose...]]></description>
				<content:encoded><![CDATA[<p>Onyme Labs, c&#8217;est le <b>site web d&#8217;Onyme</b> où vous pouvez trouver des applications intéressantes et très utiles ayant un attrait avec le Traitement Automatique des Langues (TAL) comme par exemple <a target="_blank" href="http://blog.onyme.com/wordnet-libre-du-francais-1-0-beta-explorez-le-vous-meme/" />une application</a> permettant de visualiser le WOrdnet Libre du Français (WOLF).</p>
<p>L&#8217;application d&#8217;aujourd&#8217;hui nous plonge dans l&#8217;univers passionnant des couleurs avec une histoire qui vous rappellera surement quelque chose&#8230;</p>
<div style="height: 25px"></div>
<h4 style="color: #AA3D43">Dessine moi un canapé chocolat</h4>
<p>Un petit prince est venu me demander de lui dessiner un canapé <b>chocolat</b>. Si dessiner un canapé est a priori <s>facile</s> réalisable, je ne dispose malheureusement pas d&#8217;un crayon de couleur chocolat sur moi&#8230; Comment faire? Renoncer et laisser le petit prince à son désarroi?</p>
<div style="height: 25px"></div>
<h4 style="color: #AA3D43">Décrit moi ta couleur chocolat</h4>
<p>Afin de dessiner un canapé chocolat pour le petit prince (sans crayon chocolat), j&#8217;ai tout d&#8217;abord cherché à savoir ce qu&#8217;il voulait dire par &#8220;chocolat&#8221;.</p>
<div style="background-color:#EDD38C;color:#000000">ˮEt bien chocolat, comme une tablette de chocolat!!!ˮ</div>
<p>Mais oui bien sûr! Le petit prince a raison : nous nous accorderons assez facilement sur le fait que la couleur fait référence à l&#8217;objet physique qu&#8217;est le chocolat et surtout à la <b>perception visuelle</b> que l&#8217;on a de cet objet. Mais comment percevons-nous cette couleur? Nous la voyons comme une association de trois couleurs que sont le rouge, le vert et le bleu. Nous pouvons ainsi approximativement la décrire comme une couleur associant du rouge à 35%, du vert à 23% et du bleu à 13% (si si, je vous le jure).</p>
<p>Nous pouvons également exprimer cette information dans un ordinateur par un <b>triplet</b> de nombres compris entre 0 et 1, dénoté <b>code RVB</b> : <b>(0.353, 0.227, 0.133)</b>. </p>
<table>
<tr>
<td width="350px" height="20px" bgcolor="#5A3A22"></td>
</tr>
<tr>
<td align="center">couleur <b>chocolat</b> ; RVB:(0.353, 0.227, 0.133)</td>
</tr>
</table>
<p>D&#8217;accord mais cela ne parait quand même pas très naturel de parler d&#8217;une couleur comme une association de rouge, vert et bleu. Est-ce que l&#8217;on ne pourrait pas plutôt parler de sa luminosité, sa teinte,&#8230;? Cela est tout à fait pertinent et c&#8217;est ainsi que d&#8217;autres types de codes ont été mis au point à partir du code RVB. </p>
<ul>
<li>Teinte Saturation Luminosité (<b>TSL</b>)</li>
<li>Teinte Chroma Luminosité (<b>TCL</b>)</li>
</ul>
<p>Ces types de codes ne décrivent pas les couleurs comme une association de rouge, vert et bleu mais en fonction qu&#8217;on les perçoit comme lumineuses, saturées, teintées. Ce sont donc les <b>mêmes</b> couleurs qui sont <u>décrites</u> mais d&#8217;une manière différente.</p>
<p>En pratique, il est possible de passer mathématiquement d&#8217;un code RVB à un de ces 2 codes pour une couleur donnée en appliquant &#8220;simplement&#8221; quelques formules.</p>
<div style="background-color:#EDD38C;color:#000000">ˮEt cela donne quoi pour mon canapé chocolat?ˮ</div>
<p>Et bien cela donne :<br />
<b>RVB : (0.353, 0.227, 0.133)</b><br />
C = max(0.353,0.227,0.133) &#8211; min(0.353,0.227,0.133) = 0.353-0.133 = 0.22<br />
T = 60 * ((0.227-0.133)/0.22 + 6) mod6 = 25.636°<br />
L = (0.353+0.133)/2 = 0.243<br />
S = 0.22 / (1-|2*0.243-1|) = 0.22 / 0.486 = 0.453</p>
<p><b>TSL : (25.636, 0.453, 0.243)</b><br />
<b>TCL : (25.636, 0.22, 0.243)</b></p>
<div style="background-color:#EDD38C;color:#000000">ˮOula! Mais c&#8217;est compliqué ton histoire!ˮ</div>
<p>Ben oui mais il faut savoir si tu veux ton canapé chocolat ou pas&#8230;</p>
<div style="height: 25px"></div>
<h4 style="color: #AA3D43">Mesure moi une distance entre couleurs</h4>
<p>Je suis à présent capable de décrire précisément la couleur chocolat voulue par le petit prince et ceci dans 3 types de codage différents. On avance!!! Enfin, cela ne nous résout pas vraiment le problème puisque je <b>n&#8217;ai pas</b> cette couleur dans ma trousse de crayons de couleur&#8230;</p>
<p>Mais au fait, qu&#8217;ai-je comme couleurs dans ma trousse? J&#8217;ai du <b>marron</b> et du <b>noir</b> (oui je sais, il y a peu de couleurs dans ma trousse). Alors comment savoir avec quelle couleur je vais dessiner mon canapé chocolat? Ce n&#8217;est vraiment pas évident surtout que vous qui êtes derrière votre écran ne pouvez pas voir mes crayons de couleur&#8230;</p>
<div style="background-color:#EDD38C;color:#000000">ˮIl faudrait pouvoir leur décrire ces 2 couleurs&#8230;ˮ</div>
<p>Mais oui petit prince, la solution est là : utiliser les types de codage vus précédemment pour décrire les couleurs de ma trousse.</p>
<table align="center" cellpadding="10" border="2">
<tr>
<td></td>
<td align="center" width="130px"><b>Marron</b></td>
<td align="center" width="130px"><b>Noir</b></td>
</tr>
<tr>
<td><b>RVB</b></td>
<td>(0.345, 0.161, 0)</td>
<td>(0, 0, 0)</td>
</tr>
<tr>
<td><b>TSL</b></td>
<td>(28, 1, 0.173)</td>
<td>(0, 0, 0)</td>
</tr>
<tr>
<td><b>TCL</b></td>
<td>(28, 0.345, 0.173)</td>
<td>(0, 0, 0)</td>
</tr>
<tr>
<td><b>Échantillon</b></td>
<td bgcolor="#582900" />
<td bgcolor="#000000" /></tr>
<table>
<p>Parfait! Et maintenant comment pouvons-nous déterminer laquelle de ces 2 couleurs est la plus proche du chocolat? Le plus simple est de calculer une distance entre les couleurs grâce aux codes et ceci en imaginant qu&#8217;il s&#8217;agit de coordonnées dans un espace cartésien en trois dimensions. Voyons tout de suite ce que cela donne avec les codes TSL de nos 3 couleurs.</p>
<p><b>distanceTSL(marron, chocolat)</b> = rac((1*cos(28°)-0.453*cos(25.636°))^2 + (1*sin(28°)-0.453*sin(25.636°))^2 + (0.243-0.173)^2) = rac(0.2252+0.0748+0.0049) = <b>0.5522</b><br />
<b>distanceTSL(noir, chocolat)</b> = rac((0*cos(0°)-0.453*cos(25.636°))^2 + (0*sin(0°)-0.453*sin(25.636°))^2 + (0.243-0)^2) = rac(0.1668+0.0384+0.059) = <b>0.5140</b></p>
<p>Très bien, c&#8217;est donc la couleur <b>noire</b> qui est la plus proche de chocolat même si cela se joue à peu. Je vais donc pouvoir dessiner un canapé noir au petit prince et lui dire que c&#8217;est un canapé chocolat&#8230;</p>
<div style="background-color:#EDD38C;color:#000000">ˮEs tu sûr que ton crayon marron n&#8217;aurait pas été plus approprié?ˮ</div>
<p>Ben non petit prince puisque le calcul le dit! Nous pouvons bien sûr vérifier avec les codes TCL ce que cela nous donne.</p>
<p><b>distanceTCL(marron, chocolat)</b> = rac((0.345*cos(28°)-0.22*cos(25.636°))^2 + (0.345*sin(28°)-0.22*sin(25.636°))^2 + (0.243-0.173)^2) = rac(0.0113+0.0045+0.0049) = <b>0.144</b><br />
<b>distanceTCL(noir, chocolat)</b> = rac((0*cos(0°)-0.22*cos(25.636°))^2 + (0*sin(0°)-0.22*sin(25.636°))^2 + (0.243-0)^2) = rac(0.0393+0.0091+0.059) = <b>0.3278</b></p>
<p><s>Tu vois bien que</s> Diantre! Le résultat est différent. Cette fois c&#8217;est bien la couleur <b>marron</b> qui est la plus proche et de manière très nette. On dirait que tu avais raison petit prince, je ferais mieux de dessiner un canapé marron&#8230;</p>
<p>Mais pourquoi cela? Les codes TSL et TCL ne décrivent pas de la même manière les couleurs et selon la manière de la décrire la mesure de la distance varie et surtout&#8230; est plus ou moins en accord avec notre perception de la proximité des couleurs décrites. D&#8217;une manière générale, le code TCL permet d&#8217;obtenir une distance plus en accord avec notre perception des couleurs que le code TSL (cependant pas toujours de manière si optimale que cela mais c&#8217;est une autre histoire&#8230;).</p>
<div style="background-color:#EDD38C;color:#000000">ˮIl est très beau ton canapé chocolat. Est-ce que tu veux bien m&#8217;en dessiner d&#8217;autres : un nacarat, un paille, un pistache,&#8230;?ˮ</div>
<p>Oula! Cela va faire beaucoup de calculs à faire&#8230;</p>
<div style="height: 25px"></div>
<h4 style="color: #AA3D43">Et si on faisait une application?</h4>
<p>Plutôt que de faire tous les calculs à la main, nous allons utiliser la toute nouvelle application du labs Onyme : une application servant à mesurer des distances entre couleurs et ainsi nous donner la couleur la plus proche d&#8217;une autre.</p>
<blockquote><p>Voici son url : <a target="_blank" href="http://labs.onyme.com/color-manager/fr/test.xhtml">http://labs.onyme.com/color-manager/fr/test.xhtml</a></p></blockquote>
<p>Au niveau paramétrage, l&#8217;application vous permet de travailler soit avec des couleurs anglaises, soit avec des couleurs françaises mais également de choisir entre des distances mesurées grâce aux codes Hue &#8211; Saturation &#8211; Lightness (TSL) des couleurs ou bien grâce aux codes Hue &#8211; Chroma &#8211; Lightness (TCL). De quoi donc comparer pour chaque couleur les différences de distances engendrées par les deux codes.</p>
<p><u>Note</u> : L&#8217;application vous propose de renseigner des valeurs n et m. Cela fera l&#8217;objet d&#8217;un prochain billet. Pour le moment, vous devez mettre à la valeur 1 ces deux champs pour obtenir le résultat décrit ici.</p>
<div style="height: 25px"></div>
<h4 style="color: #AA3D43">Mais à quoi sert-elle ton application?</h4>
<p>Hormis pour dessiner des canapés chocolat au petit prince? <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  L&#8217;utilité réelle de l&#8217;application réside dans sa volonté d&#8217;identifier des couleurs &#8220;<b>similairement acceptables</b>&#8221; à une couleur donnée selon des critères choisis (proximité perçue entre les deux couleurs, appartenance des deux couleurs à un même champ chromatique, appartenance des deux couleurs au même type de couleur). Tout cela est calculé automatiquement par l&#8217;application en se basant uniquement sur les codes RVB des couleurs obtenus grâce à <a target="_blank" href="http://fr.wikipedia.org/wiki/Liste_de_couleurs">wikipédia</a>.</p>
<p>Cela peut être utile dans tous les domaines où l&#8217;on a besoin d&#8217;établir une corrélation entre une couleur et un ensemble de couleurs privé de celle-ci. Pour ne citer qu&#8217;un exemple : dans le domaine de la vente, les clients peuvent exprimer un souhait sur une couleur non présente en tant que telle dans l&#8217;offre. Il est alors utile de pouvoir déterminer si une autre couleur présente dans l&#8217;offre peut répondre à la demande et avec quel degré de corrélation.</p>
<p>Nous aurons l&#8217;occasion de développer tout cela plus en détails dans le prochain billet.</p>
<div style="height: 25px"></div>
<h4 style="color: #AA3D43">Pour conclure</h4>
<p>Ce billet sera suivi d&#8217;un autre billet portant sur les paramètres n et m présents dans l&#8217;application. Pour lever un peu du mystère cela est en relation avec le fait que TCL n&#8217;est pas toujours si optimal pour refléter la distance perçue entre deux couleurs.</p>
<blockquote><p>En attendant, vous pouvez vous divertir avec l&#8217;application du labs en testant quelques couleurs de votre choix : <a target="_blank" href="http://labs.onyme.com/color-manager/fr/test.xhtml">http://labs.onyme.com/color-manager/fr/test.xhtml</a></p></blockquote>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/onyme-labs-dessine-moi-un-canape-chocolat/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>TALN 2014 : Marseille sous le signe de l&#8217;innovation en TAL pour les 20 ans de TALN</title>
		<link>http://blog.onyme.com/taln-2014-marseille-20-ans/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=taln-2014-marseille-20-ans</link>
		<comments>http://blog.onyme.com/taln-2014-marseille-20-ans/#comments</comments>
		<pubDate>Tue, 27 May 2014 09:48:49 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[Conférences]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[Marseille TALN]]></category>
		<category><![CDATA[Recital 2014]]></category>
		<category><![CDATA[salon de l'innovation en TAL]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[TALN 20 ans]]></category>
		<category><![CDATA[TALN 2014]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=2726</guid>
		<description><![CDATA[Un petit billet pour vous faire part de la tenue prochaine de la <b>conférence TALN, édition 2014</b>. Édition qui se déroulera à <b>Marseille</b> du <b>1er au 4 juillet 2014</b>.

Le petit plus cette année pour célébrer les 20 ans de TALN : le <b>salon de l'innovation en TAL</b>.]]></description>
				<content:encoded><![CDATA[<p><a target="_blank" href="http://www.taln2014.org"><img src="http://blog.onyme.com/wp-content/uploads/2014/05/Bandeau_TALN2014_long.png" alt="Bandeau_TALN2014_long" width="100%" class="aligncenter size-full wp-image-2741" /></a></p>
<p>Un petit billet pour vous faire part de la tenue prochaine de la <b>conférence TALN, édition 2014</b>. Comme tous les ans depuis 2010, j&#8217;y assisterai mais cette édition réserve <u>quelques surprises</u>.</p>
<p>Attention, <b>teasing</b>&#8230;</p>
<h4 style="color: #AA3D43">TALN / RECITAL / Ateliers : le cœur de l&#8217;évènement</h4>
<p>Cette édition très particulière se déroulera à <b>Marseille</b> du <u>1er au 4 juillet 2014</u>. La conférence <b>RECITAL</b>, destinée à la présentation de travaux de jeunes chercheurs, se tiendra comme habituellement en même temps ainsi que les ateliers <b>DEFT, SemDis, FondamenTAL, TALaf et RLTLN</b> qui auront lieu le premier jour : le <b>mardi 1er juillet</b>.</p>
<p>Mais alors quoi d&#8217;inhabituel / d&#8217;exceptionnel? Marseille est la ville d&#8217;origine de la conférence où se sont déroulés les trois premières éditions de 1994 à 1996 : il y a donc <b>tout juste 20 ans cette année</b>!!</p>
<p>Après ce bref moment historique, revenons au cœur du contenu de la présente édition de la conférence : <b>46 articles</b> ont d&#8217;ores et déjà été acceptés (on en attend d&#8217;autres) dont 34 articles longs à TALN, 6 présentations orales à RECITAL et 6 présentations posters à RECITAL. </p>
<p>Voici comme tous les ans ma petite pré-liste personnelle d&#8217;articles choisis (même s&#8217;il est difficile d&#8217;avoir un choix très arrêté uniquement en connaissant le titre <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> ) :</p>
<ul>
<li>Quoc-Khanh Do, Alexandre Allauzen and François Yvon. <b>Modèles de langue neuronaux: une comparaison de plusieurs stratégies d’apprentissage</b></li>
<li>Maud Pironneau, Éric Brunelle and Simon Charest. <b>Correction automatique par résolution d’anaphores pronominales</b></li>
<li>Iris Eshkol, Isabelle Tellier, Yoann Dupont and Ilaine Wang. <b>Peut-on bien chunker avec de mauvaises étiquettes POS ?</b></li>
<li>Morgane Marchand, Olivier Mesnard, Romaric Besançon and Anne Vilnat. <b>Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d’opinion au niveau du texte</b></li>
<li>Marion Baranes and Benoît Sagot. <b>Normalisation de textes par analogie: le cas des mots inconnus</b></li>
</ul>
<p>Et le lien vers la liste intégrale des <a target="_blank" href="http://www.taln2014.org/site/programme/articles-acceptes/">articles acceptés</a>.</p>
<h4 style="color: #AA3D43">Le salon de l&#8217;innovation en TAL : le grand évènement des 20 ans de TALN</h4>
<p><a target="_blank" href="http://www.taln2014.org"><img src="http://blog.onyme.com/wp-content/uploads/2014/05/FlyerTalnAnim_5_350px_2_4sec.gif" alt="FlyerTalnAnim_5_350px_2_4sec" width="50%" class="aligncenter size-full wp-image-2752" /></a></p>
<p>En plus des activités habituelles se tiendra cette année le <a target="_blank" href="http://www.taln2014.org/site/salon-de-linnovation-en-tal/" />salon de l&#8217;innovation en TAL</a> le <b>vendredi 4 juillet</b>. Ce salon, dont les frais d&#8217;accès sont compris dans les frais d&#8217;inscription à TALN, se tiendra en marge de la conférence pour célébrer l&#8217;anniversaire de la conférence en réunissant lors de cette journée tous les <b>acteurs de l&#8217;innovation en TAL</b>, des domaines privés et publics en France.</p>
<p>L&#8217;occasion de <b>rencontrer et d&#8217;échanger</b> avec d&#8217;autres acteurs du TAL sur les enjeux, les défis, les opportunités, &#8230; que constitue le traitement automatique des langues dans les logiciels d&#8217;aujourd&#8217;hui et de demain.</p>
<h4 style="color: #AA3D43">Toujours plus loin, toujours plus grand, toujours plus profond,&#8230;</h4>
<p><a target="_blank" href="http://147.94.196.239/wordpress/wp-content/uploads/2014/04/SortiePlong%C3%A9eTALN2014-small.pdf"><img src="http://blog.onyme.com/wp-content/uploads/2014/05/sortie-plongee.jpeg" alt="sortie-plongee" width="50%" class="aligncenter size-full wp-image-2763" /></a></p>
<p>Afin de marquer encore davantage l&#8217;évènement des 20 ans de TALN et parce qu&#8217;une conférence ne saurait être réussie sans une activité de loisir, une <a target="_blank" href="http://147.94.196.239/wordpress/wp-content/uploads/2014/04/SortiePlong%C3%A9eTALN2014-small.pdf"><b>sortie plongée</b></a> est organisée pour les amateurs de ce sport. <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_surprised.gif' alt=':o' class='wp-smiley' /> </p>
<p>De la plongée baptême accompagné d&#8217;un moniteur à celle autonome pour les expérimentés : tout a été prévu. Vous pourrez donc y participer si cela vous tente à la double condition de <b>payer un supplément</b> (et oui ce n&#8217;est pas compris dans le prix de la conférence) et d&#8217;<b>arriver une journée avant</b> puisque l&#8217;excursion est prévue pour le <b>lundi 30 juin après midi</b>.</p>
<p>Un moment fun et inoubliable en perspective! <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
<h4 style="color: #AA3D43">Un dernier mot?</h4>
<p>Les inscriptions sont déjà ouvertes et comme d&#8217;habitude un <b>tarif préférentiel</b> s&#8217;applique pour ceux qui s&#8217;inscrivent tôt (avant le <b>6 juin</b>). Ne tardez donc pas si le TAL et l&#8217;innovation dans ce secteur vous intéressent. Toutes les informations utiles et le formulaire d&#8217;inscription sont sur le <a target="_blank" href="http://www.taln2014.org">site de la conférence</a>.</p>
<p>Si vous souhaitez faire de la plongée, vous devez également procéder à une inscription séparée et ce au plus vite car les places sont limitées : <a target="_blank" href="http://www.taln2014.org/site/activite-sociale/" />http://www.taln2014.org/site/activite-sociale/</a></p>
<p>Si vous le souhaitez, vous pouvez également lire (ou relire) les billets concernant les éditions précédentes de la conférence :</p>
<ul>
<li><a target="_blank" href="taln-2013-direct/">TALN 2013 : Le TAL en direct des Sables d’Olonne</a></li>
<li><a target="_blank" href="taln-2013-les-sables-d-olonne/">TALN 2013 : Les Sables d’Olonne</a></li>
<li><a target="_blank" href="jep-taln-2012-retour">JEP-TALN 2012 : Retour sur la conférence de Grenoble</a></li>
<li><a target="_blank" href="taln-2012-grenoble">TALN 2012 : Grenoble</a></li>
<li><a target="_blank" href="taln-recital-deft-2010-quand-le-tal-sinvite-a-montreal">TALN / Recital / DEFT 2010 : Quand le TAL s’invite à Montréal</a></li>
<li><a target="_blank" href="recital-2010-onyme-presente-un-article-sur-la-fouille-d-opinions">Recital 2010 : Onyme présente un article sur la fouille d’opinions</a></li>
</ul>
<div style="text-align:center;color: #AA3D43">Je vous dis donc à très bientôt à Marseille pour les 20 ans de TALN <br />et n&#8217;hésitez pas à nous suivre durant l&#8217;évènement sur Twitter <br /><a target="_blank" href="https://twitter.com/Onyme_FR">@Onyme_fr</a> et <a target="_blank" href="https://twitter.com/trouvilliez">@trouvilliez</a></div>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/taln-2014-marseille-20-ans/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Wordnet Libre du Français 1.0 bêta : Pour l&#8217;évaluer, explorez-le vous même!!!</title>
		<link>http://blog.onyme.com/wordnet-libre-du-francais-1-0-beta-explorez-le-vous-meme/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=wordnet-libre-du-francais-1-0-beta-explorez-le-vous-meme</link>
		<comments>http://blog.onyme.com/wordnet-libre-du-francais-1-0-beta-explorez-le-vous-meme/#comments</comments>
		<pubDate>Mon, 21 Oct 2013 07:53:56 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Onyme Labs]]></category>
		<category><![CDATA[Ressource lexicale]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[WOLF]]></category>
		<category><![CDATA[consultation du WOLF]]></category>
		<category><![CDATA[consultation du Wordnet Libre du Français]]></category>
		<category><![CDATA[consultation en ligne du WOLF]]></category>
		<category><![CDATA[consultation en ligne du Wordnet Libre du Français]]></category>
		<category><![CDATA[évaluation d'une ressource lexicale]]></category>
		<category><![CDATA[évaluation WOLF 1.0 bêta]]></category>
		<category><![CDATA[évaluation WOLF 1.0b]]></category>
		<category><![CDATA[interface graphique du WOLF]]></category>
		<category><![CDATA[interface graphique du Wordnet Libre du Français]]></category>
		<category><![CDATA[labs.onyme.com]]></category>
		<category><![CDATA[outil visuel d’exploration du Wordnet Libre du Français]]></category>
		<category><![CDATA[visualisation graphique du WOLF]]></category>
		<category><![CDATA[visualisation graphique du Wordnet Libre du Français]]></category>
		<category><![CDATA[visualisation graphique en ligne du WOLF]]></category>
		<category><![CDATA[WOrdnet Libre du Français]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=2425</guid>
		<description><![CDATA[Nous avons vu dans le précédent billet que les statistiques publiées sur le projet étaient trop partielles pour nous fournir toutes les clés d'appréciation nécessaire à une évaluation exhaustive de la ressource. 

Nous vous proposons donc d'effectuer nos propres mesures mais également de vous présenter un outil que nous utilisons pour explorer cette ressource et que vous pouvez vous même utiliser. Alors explorez-le et faites vous votre opinion...]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Nous avons vu dans le précédent billet que les <a target="_blank" href="wordnet-libre-du-francais-1-0-beta-etude-statistique" />statistiques publiées sur le projet étaient trop partielles pour nous fournir toutes les clés d&#8217;appréciation nécessaire à une évaluation exhaustive de la ressource</a>.</p>
<p>Nous proposons donc ici d&#8217;effectuer nos propres mesures sur cette ressource afin d&#8217;apporter le complément d&#8217;information nécessaire et de le comparer aux valeurs que nous avions pu estimer dans notre précédent billet. </p>
<p>Mais ce n&#8217;est pas tout : pour aller encore plus loin, je vous présenterai un outil que nous utilisons pour explorer cette ressource et que vous pouvez vous même utiliser. Alors explorez-le et faites vous votre opinion&#8230;</p>
<h2>Quelques évaluations complémentaires&#8230;</h2>
<p>Nous avons utilisé un parser sax afin de parcourir le WOLF en version 1.0 bêta et d&#8217;indexer son contenu dans une base de données Postgres. Cette étape nous évite d&#8217;avoir à travailler directement avec le fichier xml et rend plus facile l&#8217;exploitation du contenu du WOLF par des applications. J&#8217;aurai l&#8217;occasion de vous parler de cela plus en détail par la suite.</p>
<p>Une fois l&#8217;indexation réalisée, il est intéressant d&#8217;effectuer quelques requêtes afin d&#8217;obtenir des statistiques pertinentes. La table ci-dessous les présente.</p>
<p><a name="back"></a></p>
<table border="1px" style="text-align: center">
<tr>
<th>Critère d&#8217;évaluation</th>
<th>Estimation</th>
<th>Mesure</th>
</tr>
<tr>
<td># synsets<sup><a href="#1">1</a></sup> non vides </td>
<td>43 240 &lt; x &lt; 56 751</td>
<td>59 091</td>
</tr>
<tr>
<td># synsets vides ayant un synset hyponyme<sup><a href="#2">2</a></sup> non vide </td>
<td>N.C.</td>
<td>3 672</td>
</tr>
<tr>
<td># littéraux<sup><a href="#3">3</a></sup> distincts</td>
<td>81 420</td>
<td>55 374</td>
</tr>
<tr>
<td rowspan="3"># paires littéral-synset</td>
<td>&gt; 81 420</td>
<td>102 672</td>
</tr>
<tr>
<td>N.C.</td>
<td>dont 95 204 non validées manuellement (92.73% des paires)</td>
</tr>
<tr>
<td>N.C.</td>
<td>et 7 468 validées manuellement (7.27% des paires)</td>
</tr>
</table>
<p>Peu de paires littéral-synset sont validées manuellement&#8230;</p>
<h2>Aller plus loin dans l&#8217;étude avec notre outil d&#8217;exploration</h2>
<p>Nos différentes études consacrées au WOLF ont montré qu&#8217;une exploration directe de la ressource était la meilleure façon de pouvoir se faire une réelle opinion sur sa qualité et sur son utilisabilité dans nos travaux de recherche. Cela n&#8217;est clairement pas des plus simples avec le format xml proposé par l&#8217;Inria.</p>
<p>L&#8217;indexation dans la base de données nous a permis de réaliser nos propres études statistiques de manière assez simple mais cela reste toujours peu visuel pour une exploration manuelle des résultats d&#8217;une requête précise. Partant de ce constat, nous avons réalisé un programme JEE traduisant de manière graphique les résultats remontées par la base de données.</p>
<p>Si aujourd&#8217;hui cet outil nous est utile dans nos évaluations de réponses du WOLF à une requête donnée, nous vous proposons de l&#8217;utiliser également et de vous faire votre propre opinion sur celui-ci.</p>
<blockquote><p>Voici donc le point de lancement de notre tout nouveau Onyme Labs!!! 
<div style='text-align: center'>Au menu, l&#8217;exploration du WOLF : <a target="_blank" href="http://labs.onyme.com/ontologie-explorer">http://labs.onyme.com/ontologie-explorer</a></div>
</blockquote>
<p>Lorsque vous arrivez sur la page principale, vous commencez par choisir la version du WOLF que vous souhaitez explorer. Vous avez le choix entre les versions alpha 0.1.4 et 0.1.5 ou la version 1.0 bêta. </p>
<p>Le plus intéressant est d&#8217;effectuer les mêmes recherches sur les différentes versions afin de les comparer entre elles.</p>
<p>Vous pouvez par exemple essayer de comparer les résultats fournis pour les recherches &#8220;jouet&#8221; ou &#8220;maison&#8221;. Ces deux cas illustrent assez bien les statistiques que nous avons donnés et notamment en ce qui concerne l&#8217;augmentation de la volumétrie des littéraux présents dans la ressource.</p>
<h3>Le cas de &#8220;jouet&#8221;</h3>
<p>Étudions le cas de &#8220;jouet&#8221;. Nous passons de 1 synset en version 0.1.5 à 7 synsets en version 1.0b (<b>+700%</b>). Si celui proposé par la version 0.1.5, nous semble assez convaincant&#8230;</p>
<div style="border-style:solid;border-width:2px;border-color:green">
<a href="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-0.1.5-jouet.png"><img src="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-0.1.5-jouet.png" alt="wolf-0.1.5-jouet" width="800" height="575" class="aligncenter size-full wp-image-2496" /></a></p>
<div align="center">Arborescence du synset contenant le terme &#8220;jouet&#8221; dans le WOLF 0.1.5. Cette arborescence semble <b>correcte</b>.<br /> Un yo-yo est bien un type de jouet qui est lui-même un artefact, un objet,&#8230;</div>
</div>
<p>&#8230;la plupart des nouveaux synsets identifiés dans la version 1.0b sont plus discutables comme par exemple celui présenté ci-dessous.</p>
<div style="border-style:solid;border-width:2px;border-color:green">
<a href="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-1.0b-jouet.png"><img src="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-1.0b-jouet.png" alt="wolf-1.0b-jouet" width="800" height="575" class="aligncenter size-full wp-image-2497" /></a></p>
<div align="center">Arborescence du synset contenant le terme &#8220;jouet&#8221; dans le WOLF 1.0b. Cette arborescence semble <b>incorrecte</b>. <br /> Un chien n&#8217;est pas vraiment un jouet même s&#8217;il s&#8217;agit d&#8217;un pékinois!! <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </div>
</div>
<h3>Le cas de &#8220;maison&#8221;</h3>
<p>Étudions le cas de &#8220;maison&#8221;. Nous passons de 1 synset à 24 synsets (<b>+2400%</b>). Cette fois, si celui de la version 0.1.5 est assez peu convaincant&#8230;</p>
<div style="border-style:solid;border-width:2px;border-color:green">
<a href="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-0.1.5-maison.png"><img src="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-0.1.5-maison.png" alt="wolf-0.1.5-maison" width="800" height="575" class="aligncenter size-full wp-image-2511" /></a></p>
<div align="center">Arborescence du synset contenant le terme &#8220;maison&#8221; dans le WOLF 0.1.5. Cette arborescence semble <b>incorrecte</b>. <br /> &#8220;maison&#8221;, &#8220;famille&#8221; et &#8220;économique&#8221;, <b>trois synonymes</b> ?!</div>
</div>
<p>&#8230;l&#8217;un des 24 synsets de la version 1.0b nous semble très correct&#8230;</p>
<div style="border-style:solid;border-width:2px;border-color:green">
<a href="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-1.0b-maison.png"><img src="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-1.0b-maison.png" alt="wolf-1.0b-maison" width="800" height="575" class="aligncenter size-full wp-image-2514" /></a></p>
<div align="center">Arborescence du synset contenant le terme &#8220;maison&#8221; dans le WOLF 1.0b. Cette arborescence semble <b>correcte</b>. <br /> Un ermitage est bien un type d&#8217;habitation qui est une construction, un artefact,&#8230;</div>
</div>
<p>&#8230;mais quelque peu perdu parmi les 23 autres propositions nettement moins bonnes, dont celle ci-après.</p>
<div style="border-style:solid;border-width:2px;border-color:green">
<a href="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-1.0b-maison-wrong.png"><img src="http://blog.onyme.com/wp-content/uploads/2013/09/wolf-1.0b-maison-wrong.png" alt="wolf-1.0b-maison-wrong" width="800" height="575" class="aligncenter size-full wp-image-2530" /></a></p>
<div align="center">Arborescence du synset contenant le terme &#8220;maison&#8221; dans le WOLF 1.0b. Cette arborescence semble <b>incorrecte</b>. <br />&#8220;abriter&#8221; et &#8220;rentrer&#8221;, <b>des synonymes de &#8220;maison&#8221;</b> ?!</div>
</div>
<p>Nous voyons sur ces exemples les faiblesses de l&#8217;expansion automatique du WOLF. Cela a permis de rajouter de la donnée lexicale dans la ressource qui en manquait très clairement dans ses versions alpha mais revers de la médaille, les expansions réalisées de manière contextuelles ont également introduits du bruit au niveau de termes &#8220;ayant un lien relatif entre eux&#8221; mais n&#8217;étant pas des synonymes. Ainsi, il n&#8217;est pas rare de voir des expressions telles que &#8220;retourner à la maison&#8221;, &#8220;s&#8217;abriter dans la maison&#8221; ou encore que &#8220;le pékinois est une sorte de chien-jouet&#8221; (dans un sens figuré et humoristique) ce qui a amené aux confusions évoquées.</p>
<h2>A vous de jouer!!</h2>
<blockquote><p>Rendez-vous sur le Onyme Labs : 
<div style='text-align: center'><a target="_blank" href="http://labs.onyme.com/ontologie-explorer">http://labs.onyme.com/ontologie-explorer</a></div>
</blockquote>
<p>Si vous avez des remarques, des suggestions, des impressions, les commentaires de cette page sont ouverts alors n&#8217;hésitez pas&#8230;</p>
<h3>Notes</h3>
<p><a name="1"></a><sup>1</sup> Synset : Correspond dans Wordnet à un ensemble de mots que l&#8217;on peut qualifier de synonymes entre eux. Ex : (beau, joli, magnifique) est un synset puisque ces 3 mots sont synonymes. [<a href="#back">Retour</a>]<br />
<a name="2"></a><sup>2</sup> Hyponyme : Mot ayant un sens plus spécifique que le mot considéré. Ex : &#8220;cerise&#8221; est un hyponyme de &#8220;fruit&#8221; car une cerise est une sorte de fruit. Plus de détails sur le <a target="_blank" href="http://fr.wiktionary.org/wiki/Aide:Hyperonymes_et_hyponymes">wiktionnaire</a> [<a href="#back">Retour</a>]<br />
<a name="3"></a><sup>3</sup> Littéral : Équivalent à un mot [<a href="#back">Retour</a>]</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/wordnet-libre-du-francais-1-0-beta-explorez-le-vous-meme/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>Wordnet Libre du Français 1.0 bêta : Etude statistique</title>
		<link>http://blog.onyme.com/wordnet-libre-du-francais-1-0-beta-etude-statistique/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=wordnet-libre-du-francais-1-0-beta-etude-statistique</link>
		<comments>http://blog.onyme.com/wordnet-libre-du-francais-1-0-beta-etude-statistique/#comments</comments>
		<pubDate>Wed, 11 Sep 2013 10:33:56 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Ressource lexicale]]></category>
		<category><![CDATA[TAL]]></category>
		<category><![CDATA[WOLF]]></category>
		<category><![CDATA[comparaison EuroWordnet et WOLF]]></category>
		<category><![CDATA[comparaison PWN et WOLF]]></category>
		<category><![CDATA[comparaison Wordnet anglais et Wordnet français]]></category>
		<category><![CDATA[comparaison wordnets français]]></category>
		<category><![CDATA[évaluation WOLF]]></category>
		<category><![CDATA[évaluation WOLF 1.0 bêta]]></category>
		<category><![CDATA[évaluation WOLF 1.0b]]></category>
		<category><![CDATA[WOrdnet Libre du Français]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=1875</guid>
		<description><![CDATA[Nous continuons notre étude sur la version 1.0 bêta du WOLF avec ce deuxième billet consacré à ce sujet.

La première étude n'incluait pas vraiment d'éléments statistiques pourtant intéressants à prendre en considération afin d’évaluer les évolutions de la ressource d'une version à l’autre. Nous proposons de remédier à cela dans ce nouveau billet.]]></description>
				<content:encoded><![CDATA[<h2>Introduction</h2>
<p>Le mois de septembre est là et rime avec reprises : reprise du travail, reprise des différentes études, reprise des publications dans le blog,&#8230;</p>
<p>Sur ce constat, nous reprenons notre étude sur la version 1.0 bêta du WOLF avec ce deuxième billet consacré à ce sujet. Dans le précédent billet, nous nous sommes arrêtés à une étude comparative menée sur quelques littéraux afin d&#8217;évaluer l&#8217;évolution de la ressource entre la version alpha 0.1.4 et la version 1.0 bêta.</p>
<p>Cette première étude n&#8217;incluait cependant pas vraiment d&#8217;éléments statistiques pourtant intéressants à prendre en considération afin d’évaluer les évolutions de la ressource d&#8217;une version à l’autre. Nous proposons de remédier à cela dans ce nouveau billet.</p>
<h2>Méthodologie et généralités</h2>
<p>L&#8217;étude qui suit est réalisée uniquement en se fondant sur <u>les éléments statistiques fournis par les différents articles publiés</u> concernant le Wordnet de Princeton (PWN), l&#8217;EuroWordnet (EWN) et le WOLF.</p>
<p>Concernant le WOLF, les articles ne sont pas souvent très explicites sur les chiffres statistiques globaux de la ressource obtenue. Bien souvent, seules les évolutions obtenues via leur méthode sont présentées. Il n&#8217;est également pas facile de savoir si les erreurs détectées lors des validations ont été retirées ou non.</p>
<p>J&#8217;ai alors réuni les différentes informations présentes dans les articles afin d&#8217;<b>estimer</b> les évolutions globales de la ressource à chaque étape de son évolution.</p>
<h2>Articles et versions du WOLF</h2>
<p>Plusieurs articles différents ont été publiés sur le WOLF par l&#8217;équipe en charge du projet depuis sa création en 2008. Je vous propose de faire d&#8217;abord un récapitulatif de ces articles et d&#8217;en profiter pour les mettre en correspondance avec les versions publiées du WOLF (cela n&#8217;est pas toujours si simple).</p>
<blockquote><p>Sagot Benoît et Fišer Darja (2008). Construction d&#8217;un wordnet libre du français à partir de ressources multilingues. In TALN 2008, Avignon, France</p></blockquote>
<p>Article fondateur du projet. Correspond à la version 0.1.4 du WOLF.</p>
<blockquote><p>Sagot Benoît, Fort Karën et Venant Fabienne (2008). Extension et couplage de ressources syntaxiques et sémantiques sur les adverbes. In Actes du Colloque Lexique et Grammaire 2008, L&#8217;Aquila, Italie</p></blockquote>
<blockquote><p>Sagot Benoît, Fort Karën et Venant Fabienne (2009). Extension et couplage de ressources syntaxiques et sémantiques sur les adverbes. In Linguisticæ Investigationes 32(2) (pages 305-315)</p></blockquote>
<p>Premières améliorations de la ressource concernant les adverbes. Correspond à la version 0.1.5 du WOLF.</p>
<blockquote><p>Sagot Benoît et Fišer Darja (2012). Automatic extension of WOLF. In Actes de la 12ème Global Wordnet Conference, Matsue, Japon</p></blockquote>
<p>Grosse extension de la ressource. Correspond à la version 0.2 du WOLF.</p>
<blockquote><p>Gábor Kata, Apidianaki Marianna, Sagot Benoît et Villemonte de La Clergerie Éric (2012). Boosting the Coverage of a Semantic Lexicon by Automatically Extracted Event Nominalizations. In Proceedings of LREC 2012, Istanbul, Turquie</p></blockquote>
<p>Extension par nominalisation d’évènements. Correspond à la version 0.2.1 du WOLF.</p>
<blockquote><p>Apidianaki Marianna et Sagot Benoît (2012). Applying Cross-Lingual WSD to Wordnet Development. In Proceedings of LREC 2012, Istanbul, Turquie</p></blockquote>
<p>Extension par une désambigüisation de mots inter-langues. Correspond à la version 0.2.2 du WOLF.</p>
<blockquote><p>Hanoka Valérie et Sagot Benoît (2012). Wordnet creation and extension made simple: A multilingual lexicon-based approach using wiki resources. In Proceedings of LREC 2012, Istanbul, Turquie</p></blockquote>
<p>Extension par une approche fondée sur un lexique multilingue construit à partir de wikis (Wiktionnaries et Wikipédia). Correspond à la version 0.2.5 du WOLF. Les identifiants des synsets du WOLF ont également été migrés de la version 2 à la version 3 du Wordnet de Princeton.</p>
<blockquote><p>Sagot Benoît et Fišer Darja (2012). Cleaning noisy wordnets. In Proceedings of LREC 2012, Istanbul, Turquie</p></blockquote>
<p>Nettoyage semi-automatique du WOLF. Correspond à la version 1.0 bêta du WOLF.</p>
<p>Cela étant fait, nous pouvons à présent commencer nos comparaisons au travers des informations fournies.</p>
<h2>Nombre de synsets</h2>
<p>Le WOLF a toujours contenu l&#8217;intégralité des synsets du Wordnet de Princeton d&#8217;abord en version 2 puis en version 3. Cela permet de garantir une intégrité de la structure arborescente des synsets du PWN dans le WOLF. Cependant, beaucoup des synsets sont en fait vides (ne contiennent pas de littéral). Nous ne considèrerons dans cette étude que les synsets non-vides comme synsets présents. Nous comparons de plus le nombre de synsets du WOLF à ceux du PWN et à l&#8217;EuroWordnet français.</p>
<table style="text-align: center;margin-left:auto;margin-right:auto" border="2" cellspacing="5" bgcolor="#FCFAE1">
<thead>
<tr>
<th>Ressource</th>
<th>Version</th>
<th># synsets</th>
<th>Evolution</th>
</tr>
</thead>
<tr>
<td>EWN</td>
<td>FR</td>
<td>22 121</td>
<td>-</td>
</tr>
<tr>
<td rowspan="2">PWN</td>
<td>2.0</td>
<td>115 424</td>
<td>-</td>
</tr>
<tr>
<td>3.0</td>
<td>117 658</td>
<td>-</td>
</tr>
<tr>
<td rowspan="7">WOLF</td>
<td>0.1.4</td>
<td>32 351</td>
<td>-</td>
</tr>
<tr>
<td>0.1.5</td>
<td>32 546</td>
<td>(+195)</td>
</tr>
<tr>
<td>0.2</td>
<td>46 351</td>
<td>(+13 805)</td>
</tr>
<tr>
<td>0.2.1</td>
<td>46 728</td>
<td>(+377)</td>
</tr>
<tr>
<td>0.2.2</td>
<td>50 632</td>
<td>(+3 904)</td>
</tr>
<tr>
<td>0.2.5</td>
<td>50 632 &lt; x &lt; 56 751</td>
<td>(&lt; +6 119)</td>
</tr>
<tr>
<td>1.0-bêta</td>
<td>43 240 &lt; x &lt; 56 751</td>
<td>(&lt; -7 392)</td>
</tr>
</table>
<h2>Nombre de synsets par catégorie grammaticale</h2>
<p>Chaque synset possède une catégorie grammaticale parmi nom (N), verbe (V), adjectif (Adj) et adverbe (Adv).</p>
<table style="text-align: center;margin-left:auto;margin-right:auto" border="2" cellspacing="5" bgcolor="#FCFAE1">
<thead>
<tr>
<th>Ressource</th>
<th>Version</th>
<th>N</th>
<th>V</th>
<th>Adj</th>
<th>Adv</th>
</tr>
</thead>
<tr>
<td rowspan="2">PWN</td>
<td>2.0</td>
<td>79 689</td>
<td>13 508</td>
<td>18 563</td>
<td>3 664</td>
</tr>
<tr>
<td>3.0</td>
<td>82 114</td>
<td>13 767</td>
<td>18 156</td>
<td>3 621</td>
</tr>
<tr>
<td rowspan="2">WOLF</td>
<td>0.1.4</td>
<td>25 559</td>
<td>1 544</td>
<td>1 562</td>
<td>676</td>
</tr>
<tr>
<td>0.1.5</td>
<td>25 559</td>
<td>1 544</td>
<td>1 562</td>
<td>871</td>
</tr>
</table>
<h2>Nombre de paires littéral &#8211; synset</h2>
<p>Cette information n&#8217;est pas tout le temps disponible de manière claire dans les articles. Il nous faut alors nous contenter d&#8217;une approximation basse selon par exemple le nombre de littéraux distincts dans la ressource. Cette information est équivalente au nombre de littéraux au total contenus dans le wordnet.</p>
<table style="text-align: center;margin-left:auto;margin-right:auto" border="2" cellspacing="5" bgcolor="#FCFAE1">
<thead>
<tr>
<th>Ressource</th>
<th>Version</th>
<th># paires littéral &#8211; synset</th>
<th>Evolution</th>
</tr>
</thead>
<tr>
<td>PWN</td>
<td>2.0</td>
<td>&gt;145 627</td>
<td>-</td>
</tr>
<tr>
<td rowspan="7">WOLF</td>
<td>0.1.4</td>
<td>46 741</td>
<td>-</td>
</tr>
<tr>
<td>0.1.5</td>
<td>46 411</td>
<td>(-330)</td>
</tr>
<tr>
<td>0.2</td>
<td>76 436</td>
<td>(+30 025)</td>
</tr>
<tr>
<td>0.2.1</td>
<td>78 789</td>
<td>(+2 353)</td>
</tr>
<tr>
<td>0.2.2</td>
<td>&gt;82 693</td>
<td>(&gt;+3 904)</td>
</tr>
<tr>
<td>0.2.5</td>
<td>&gt;88 812</td>
<td>(+6 119)</td>
</tr>
<tr>
<td>1.0-bêta</td>
<td>&gt;81 420</td>
<td>(-7 392)</td>
</tr>
</table>
<h2>Validation manuelle</h2>
<p>Je n&#8217;ai malheureusement pas pu obtenir d&#8217;informations précises dans les articles sur la volumétrie de synsets ou mieux sur la volumétrie de paires littéral &#8211; synset validées.</p>
<p>Cette donnée apparait pourtant comme clé dans l&#8217;évaluation de la pertinence de la ressource obtenue.</p>
<h2>Conclusions et perspectives</h2>
<p>Le WOLF est une ressource en évolution de par :</p>
<ul>
<li>l’augmentation <b>estimée</b> d&#8217;environ <u>20 000 synsets non vides</u></li>
<li>l’augmentation <b>estimée</b> d&#8217;environ <u>34 000 paires littéral &#8211; synset</u></li>
</ul>
<p>Nous noterons cependant certains problèmes :</p>
<ul>
<li>un certain <u>manque de documentation</u> sur la ressource. Il n&#8217;y par exemple pas d&#8217;indications précises sur l&#8217;étiquetage réalisé pour indiquer une validation manuelle</li>
<li>un <u>manque de synthèse</u> dans les articles quand aux statistiques de la ressource obtenue</li>
</ul>
<p>Nous pouvons espérer avec la prochaine stabilisation de la ressource qu&#8217;un article focalisé sur ces points sera publié, mais en attendant seule une observation et évaluation directe de la ressource peut nous fournir ces informations manquantes mais primordiales dans son évaluation.</p>
<p>Cette étude fera l&#8217;objet de notre prochain billet.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/wordnet-libre-du-francais-1-0-beta-etude-statistique/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Lead Developer Java</title>
		<link>http://blog.onyme.com/lead-developer-java/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=lead-developer-java</link>
		<comments>http://blog.onyme.com/lead-developer-java/#comments</comments>
		<pubDate>Fri, 30 Aug 2013 07:58:41 +0000</pubDate>
		<dc:creator>Thibaud VIBES</dc:creator>
				<category><![CDATA[Recrutement]]></category>
		<category><![CDATA[cdi]]></category>
		<category><![CDATA[java]]></category>
		<category><![CDATA[job]]></category>
		<category><![CDATA[lille]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=2391</guid>
		<description><![CDATA[Mare des missions en régie ?
Des boites à taille humaine de 1000 personnes  ?
=&#62; Consultez notre offre d'emploi!]]></description>
				<content:encoded><![CDATA[<p><em><strong>&#8211; edit &#8211;</strong></em></p>
<p style="text-align: center;font-size: 30px;font-weight: bold">Poste pourvu</p>
<p><em><strong>&#8211; /edit &#8211;</strong></em></p>
<pre class="xml">&lt;project&gt;
  &lt;groupId&gt;com.onyme.developer&lt;/groupId&gt;
  &lt;artifactId&gt;leader&lt;/artifactId&gt;
  &lt;packaging&gt;H/F&lt;/packaging&gt;
  &lt;version&gt;3.0&lt;/version&gt;
  &lt;description&gt;Lead Développeur(se) Java pour édition de logiciel SaaS sur Lille&lt;/description&gt;
&lt;/project&gt;</pre>
<p>Mare des missions en régie ?<br />
Des boites à taille humaine de 1000 personnes  ?<br />
Frustré(e) de ne pas disposer du temps pour tester vos idées et proposer vos POC à vos N+&#8230; ?<br />
Pour vous <strong>JAVA</strong> n’est pas une ile de l’océan indien et <strong>Glassfish</strong> un poisson surgelé.</p>
<p><strong>Onyme est probablement fait pour vous !</strong></p>
<p>A la veille d’une nouvelle phase dans notre développement et le lancement de nouvelles offres, nous cherchons à étoffer et à compléter les compétences de notre équipe.<br />
Nous recherchons avant tout quelqu&#8217;un :</p>
<ul>
<li>qui pourra apporter un <strong>regard neuf</strong> sur nos méthodes et nos solutions.</li>
<li>qui possède l’esprit d’<strong>initiative</strong> et le goût d’entreprendre.</li>
<li>qui aime <strong>apprendre et transmettre</strong> son expertise.</li>
</ul>
<p>Au final, une personne <strong>passionnée</strong>, toujours à l&#8217;affût des dernières nouveautés dans ce merveilleux monde du développement logiciel.</p>
<h2>Contexte</h2>
<p>Implanté à Euratechnologies, le parc TIC de la métropole lilloise, Onyme est en forte croissance grâce à la réussite technique et commerciale d’Onyme Opinions.<br />
Dirigée par 2 ingénieurs informaticiens et technophiles, l’<strong>agilité et l’innovation</strong> sont l’ADN de l’entreprise. Notre processus de recrutement est comme notre cycle de développement : court et direct.</p>
<p>Si vous souhaitez échanger  :</p>
<ul>
<li>à propos de vos expériences et des projets que vous réaliserez chez Onyme</li>
<li>du poste que nous proposons et du poste tel que vous le souhaitez</li>
<li>connaître le détail des technos que nous utilisons</li>
</ul>
<p>Vous avez lu jusque ici?<br />
<span style="text-decoration: line-through">envoyez votre candidature par email à <a href="mailto:recrute@onyme.com">recrute@onyme.com</a> ou via twitter <a href="http://twitter.com/Onyme_FR" target="_blank">@Onyme_FR</a></span><br />
<em><strong>&#8211; edit &#8211;</strong></em></p>
<p style="text-align: center;font-size: 30px;font-weight: bold">Poste pourvu</p>
<p><em><strong>&#8211; /edit &#8211;</strong></em></p>
<p>&nbsp;</p>
<h2>Conditions</h2>
<p>Nous proposons un poste en <strong>CDI</strong> statut cadre d’ingénieur Développement.<br />
Poste basé à <strong>Lille – Euratechnologies</strong><br />
Poste de travail <strong>à la carte</strong>, à définir en arrivant.<br />
Machine à café de <strong>compétition</strong> (à faire pleurer les fans de Georges CLOWNey).<br />
Chaise testée et validée pour des interminables séances de code.<br />
Rémunération: selon profil et expérience + avantages (restaurant, mutuelle, intéressement…)</p>
<p>A bientôt peut-être.</p>
<p>Au fait &#8230; <strong>Stella</strong> ou Bonzini?</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/lead-developer-java/feed/</wfw:commentRss>
		<slash:comments>17</slash:comments>
		</item>
		<item>
		<title>TALN 2013 : Le TAL en direct des Sables d&#8217;Olonne</title>
		<link>http://blog.onyme.com/taln-2013-direct/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=taln-2013-direct</link>
		<comments>http://blog.onyme.com/taln-2013-direct/#comments</comments>
		<pubDate>Fri, 21 Jun 2013 07:42:49 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[RECITAL]]></category>
		<category><![CDATA[Recital 2013]]></category>
		<category><![CDATA[TALN]]></category>
		<category><![CDATA[TALN 2013]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=2268</guid>
		<description><![CDATA[Je suis pour une semaine aux Sables d'Olonne pour la conférence TALN 2013 / RECITAL 2013. Cette conférence, orientée TAL, se déroule du lundi 17 juin 2013 au vendredi 21 juin 2013.]]></description>
				<content:encoded><![CDATA[<h3>Introduction</h3>
<p>Je suis pour une semaine aux Sables d&#8217;Olonne pour la conférence TALN 2013 / RECITAL 2013. Cette conférence, orientée TAL, se déroule du <b>lundi 17 juin 2013</b> au <b>vendredi 21 juin 2013</b>.</p>
<p>Vous avez oublié cette conférence? Vous n&#8217;avez pas pu vous y rendre? Alors ce billet est pour vous&#8230;</p>
<p>Il est destiné à partager avec vous, en direct de l&#8217;évènement, mes premières anecdotes / impressions sur la conférence. Il sera actualisé régulièrement durant toute la semaine de TALN.</p>
<h3>Jour 1 : lundi 17 juin</h3>
<blockquote><p>
Cette fois c&#8217;est parti. Enregistrement : fait ; début des conférences #taln2013 dans une heure.</p>
<p>9:30 AM &#8211; 17 Juin, 13
</p></blockquote>
<blockquote><p>
ouverture de la conférence #taln2013 par un speech d&#8217;Alexander Fraser sur la traduction automatique statistique</p>
<p>12:26 PM &#8211; 17 Juin, 13
</p></blockquote>
<blockquote><p>
#taln2013 première session booster : 6 posters très intéressants à aller voir&#8230;</p>
<p>12:29 PM &#8211; 17 Juin, 13 · Détails
</p></blockquote>
<blockquote><p>
Après midi bien rempli à #taln2013 : présentation de WoNef, détection de rupture de thématique, détection de néologismes, &#8230;</p>
<p>6:40 PM &#8211; 17 Juin, 13
</p></blockquote>
<blockquote><p>
&#8230; et la journée n&#8217;est pas terminé : réception ce soir à #taln2013 ; début à 19h</p>
<p>6:41 PM &#8211; 17 Juin, 13
</p></blockquote>
<h3>Jour 2 : mardi 18 juin</h3>
<blockquote><p>
#taln2013 continue : au programme de la matinée échue : construction d&#8217;un corpus arboré libre, &#8230;</p>
<p>12:09 PM &#8211; 18 Juin, 13
</p></blockquote>
<blockquote><p>
..constitution de lexiques généralistes depuis le wiktionnaire, extraction de relations, détection de sessions dans les recherches #taln2013</p>
<p>5:59 PM &#8211; 18 Juin, 13
</p></blockquote>
<blockquote><p>
Au programme de l&#8217;après midi de #taln2013, annotations sémantiques, inférence déductive et sémantique des déterminants</p>
<p>6:11 PM &#8211; 18 Juin, 13
</p></blockquote>
<h3>Jour 3 : mercredi 19 juin</h3>
<blockquote><p>
matinée du 3eme jour terminée à #taln2013 : chunks et activation, sélection de relations sémantiques par apprentissage non supervisé, &#8230;</p>
<p>12:46 PM &#8211; 19 Juin, 13
</p></blockquote>
<blockquote><p>
&#8230; et lien entre recherche d&#8217;informations et #TAL. #taln2013</p>
<p>12:51 PM &#8211; 19 Juin, 13
</p></blockquote>
<blockquote><p>
cette après midi : excursion à #taln2013 ; 3 visites au choix ; départ à 13h30</p>
<p>12:52 PM &#8211; 19 Juin, 13
</p></blockquote>
<blockquote><p>
excursion terminée à #taln2013 : une partie de la visite est reportée à demain à midi pour cause de vent en mer</p>
<p>6:52 PM &#8211; 19 Juin, 13
</p></blockquote>
<blockquote><p>
place maintenant au diner de #taln2013 ; début imminent</p>
<p>7:04 PM &#8211; 19 Juin, 13
</p></blockquote>
<h3>Jour 4 : jeudi 20 juin</h3>
<blockquote><p>
excursion du midi annulée à #taln2013 toujours pour cause de mauvais temps en mer =&gt; pas de balade en bateau pour cette fois #fail</p>
<p>12:06 PM &#8211; 20 Juin, 13
</p></blockquote>
<blockquote><p>
Au programme de la 4eme matinée de #taln2013 : identification des chiasmes de mots &#8230;</p>
<p>12:09 PM &#8211; 20 Juin, 13
</p></blockquote>
<blockquote><p>
&#8230; et utilisation des CRF en non supervisé et pour la reconnaissance d&#8217;entités nommées #taln2013</p>
<p>12:09 PM &#8211; 20 Juin, 13
</p></blockquote>
<blockquote><p>
Au programme de l&#8217;après midi de #taln2013 : démonstrations et clôture de la partie principale de la conférence</p>
<p>12:32 PM &#8211; 20 Juin, 13
</p></blockquote>
<h3>Jour 5 : vendredi 21 juin</h3>
<blockquote><p>
début de l&#8217;atelier DEFT à #taln2013</p>
<p>8:37 AM &#8211; 21 Juin, 13
</p></blockquote>
<blockquote><p>
présentation des taches : classification de recettes de cuisine par type de plat, difficulté, &#8230; #taln2013</p>
<p>8:52 AM &#8211; 21 Juin, 13
</p></blockquote>
<blockquote><p>
tache supplémentaire de DEFT 2013 : extraction de la liste d&#8217;ingrédients de la recette #taln2013</p>
<p>11:59 AM &#8211; 21 Juin, 13
</p></blockquote>
<blockquote><p>
#taln2013 est terminée</p>
<p>6:53 PM &#8211; 21 Juin, 13
</p></blockquote>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/taln-2013-direct/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Évènement à EuraTechnologies : soutenance de thèse de doctorat</title>
		<link>http://blog.onyme.com/evenement-a-euratechnologies-soutenance-de-these-de-doctorat/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=evenement-a-euratechnologies-soutenance-de-these-de-doctorat</link>
		<comments>http://blog.onyme.com/evenement-a-euratechnologies-soutenance-de-these-de-doctorat/#comments</comments>
		<pubDate>Tue, 28 May 2013 08:00:01 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[Thèse]]></category>
		<category><![CDATA[apprentissage artificiel]]></category>
		<category><![CDATA[classement de textes]]></category>
		<category><![CDATA[classification et regroupement de textes]]></category>
		<category><![CDATA[doctorat en informatique]]></category>
		<category><![CDATA[lille]]></category>
		<category><![CDATA[onyme]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=1989</guid>
		<description><![CDATA[Une soutenance de thèse qui marque la fin de trois années de doctorat CIFRE]]></description>
				<content:encoded><![CDATA[<p><b>octobre 2009 &#8211; mai 2013</b> : trois ans et demi de doctorat CIFRE. Le temps m&#8217;a paru passer vite&#8230;</p>
<p>Ma soutenance de thèse, conclusion de cette période riche en apprentissage, s&#8217;est déroulée</p>
<div align="center">
  le lundi <b>13 mai 2013</b> à partir de 11h<br />
  à <b>EuraTechnologies</b> à Lille au cœur de l&#8217;<a target="_blank" href="http://www.euratechnologies.com/evenement/salles/espace-vip">espace VIP</a>
</div>
<p>avec pour sujet : &#8220;Similarités de données textuelles pour l&#8217;apprentissage de textes courts d&#8217;opinions et la recherche de produits&#8221;.</p>
<p>Disposant de seulement <u>45 minutes environ de présentation</u>, j&#8217;ai choisi de surtout insister sur <u>l&#8217;apprentissage de textes courts d&#8217;opinions</u>. De la tâche de regroupement à celle de classification de textes, j&#8217;ai ainsi pu présenter les enjeux de l&#8217;établissement d&#8217;une similarité efficace pour l&#8217;apprentissage supervisé et non supervisé de ces tâches. Tout un programme&#8230; Résumer pédagogiquement plus de trois ans de travail et un manuscrit de 300 pages à une présentation de moins d&#8217;une heure fut un exercice de concision complexe. Défi relevé en 50 minutes <img src='http://blog.onyme.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> . Ce dernier fut suivi d&#8217;un peu plus d&#8217;<u>une heure de questions diverses</u> posées par les <u>huit membres de mon jury</u> avant les délibérations. Ces huit membres sont :</p>
<ul>
<li><a target="_blank" href="http://www.irit.fr/-Annuaire-?code=291">Dr Florence Sèdes, Directrice adjointe IRIT, UMR CNRS 5505, Toulouse</a>, rapporteur</li>
<li><a target="_blank" href="http://www.loria.fr/~yannick/pmwiki/pmwiki.php">Dr Yannick Toussaint, Chercheur à l&#8217;INRIA Nancy Grand-Est et au LORIA, Nancy</a>, rapporteur</li>
<li><a target="_blank" href="http://www.lirmm.fr/~koriche/" />Dr Frédéric Koriche, CRIL, UMR CNRS 8188, Lens</a>, examinateur et président du jury</li>
<li>Dr Olivier Collin, Ingénieur de Recherche à France Telecom, Lannion, examinateur</li>
<li><a target="_blank" href="http://www.cril.univ-artois.fr/~marquis/Home,_sweet_home.html">Dr Pierre Marquis, CRIL, UMR CNRS 8188, Lens</a>, directeur de thèse</li>
<li>Dr Vincent Dubois, CRIL, UMR CNRS 8188, Lens, co-encadrant de thèse</li>
<li><a target="_blank" href="http://www.onyme.com/" />M. Antoine Serniclay, Directeur d&#8217;Onyme, Lille</a>, invité</li>
<li><a target="_blank" href="http://www.onyme.com/" />M. Thibaud Vibes, Directeur technique d&#8217;Onyme, Lille</a>, invité</li>
</ul>
<p>Je profite de ce billet pour tous vous remercier encore une fois du temps que vous avez consacré pour l&#8217;aboutissement de ce travail.</p>
<p><img src="http://blog.onyme.com/wp-content/uploads/2013/05/Benoit_pupitre.jpg" alt="Benoit_pupitre" width="60%" class="aligncenter size-full wp-image-2027" /></p>
<div align="center">Prenons la pose pour la photo souvenir&#8230;</div>
<p>Les membres de ce jury ont noté que </p>
<blockquote><p>Le sujet que Benoît Trouvilliez a traité dans sa thèse couvre un spectre large qui s’étend du traitement automatique du langage naturel jusqu’à la recherche d’information. Au cours de la soutenance, il a montré qu’il a su acquérir une vision étendue du domaine. Benoît Trouvilliez a présenté avec aisance les logiciels qu’il a développés et mis en production. Il a également répondu avec assurance et pertinence aux nombreuses questions qui lui ont été posées.</p></blockquote>
<p>Et c&#8217;est ainsi que se termine mon parcours CIFRE : par l&#8217;obtention du <u>titre de docteur en informatique de l’Université d’Artois avec une mention très honorable</u>, et que débute mon parcours post-doctoral à Onyme.</p>
<p>Afin de célébrer cet évènement majeur, un apéritif fut organisé en début d&#8217;après midi par la société Onyme dans l&#8217;espace VIP d&#8217;Euratechnologies. Merci aux nombreux présents, aussi bien à la soutenance qu&#8217;à l&#8217;apéritif (près d&#8217;une centaine de personnes en tout!!). Je conclurai par cette photo souvenir de ce moment convivial.</p>
<p><img src="http://blog.onyme.com/wp-content/uploads/2013/05/Benoit_coupe1.jpg" alt="Benoit_coupe" width="30%" class="aligncenter size-full wp-image-2041" /></p>
<div align="center">A la vôtre!!!</div>
<p><small><br />
Dr Benoît TROUVILLIEZ<br />
Ingénieur &#8211; Docteur en informatique<br />
recherche en Traitement Automatique des Langues<br />
Onyme SARL<br />
</small></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/evenement-a-euratechnologies-soutenance-de-these-de-doctorat/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Un blog tout nouveau, tout neuf pour encore mieux vous servir&#8230;</title>
		<link>http://blog.onyme.com/un-blog-tout-nouveau-tout-neuf/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=un-blog-tout-nouveau-tout-neuf</link>
		<comments>http://blog.onyme.com/un-blog-tout-nouveau-tout-neuf/#comments</comments>
		<pubDate>Tue, 09 Apr 2013 12:34:22 +0000</pubDate>
		<dc:creator>Benoît TROUVILLIEZ</dc:creator>
				<category><![CDATA[Actualités]]></category>

		<guid isPermaLink="false">http://blog.onyme.com/?p=1941</guid>
		<description><![CDATA[Petit billet d'actualité pour vous faire part de la mise à jour de notre blog sur la dernière version de WordPress : <b>la version 3.5.1</b>.]]></description>
				<content:encoded><![CDATA[<p>Petit billet d&#8217;actualité pour vous faire part de la mise à jour de notre blog sur la dernière version de WordPress : <b>la version 3.5.1</b>.</p>
<p>Au delà de la simple opération de maintenance de notre blog, cette mise à jour va vous permettre <u>d’interagir plus facilement</u> avec notre blog.</p>
<p>Vous avez un compte Twitter? Un compte Facebook? Vous avez désormais la possibilité de vous identifier sur notre blog avec ce compte. En plus, cela vous permet de partager vos commentaires sur votre réseau social préféré.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.onyme.com/un-blog-tout-nouveau-tout-neuf/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
