Blog Onyme
Archive pour la catégorie ‘TAL’
Nous avons vu dans le précédent billet que les statistiques publiées sur le projet étaient trop partielles pour nous fournir toutes les clés d’appréciation nécessaire à une évaluation exhaustive de la ressource. Nous vous proposons donc d’effectuer nos propres mesures mais également de vous présenter un outil que nous utilisons pour explorer cette ressource et que vous pouvez vous même utiliser. Alors explorez-le et faites vous votre opinion… |
Wordnet Libre du Français 1.0 bêta : Etude statistique11 septembre 2013Nous continuons notre étude sur la version 1.0 bêta du WOLF avec ce deuxième billet consacré à ce sujet. La première étude n’incluait pas vraiment d’éléments statistiques pourtant intéressants à prendre en considération afin d’évaluer les évolutions de la ressource d’une version à l’autre. Nous proposons de remédier à cela dans ce nouveau billet. |
Wordnet Libre du Français 1.0 bêta : Nouvelle étude comparative 3 ans après la première version alpha publique21 mars 2013Nos premiers lecteurs s’en souviennent surement : Il y a trois ans (presque jour pour jour), je vous présentais la ressource linguistique Wordnet Libre du Français (WOLF) dans un des premiers billets de ce blog. Cette ressource linguistique, développée depuis 2008 pour le français par l’Inria, est en licence libre (contrairement par exemple au projet EuroWordnet). Fin octobre 2012, la version 1.0 bêta de la ressource est publiée. L’occasion pour nous de faire un nouveau point sur cette ressource. |
Offre de stage TAL 201311 janvier 2013Onyme éditeur de logiciel Saas spécialisée en analyse sémantique recherche, en 2013, un(e) stagiaire de deuxième année de master en informatique, avec un attrait pour le traitement automatique des langues. Une embauche à l’issue du stage est envisagée. 2 sujets au choix sont proposés. |
Apprentissage artificiel : Évaluation de l’apprentissage – Précision, Rappel et F-mesure11 octobre 2012Nous avons vu dans le précédent billet l’évaluation théorique de l’apprentissage au travers des notions de risques et fonctions de perte. Ces notions théoriques permettent de poser scientifiquement le cadre de notre problème, mais ne permettent en revanche pas de visualiser concrètement comment nous pouvons mettre en place des techniques d’évaluation de nos algorithmes d’apprentissage. Le but de ce billet est de rendre ces notions plus concrètes. |
Un nouveau volet de notre saga de billets sur l’apprentissage artificiel. Dans celui-ci, nous allons discuter des moyens d’évaluer un apprentissage. Nous voyons en quoi l’induction faite par le système apprenant peut conduire à une situation de mauvais apprentissage soit par une induction trop faible, soit au contraire par une induction trop forte. |
Apprentissage artificiel : Moyens d’apprendre pour la classification et les regroupements (biais et modèles)25 juillet 2012La suite de la saga sur la notion d’apprentissage artificiel (que l’on désigne également par apprentissage automatique) appliquée aux tâches de classification et regroupement. Dans ce volet, nous allons introduire les notions complémentaires de biais et modèles d’apprentissage. |
JEP-TALN 2012 : Retour sur la conférence de Grenoble19 juin 2012Comme je l’avais annoncé dans le blog en Avril, l’édition 2012 de la conférence TALN – RECITAL s’est déroulée à Grenoble du 04 au 08 Juin. Cette année était pourtant particulière… Je vous propose un petit tour d’horizon sur cette conférence. |
Apprentissage artificiel : Fondements et protocoles pour la classification et les regroupements26 avril 2012Un sujet que je n’ai encore que peu abordé dans ce blog concerne la notion d’apprentissage artificiel (que l’on désigne également par apprentissage automatique). C’est pourquoi, je vous propose une série de billets traitant de cette problématique. Nous étudierons principalement les tâches de classification et regroupement car elles sont au cœur de nos préoccupations. Ce premier billet va nous servir à introduire les premières notions indispensables pour comprendre le domaine, le but recherché et les étapes principales de sa résolution. |
Voilà déjà le 24ème billet du blog pour 2 ans d’existence. Merci à tous nos lecteurs. On entend assez souvent parler dans les domaines du TAL de méthodes statistiques pour analyser la sémantique des mots d’un texte. J’y ai déjà d’ailleurs consacré un billet en janvier avec un zoom sur la méthode LSA. Voici donc la suite que je vous avez alors promis sur la méthode Hyperspace Analogue To Language (HAL). |