Archive pour la catégorie ‘TAL’

Wordnet Libre du Français 1.0 bêta : Pour l’évaluer, explorez-le vous même!!! 21 octobre 2013 Nous avons vu dans le précédent billet que les statistiques publiées sur le projet étaient trop partielles pour nous fournir toutes les clés d’appréciation nécessaire à une évaluation exhaustive de la ressource. Nous vous proposons donc d’effectuer nos propres mesures mais également de vous présenter un outil que nous utilisons pour explorer cette ressource et que vous pouvez vous même utiliser. Alors explorez-le et faites vous votre opinion… Auteur : Benoît TROUVILLIEZ Mots clefs : consultation du WOLF, consultation du Wordnet Libre du Français, consultation en ligne du WOLF, consultation en ligne du Wordnet Libre du Français, évaluation d'une ressource lexicale, évaluation WOLF 1.0 bêta, évaluation WOLF 1.0b, interface graphique du WOLF, interface graphique du Wordnet Libre du Français, labs.onyme.com, Onyme Labs, outil visuel d’exploration du Wordnet Libre du Français, TAL, visualisation graphique du WOLF, visualisation graphique du Wordnet Libre du Français, visualisation graphique en ligne du WOLF, WOLF, WOrdnet Libre du Français Catégorie(s) : Onyme Labs, Ressource lexicale, TAL, WOLF 7 commentaires »
Wordnet Libre du Français 1.0 bêta : Etude statistique 11 septembre 2013 Nous continuons notre étude sur la version 1.0 bêta du WOLF avec ce deuxième billet consacré à ce sujet. La première étude n’incluait pas vraiment d’éléments statistiques pourtant intéressants à prendre en considération afin d’évaluer les évolutions de la ressource d’une version à l’autre. Nous proposons de remédier à cela dans ce nouveau billet. Auteur : Benoît TROUVILLIEZ Mots clefs : comparaison EuroWordnet et WOLF, comparaison PWN et WOLF, comparaison Wordnet anglais et Wordnet français, comparaison wordnets français, évaluation WOLF, évaluation WOLF 1.0 bêta, évaluation WOLF 1.0b, WOLF, WOrdnet Libre du Français Catégorie(s) : Ressource lexicale, TAL, WOLF 3 commentaires »
Wordnet Libre du Français 1.0 bêta : Nouvelle étude comparative 3 ans après la première version alpha publique 21 mars 2013 Nos premiers lecteurs s’en souviennent surement : Il y a trois ans (presque jour pour jour), je vous présentais la ressource linguistique Wordnet Libre du Français (WOLF) dans un des premiers billets de ce blog. Cette ressource linguistique, développée depuis 2008 pour le français par l’Inria, est en licence libre (contrairement par exemple au projet EuroWordnet). Fin octobre 2012, la version 1.0 bêta de la ressource est publiée. L’occasion pour nous de faire un nouveau point sur cette ressource. Auteur : Benoît TROUVILLIEZ Mots clefs : évaluation WOLF, évaluation WOLF 1.0 bêta, évaluation WOLF 1.0b, WOLF, WOrdnet Libre du Français Catégorie(s) : Ressource lexicale, TAL, WOLF Aucun commentaire »
Offre de stage TAL 2013 11 janvier 2013 Onyme éditeur de logiciel Saas spécialisée en analyse sémantique recherche, en 2013, un(e) stagiaire de deuxième année de master en informatique, avec un attrait pour le traitement automatique des langues. Une embauche à l’issue du stage est envisagée. 2 sujets au choix sont proposés. Auteur : Benoît TROUVILLIEZ Mots clefs : Recrutement, recrutement R&D TAL, stage TAL Catégorie(s) : Actualités, Recrutement, TAL Aucun commentaire »
Apprentissage artificiel : Évaluation de l’apprentissage – Précision, Rappel et F-mesure 11 octobre 2012 Nous avons vu dans le précédent billet l’évaluation théorique de l’apprentissage au travers des notions de risques et fonctions de perte. Ces notions théoriques permettent de poser scientifiquement le cadre de notre problème, mais ne permettent en revanche pas de visualiser concrètement comment nous pouvons mettre en place des techniques d’évaluation de nos algorithmes d’apprentissage. Le but de ce billet est de rendre ces notions plus concrètes. Auteur : Benoît TROUVILLIEZ Mots clefs : apprentissage artificiel, apprentissage automatique, bruit d'un système, classification, f-mesure, faux négatifs, faux positifs, fonction de perte, moyenne harmonique, précision, rappel, recherche d'informations, TAL Catégorie(s) : Apprentissages, TAL 2 commentaires »
Apprentissage artificiel : Évaluation de l’apprentissage – Estimation des risques 30 août 2012 Un nouveau volet de notre saga de billets sur l’apprentissage artificiel. Dans celui-ci, nous allons discuter des moyens d’évaluer un apprentissage. Nous voyons en quoi l’induction faite par le système apprenant peut conduire à une situation de mauvais apprentissage soit par une induction trop faible, soit au contraire par une induction trop forte. Auteur : Benoît TROUVILLIEZ Mots clefs : apprentissage artificiel, apprentissage automatique, apprentissage supervisé, classification, principe de minimisation du risque empirique, risque empirique, risque réel, sous apprentissage, sur apprentissage, TAL Catégorie(s) : Apprentissages, TAL Aucun commentaire »
Apprentissage artificiel : Moyens d’apprendre pour la classification et les regroupements (biais et modèles) 25 juillet 2012 La suite de la saga sur la notion d’apprentissage artificiel (que l’on désigne également par apprentissage automatique) appliquée aux tâches de classification et regroupement. Dans ce volet, nous allons introduire les notions complémentaires de biais et modèles d’apprentissage. Auteur : Benoît TROUVILLIEZ Mots clefs : apprentissage artificiel, biais d'apprentissage, biais inductif, classification, clustering, induction, modèles d'apprentissage, moyens de l'apprentissage, séparateur linéaire, TAL Catégorie(s) : Apprentissages, TAL 1 commentaire »
JEP-TALN 2012 : Retour sur la conférence de Grenoble 19 juin 2012 Comme je l’avais annoncé dans le blog en Avril, l’édition 2012 de la conférence TALN – RECITAL s’est déroulée à Grenoble du 04 au 08 Juin. Cette année était pourtant particulière… Je vous propose un petit tour d’horizon sur cette conférence. Auteur : Benoît TROUVILLIEZ Mots clefs : complexité phonologique d'une langue, correction orthographique, détection de la langue d'un texte, JEP, JEP 2012, JEP-TALN, JEP-TALN 2012, JEP-TALN-RECITAL 2012, langue d'un mot inconnu, Okapi BM-25, pondération d'un mot, TAL, TALN, TALN Grenoble, TF-IDF Catégorie(s) : Conférences, TAL, TALN Aucun commentaire »
Apprentissage artificiel : Fondements et protocoles pour la classification et les regroupements 26 avril 2012 Un sujet que je n’ai encore que peu abordé dans ce blog concerne la notion d’apprentissage artificiel (que l’on désigne également par apprentissage automatique). C’est pourquoi, je vous propose une série de billets traitant de cette problématique. Nous étudierons principalement les tâches de classification et regroupement car elles sont au cœur de nos préoccupations. Ce premier billet va nous servir à introduire les premières notions indispensables pour comprendre le domaine, le but recherché et les étapes principales de sa résolution. Auteur : Benoît TROUVILLIEZ Mots clefs : apprentissage artificiel, apprentissage automatique, apprentissage naturel, apprentissage non supervisé, apprentissage semi supervisé, apprentissage supervisé, classification, classification et regroupement de textes, fondements de l'apprentissage artificiel, intelligence artificielle, protocoles d'apprentissage artificiel, regroupement Catégorie(s) : Apprentissages, TAL Aucun commentaire »
Statistiques et sémantique des mots : Hyperspace Analogue To Language (HAL) 28 mars 2012 Voilà déjà le 24ème billet du blog pour 2 ans d’existence. Merci à tous nos lecteurs. On entend assez souvent parler dans les domaines du TAL de méthodes statistiques pour analyser la sémantique des mots d’un texte. J’y ai déjà d’ailleurs consacré un billet en janvier avec un zoom sur la méthode LSA. Voici donc la suite que je vous avez alors promis sur la méthode Hyperspace Analogue To Language (HAL). Auteur : Benoît TROUVILLIEZ Mots clefs : extraction d'informations, fenêtre de mots, HAL, Hyperspace Analogue To Language, mots co-occurents, sémantique, sémantique statistique Catégorie(s) : Statistiques, TAL 4 commentaires »

Wordnet Libre du Français 1.0 bêta : Pour l’évaluer, explorez-le vous même!!!

21 octobre 2013

Nous avons vu dans le précédent billet que les statistiques publiées sur le projet étaient trop partielles pour nous fournir toutes les clés d’appréciation nécessaire à une évaluation exhaustive de la ressource.

Nous vous proposons donc d’effectuer nos propres mesures mais également de vous présenter un outil que nous utilisons pour explorer cette ressource et que vous pouvez vous même utiliser. Alors explorez-le et faites vous votre opinion…

Wordnet Libre du Français 1.0 bêta : Etude statistique

11 septembre 2013

Nous continuons notre étude sur la version 1.0 bêta du WOLF avec ce deuxième billet consacré à ce sujet.

La première étude n’incluait pas vraiment d’éléments statistiques pourtant intéressants à prendre en considération afin d’évaluer les évolutions de la ressource d’une version à l’autre. Nous proposons de remédier à cela dans ce nouveau billet.

Auteur : Benoît TROUVILLIEZ
Mots clefs : comparaison EuroWordnet et WOLF, comparaison PWN et WOLF, comparaison Wordnet anglais et Wordnet français, comparaison wordnets français, évaluation WOLF, évaluation WOLF 1.0 bêta, évaluation WOLF 1.0b, WOLF, WOrdnet Libre du Français
Catégorie(s) : Ressource lexicale, TAL, WOLF
3 commentaires »

Wordnet Libre du Français 1.0 bêta : Nouvelle étude comparative 3 ans après la première version alpha publique

21 mars 2013

Nos premiers lecteurs s’en souviennent surement : Il y a trois ans (presque jour pour jour), je vous présentais la ressource linguistique Wordnet Libre du Français (WOLF) dans un des premiers billets de ce blog. Cette ressource linguistique, développée depuis 2008 pour le français par l’Inria, est en licence libre (contrairement par exemple au projet EuroWordnet).

Fin octobre 2012, la version 1.0 bêta de la ressource est publiée. L’occasion pour nous de faire un nouveau point sur cette ressource.

Auteur : Benoît TROUVILLIEZ
Mots clefs : évaluation WOLF, évaluation WOLF 1.0 bêta, évaluation WOLF 1.0b, WOLF, WOrdnet Libre du Français
Catégorie(s) : Ressource lexicale, TAL, WOLF
Aucun commentaire »

Offre de stage TAL 2013

11 janvier 2013

Onyme éditeur de logiciel Saas spécialisée en analyse sémantique recherche, en 2013, un(e) stagiaire de deuxième année de master en informatique, avec un attrait pour le traitement automatique des langues. Une embauche à l’issue du stage est envisagée.

2 sujets au choix sont proposés.

Auteur : Benoît TROUVILLIEZ
Mots clefs : Recrutement, recrutement R&D TAL, stage TAL
Catégorie(s) : Actualités, Recrutement, TAL
Aucun commentaire »

Apprentissage artificiel : Évaluation de l’apprentissage – Précision, Rappel et F-mesure

11 octobre 2012

Nous avons vu dans le précédent billet l’évaluation théorique de l’apprentissage au travers des notions de risques et fonctions de perte. Ces notions théoriques permettent de poser scientifiquement le cadre de notre problème, mais ne permettent en revanche pas de visualiser concrètement comment nous pouvons mettre en place des techniques d’évaluation de nos algorithmes d’apprentissage. Le but de ce billet est de rendre ces notions plus concrètes.

Auteur : Benoît TROUVILLIEZ
Mots clefs : apprentissage artificiel, apprentissage automatique, bruit d'un système, classification, f-mesure, faux négatifs, faux positifs, fonction de perte, moyenne harmonique, précision, rappel, recherche d'informations, TAL
Catégorie(s) : Apprentissages, TAL
2 commentaires »

Apprentissage artificiel : Évaluation de l’apprentissage – Estimation des risques

30 août 2012

Un nouveau volet de notre saga de billets sur l’apprentissage artificiel. Dans celui-ci, nous allons discuter des moyens d’évaluer un apprentissage. Nous voyons en quoi l’induction faite par le système apprenant peut conduire à une situation de mauvais apprentissage soit par une induction trop faible, soit au contraire par une induction trop forte.

Auteur : Benoît TROUVILLIEZ
Mots clefs : apprentissage artificiel, apprentissage automatique, apprentissage supervisé, classification, principe de minimisation du risque empirique, risque empirique, risque réel, sous apprentissage, sur apprentissage, TAL
Catégorie(s) : Apprentissages, TAL
Aucun commentaire »

Apprentissage artificiel : Moyens d’apprendre pour la classification et les regroupements (biais et modèles)

25 juillet 2012

La suite de la saga sur la notion d’apprentissage artificiel (que l’on désigne également par apprentissage automatique) appliquée aux tâches de classification et regroupement. Dans ce volet, nous allons introduire les notions complémentaires de biais et modèles d’apprentissage.

Auteur : Benoît TROUVILLIEZ
Mots clefs : apprentissage artificiel, biais d'apprentissage, biais inductif, classification, clustering, induction, modèles d'apprentissage, moyens de l'apprentissage, séparateur linéaire, TAL
Catégorie(s) : Apprentissages, TAL
1 commentaire »

JEP-TALN 2012 : Retour sur la conférence de Grenoble

19 juin 2012

Comme je l’avais annoncé dans le blog en Avril, l’édition 2012 de la conférence TALN – RECITAL s’est déroulée à Grenoble du 04 au 08 Juin. Cette année était pourtant particulière… Je vous propose un petit tour d’horizon sur cette conférence.

Auteur : Benoît TROUVILLIEZ
Mots clefs : complexité phonologique d'une langue, correction orthographique, détection de la langue d'un texte, JEP, JEP 2012, JEP-TALN, JEP-TALN 2012, JEP-TALN-RECITAL 2012, langue d'un mot inconnu, Okapi BM-25, pondération d'un mot, TAL, TALN, TALN Grenoble, TF-IDF
Catégorie(s) : Conférences, TAL, TALN
Aucun commentaire »

Apprentissage artificiel : Fondements et protocoles pour la classification et les regroupements

26 avril 2012

Un sujet que je n’ai encore que peu abordé dans ce blog concerne la notion d’apprentissage artificiel (que l’on désigne également par apprentissage automatique). C’est pourquoi, je vous propose une série de billets traitant de cette problématique. Nous étudierons principalement les tâches de classification et regroupement car elles sont au cœur de nos préoccupations.

Ce premier billet va nous servir à introduire les premières notions indispensables pour comprendre le domaine, le but recherché et les étapes principales de sa résolution.

Auteur : Benoît TROUVILLIEZ
Mots clefs : apprentissage artificiel, apprentissage automatique, apprentissage naturel, apprentissage non supervisé, apprentissage semi supervisé, apprentissage supervisé, classification, classification et regroupement de textes, fondements de l'apprentissage artificiel, intelligence artificielle, protocoles d'apprentissage artificiel, regroupement
Catégorie(s) : Apprentissages, TAL
Aucun commentaire »

Statistiques et sémantique des mots : Hyperspace Analogue To Language (HAL)

28 mars 2012

Voilà déjà le 24ème billet du blog pour 2 ans d’existence. Merci à tous nos lecteurs.

On entend assez souvent parler dans les domaines du TAL de méthodes statistiques pour analyser la sémantique des mots d’un texte. J’y ai déjà d’ailleurs consacré un billet en janvier avec un zoom sur la méthode LSA. Voici donc la suite que je vous avez alors promis sur la méthode Hyperspace Analogue To Language (HAL).

Auteur : Benoît TROUVILLIEZ
Mots clefs : extraction d'informations, fenêtre de mots, HAL, Hyperspace Analogue To Language, mots co-occurents, sémantique, sémantique statistique
Catégorie(s) : Statistiques, TAL
4 commentaires »

Blog Onyme

Archive pour la catégorie ‘TAL’

Wordnet Libre du Français 1.0 bêta : Pour l’évaluer, explorez-le vous même!!!

Wordnet Libre du Français 1.0 bêta : Etude statistique

Wordnet Libre du Français 1.0 bêta : Nouvelle étude comparative 3 ans après la première version alpha publique

Offre de stage TAL 2013

Apprentissage artificiel : Évaluation de l’apprentissage – Précision, Rappel et F-mesure

Apprentissage artificiel : Évaluation de l’apprentissage – Estimation des risques

Apprentissage artificiel : Moyens d’apprendre pour la classification et les regroupements (biais et modèles)

JEP-TALN 2012 : Retour sur la conférence de Grenoble

Apprentissage artificiel : Fondements et protocoles pour la classification et les regroupements

Statistiques et sémantique des mots : Hyperspace Analogue To Language (HAL)

A voir

Articles récents

Mots clés

Catégories

Onyme sur Twitter