|
On entend assez souvent parler dans les domaines du TAL de méthodes statistiques pour analyser la sémantique des mots d’un texte. Ce billet est le premier d’une liste de billets visant à expliciter le lien existant entre les statistiques et la sémantique des mots en présentant quelques méthodes parmi les plus connues dans le domaine. Ce premier billet de la série est consacrée à la très célèbre méthode Latent Semantic Analysis (LSA). |
|
Ce nouvel article a pour but de vous faire partager mon expérience sur les ateliers (workshops) de la conférence TIA, édition 2011 auxquels j’ai pu assister début novembre à Paris. |
GWC 2012 : Onyme présente un article sur l’enrichissement de connaissances spécifiques par des ressources généralistes21 novembre 2011Après un article sur la fouille d’opinions, présenté l’année dernière à la conférence RECITAL à Montréal (Canada), je présente en début d’année prochaine, un second article scientifique (et premier en conférence internationale). Cet article est présenté dans le cadre de la conférence GWC, édition 2012 qui se déroulera à Matsue (Japon). Quelques détails en avant première… |
|
Développé par le LADL, Laboratoire de Maurice Gross, Unitex est un logiciel de Traitement automatique du langage faisant appel à de nombreuses ressources linguistiques (dictionnaires tels que le DELAF) et permettant le traitement de gros corpus. Il permet d’effectuer des concordances de termes à partir d’expressions régulières ou de graphs (appelés aussi grammaires locales). Il est aujourd’hui maintenu par l’institut Gaspard Monde. |
Les ontologies informatiques : l’exemple par OWL et autres5 juillet 2011Suite à la publication d’un premier billet présentant le concept général d’ontologie, nous nous intéressons désormais à son existence concrète en tant qu’outil informatique. |
Quelques notions en analyse syntaxique15 juin 2011L’analyse syntaxique est un domaine de la linguistique assez riche et souvent confus. À partir d’un besoin de clarté en matière d’analyseurs syntaxiques et morphosyntaxiques, l’idée est venue de faire ce point, très certainement non-exhaustif, sur la terminologie du domaine théorique et applicatif (TAL) de la syntaxe. Les théories linguistiques sont nombreuses en matière d’analyse syntaxique où différentes écoles et formalismes se côtoient. Un autre billet de ce blog approche la syntaxe du point de vue de la grammaire formelle et des différents types d’algorithmes existants. Nous aborderons ici les autres notions de tagging, parsing ou chunking, de grammaires de constituants ou de dépendances et enfin d’analyse syntaxique de surface ou profonde. |
Présentation générale de la notion d’ontologie26 mai 2011Ce billet s’intéresse à la définition du terme ontologie. L’intérêt d’Onyme pour les ontologies n’est pas nouveau. En effet, d’autres articles proposent déjà des réflexions sur des ontologies existantes, notamment le Wolf et l’EuroWordnet. |
La R&D pilotée par les tests avec TestNG21 décembre 2010Dans un précédent billet, nous vous présentions notre démarche de R&D pilotée par les tests qui consiste à évaluer en continu les différents prototypes ou algorithmes mis au point pendant un projet de R&D. Dans ce billet nous allons utiliser un cas client pour illustrer la démarche et présenter les outils que nous avons utilisé. |
Grammaires formelles et analyse syntaxique des langues27 octobre 2010Billet sur les notions relatives à l’analyse syntaxique des langues et les grammaires formelles |
La R&D pilotée par les tests15 octobre 2010L’activité de Recherche et Développement consiste à mettre au point un produit ou un service qui répond à une problématique nouvelle. Ce produit (ou service) pourra être dit « innovant ». Onyme propose des « prestations » de R&D, plus particulièrement dans le domaine du Traitement Automatisé des Langues. Nos clients viennent nous voir avec des données (textes) et une problématique à résoudre et nous élaborons avec eux un plan de R&D. Ce plan inclue systématiquement une évaluation continue de la R&D. Dans ce billet nous vous présenterons notre démarche R&D pilotée par les tests. Un second billet viendra par la suite illustrer cette démarche avec un cas client et des exemples de codes. |