L’activité de Recherche et Développement consiste à mettre au point un produit ou un service qui répond à une problématique nouvelle. Ce produit (ou service) pourra être dit « innovant ».

Onyme propose des « prestations » de R&D, plus particulièrement dans le domaine du Traitement Automatisé des Langues. Nos clients viennent nous voir avec des données (textes) et une problématique à résoudre et nous élaborons avec eux un plan de R&D. Ce plan inclue systématiquement une évaluation continue de la R&D.

Dans ce billet nous vous présenterons notre démarche R&D pilotée par les tests. Un second billet viendra par la suite illustrer cette démarche avec un cas client et des exemples de codes.

Les conférences TALN, RECITAL et DEFT, éditions 2010, ont eu lieu à Montréal au Canada du 19 au 23 Juillet 2010. Petit compte rendu de cette expérience enrichissante.

Onyme a obtenu du ministère de l’enseignement supérieur et de la recherche la décision d’agrément qui reconnait sa capacité à mener des travaux de R&D éligibles au titre du Crédit Impôts Recherche (CIR) pour le compte de sociétés.
Tour d’horizon des bénéfices de l’agrément CIR et quelques conseils pour la rédaction du dossier de demande d’agrément

Nous allons nous intéresser à deux techniques largement employées dans le cadre de l’analyse sémantique : La lemmatisation et la racinisation parfois appelée stemmatisation. Nous verrons notamment quelques outils utiles à connaître dans le cas du Français.

Ce billet fait suite à celui introduisant le droit des brevets en France. Dans celui ci, il sera question d’un cas particulier que nous n’avions que peu abordé dans le premier billet : le cas de la brevetabilité des logiciels. Il s’agit là d’une question essentielle pour Onyme et pour les logiciels qu’elle développe. C’est pourquoi nous aborderons également le positionnement de la société par rapport à ces brevets logiciels.

Cet article inaugure la catégorie « Conférences » du blog par la présentation de la conférence Recital 2010 à laquelle la société va participer à travers mon article « Représentation vectorielle de textes courts d’Opinions. Analyse de traitements sémantiques pour la fouille d’opinions par clustering » accepté au format poster.

Droit des brevets

17 mai 2010

Cet article inaugure la catégorie sur la propriété intellectuelle et industrielle par le droit des brevets. Nous y verrons notamment ce qu’est un brevet industriel dans le droit français et quelles sont les démarches à effectuer auprès de l’Inpi pour déposer un brevet. Nous verrons également les contraintes que cela entraîne.

EuroWordnet est un projet visant à construire des ontologies similaires au projet Wordnet de l’université de Princeton pour 8 langues européennes dont le français. Cet article présente l’étude qui a été faite sur l’ontologie réalisée pour le français.

Le WOLF (Wordnet Libre du Français) est une ontologie développée pour le français par l’Inria.
Cette ontologie est en licence libre et est développé depuis 2008 à partir de la traduction du Wordnet de Princeton, développé pour la langue anglaise.
Dans cet article, il est question de l’étude plus approfondie de cette ressource.

Une ontologie dans son sens le plus large est une structure en forme de graphe permettant d’exprimer des connaissances.
Dans cet article, nous voyons ce qu’est une ontologie. Nous présentons ensuite Wordnet qui est une ontologie de référence pour la langue anglaise, puis le projet Eurowordnet visant à construire des ontologies dérivées de Wordnet pour les langues européennes. Enfin, nous voyons le WOLF, Wordnet libre pour la langue française. Nous voyons notamment en quoi nous l’avons modifié pour qu’il corresponde à nos besoins.