Blog Onyme
La R&D pilotée par les tests15 octobre 2010IntroductionL’activité de Recherche et Développement consiste à mettre au point un produit ou un service qui répond à une problématique nouvelle. Ce produit (ou service) pourra être dit “innovant”. Onyme propose des “prestations” de R&D, plus particulièrement dans le domaine du Traitement Automatisé des Langues. Nos clients viennent nous voir avec des données (textes) et une problématique à résoudre et nous élaborons avec eux un plan de R&D. Ce plan inclue systématiquement une évaluation continue de la R&D. Dans ce billet nous vous présenterons notre démarche R&D pilotée par les tests. Un second billet viendra par la suite illustrer cette démarche avec un cas client et des exemples de codes. Dans R&D il y a RechercheLe principe de la recherche implique nécessairement une notion d’incertitude et le prestataire (Onyme) ne peut s’engager sur des résultats. Cela relève du bon sens mais aussi du cadre fiscal si le client déclare ses dépenses de R&D en vue d’un crédit d’impôt (CIR). En effet, nos clients ne pourraient en aucun cas déclarer nos prestations en Crédit Impôts Recherche, si nous sommes certains d’atteindre les objectifs demandés et que nous nous engageons contractuellement dessus. A l’inverse, ce n’est pas parce que la prestation ne définit pas clairement des objectifs qu’il s’agit de R&D : toute prestation que nous facturons fait apparaître la part de R&D. Le client peut donc reporter cette part dans ses dépenses “éligibles CIR” puisque nous avons obtenu l’agrément. Cela peut faire l’objet de contrôles, et s’il s’avère que nous surévaluons la part de recherche dans dans le projet, nous pourrions nous voir retirer l’agrément. Nous mettrions alors nos clients en difficulté qui pour l’Etat auraient “surestimés” leur dépenses de R&D éligibles au CIR. Le risque étant de devoir rembourser le crédit d’impôts, voir de payer une amende. Présentation de la démarcheS’il n’est pas permis de s’engager sur un niveau de qualité des traitements, il est en revanche permis (et conseillé) de s’engager sur une stratégie d’évaluation de ces résultats.
(traduction: vous n’avez perdu que 60% de la somme grâce aux réductions fiscales, et vous avez quand même un beau rapport de 200 pages) Chez Onyme, nous incluons contractuellement cette stratégie d’évaluation dans la démarche projet.
L’idéal étant de pouvoir automatiser l’évaluation du système et la génération des rapports… Difficultés et enjeux de l’évaluation
(source: http://www.aclweb.org/anthology-new/H/H94/H94-1018.pdf) Traduction: Dans le domaine du TAL, définir un bon un outil de mesure de la qualité du traitement est aussi complexe que la mise au point du traitement lui même, car cela revient (dans l’idéal) à résoudre la problématique en elle même. Dans cette citation de Karen Sparck Jones (merci à Benoît), le problème est alors comparé en terme de difficulté à celui d’échapper aux monstres Charybde et Scylla. L’évaluation doit, d’autre part, reposer sur un jeu de données. Celui-ci doit avoir les caractéristiques suivantes :
Le principal enjeu est d’impliquer le client afin de construire un jeu réaliste, car c’est lui qui maîtrise le mieux les données à traiter. La consitution du jeu de données initial ainsi que la solution d’évaluation automatique peu paraître fastidieuse au départ. Heureusement, avec Internet on ne part jamais vraiment de 0. Il existe de plus en plus de site qui partagent des données qui peuvent correspondre à la problématique de départ (au moins en partie). Un exemple avec : http://www.freebase.com/ ConclusionDans cet article nous enfonçons quelques portes ouvertes, mais ceci dans un seul but: montrer que l’évaluation continue doit faire partie intégrante du projet de R&D. Une fois opérationnelle, la solution d’évaluation continue apporte une vision globale sur les performances du système développé, permet d’évaluer les impacts de toutes modifications, de mesurer les progrès effectués… Au final elle permet de prendre consciencieusement LA décision vraiment importante : doit-on poursuivre l’investissement de R&D? Dans un prochain article, nous vous présenterons concrètement des outils, du code pour produire une solution d’évaluation qui rassure le client. |
[...] un précédent billet, nous vous présentions notre démarche de R&D pilotée par les tests qui consiste à évaluer en continu les différents prototypes ou algorithmes mis au point pendant [...]