Comment valoriser les innovations en data science ?
⏱ 6 min[vc_row][vc_column][vc_column_text]Deux mondes coexistent dans la valorisation des algorithmes et des données : l’open source et la propriété intellectuelle via le droit d’auteur, la licence de savoir-faire, d’utilisation, parfois le brevet, bien souvent le secret. Un choix difficile à faire, où tout dépend de l’objectif visé.
Commençons par la propriété intellectuelle (PI). « Les programmes informatiques ne sont pas brevetables en tant que tels, rappelle Matthieu Objois, mandataire en brevets européens du cabinet Regimbeau. En pratique, il est toléré de protéger l’enchaînement d’étapes de traitement de données du logiciel. Des dizaines de milliers d’algorithmes sont ainsi brevetés dans le cadre d’une application donnée, par exemple pour améliorer la bande passante d’un réseau de télécommunications ou le guidage dans l’aéronautique. » Pour les laboratoires qui travaillent sur des problématiques techniques comme les réseaux, la cryptographie, l’intelligence artificielle ou ceux qui créent des solutions matérielles comme les circuits programmables, le brevet peut donc être une solution de valorisation.
Identifier les brevets clés
Et en data science ? « Un brevet protège une fonction réalisée, poursuit Matthieu Objois. Il faut pouvoir démontrer l’innovation technique, les difficultés franchies, les astuces, ainsi que définir les domaines d’utilisation. » C’est particulièrement délicat dans la recherche publique, où l’objectif est de faire une science d’excellence, d’augmenter les connaissances, et où la question des domaines d’application des innovations n’est pas posée au départ. Les cas sont rares, mais ils existent, et s’il y a un élément brevetable, il faut breveter, insiste le conseiller en PI. Il cite un algorithme sur le mouvement de particules solides qui a pu être breveté, car applicable à l’industrie pétrochimique dans la modélisation du déplacement de nappes de pétrole. Attention néanmoins à ne pas se tromper de domaine d’application, on ne peut pas revenir en arrière.
« Il peut effectivement y avoir des brevets clés, confirme Jean-Marc Schmittbiel, chargé d’affaires valorisation à CNRS Innovation. Citons l’exemple de la compression MP3, qui s’est imposée comme standard de fichiers audio des baladeurs et autres smartphones, et a fait la fortune de l’Institut Fraunhofer. Toutefois il n’est pas facile de déterminer ces innovations clés. Des algorithmes à base de réseaux de neurones ou concernant le big data seront difficiles à breveter car trop théoriques. De manière générale, la science des données se prête peu aux outils classiques de valorisation, notamment parce qu’en matière de maintenance prédictive, d’apprentissage supervisé, les algorithmes s’adaptent sans cesse aux données. »
Sans oublier que cette protection d’envergure coûte cher (en honoraires et en taxes) et prend plusieurs années, alors que ces innovations évoluent extrêmement rapidement. Difficile de prévoir l’impact de ces solutions dans cinq ou dix ans ! Dans les faits, le plus souvent, le CNRS valorise ses logiciels via des licences d’utilisation ou d’exploitation (il en autorise ainsi l’utilisation après signature d’un contrat et paiement d’une redevance). Mais il faut pouvoir valider le fait que l’équipe qui a développé le logiciel est la seule à l’avoir fait et n’a utilisé aucune brique logicielle de tiers.
Faire valoir son droit d’auteur
« Dans tous les cas, chacun peut faire valoir son droit d’auteur, qui existe dès qu’on tape des lignes de codes comme pour n’importe quel écrit, sans aucune formalité, ajoute Matthieu Objois. Ce droit protège cette fois la forme d’expression, autrement dit la rédaction du programme informatique. Mais il faut pouvoir prouver qu’on en est l’auteur. On conseille aux chercheurs de prendre date au fur et à mesure qu’ils développent leur programme en enregistrant des versions successives sur un CD ou une carte SD, en déposant une enveloppe à l’INPI, ou même en s’auto-envoyant des plis cachetés, voire en enregistrant ces preuves chez un notaire ou à l’agence pour la protection des programmes (APP), solution très haut de gamme. »
Il mentionne également les cahiers de laboratoire, comme cela se pratique beaucoup en sciences de la vie avec un suivi par huissier. Ces cahiers existent désormais en version électronique. On y sauvegarde les lignes de code de la journée, transmises automatiquement à une autorité tierce. « Cette nouvelle pratique révèle une prise de conscience mais cette protection reste très faible en matière de logiciel, reconnaît-il. Un bon programmeur peut réécrire le code, changer la forme sans changer la fonction, ce n’est alors pas considéré comme de la contrefaçon, mais seulement comme du plagiat. »
[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_cta h2= » »]
Qui est titulaire des droits ?
Un brevet déposé à partir du travail d’un chercheur (ou de tout salarié) appartient à son employeur. Ces dispositions du code du travail ne couvrent pas le travail réalisé par un stagiaire ou un thésard, qu’ils soient les seuls contributeurs ou qu’ils y aient participé à l’innovation par exemple selon les directives d’un maître de stage. Pour s’assurer d’avoir les droits sur leur contribution, il faut que leur contrat stipule, noir sur blanc, que les droits de propriété intellectuelle sont cédés à l’entreprise, que ce soit en matière de brevet ou de droit d’auteur.[/vc_cta][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]
Entretenir la culture du secret
Troisième solution qui semble faire l’unanimité, en tout cas comme rempart à la contrefaçon : garder le secret, ne pas divulguer le code source, ou alors sous forme de boîte noire. Autrement dit, livrer le résultat, le programme exécutable, et non la solution, sinon entrer le moins possible dans le détail. C’est ce que font souvent les chercheurs qui travaillent sous contrat avec des industriels. Mais c’est loin d’être simple alors qu’ils doivent par ailleurs publier leurs résultats. « L’apport des chercheurs vient de leur créativité, fait remarquer Jean-Marc Schmittbiel. Cela pourrait se traduire par une licence de savoir-faire. Mais ce savoir-faire est, en général, partagé dans le cadre des partenariats industriels. C’est donc délicat à mettre en œuvre. »
« Dans le cadre de ces partenariats, il est important de s’assurer que tous les intervenants aient les mêmes obligations de confidentialité que les salariés, ajoute Marc Levieils, associé du même cabinet Regimbeau. Le problème se pose également lors des échanges et des visites entre laboratoires ou entre industriels. Les précautions doivent être prises en amont via des accords de confidentialité… qui sont très compliqués à délimiter, notamment pour éviter de brider les échanges. D’autant plus dans le cas d’un algorithme, dont la transmission peut être très rapide et la valeur ajoutée importante »
Ou à l’inverse, l’open source !
L’autre modèle de valorisation des algorithmes et des données, c’est l’open source (voir notre dossier sur l’open source), fondé sur le partage et la coopération. « C’est la règle pour nombre d’algorithmes de machine learning ou de logiciels d’intelligence artificielle, rappelle Jean-Marc Schmittbiel. Les chercheurs et les ingénieurs créent certaines briques et profitent de celles des autres. Pour favoriser les échanges et éviter les enchevêtrements de concessions de droits, ils travaillent sous licences libres de droit, cas de Hadoop, Spark ou Scikit-learn. C’est la ressource humaine, sa créativité et l’expertise de la mise en œuvre des algorithmes qui comptent. Les chercheurs paramètrent les algorithmes pour répondre à une question posée, un cas d’usage, pour une plateforme donnée, c’est là qu’est la valeur ajoutée. Or ces solutions ne sont pas forcément pérennes, elles comportent souvent des biais, sont amenées à évoluer, ce qui les rend encore plus difficiles à protéger. »
« C’est un modèle qui se développe énormément en ce moment, confirme Robert Marino, ex-responsable d’une business unit de la Société d’accélération du transfert de technologie (SATT) IDF Innov, cofondateur de Deeptech Founders, qui propose des programmes d’accompagnement aux chercheurs de laboratoires publics ou indépendants pour créer leur entreprise. L’expertise est la clé. Les entreprises souhaitent avant tout travailler avec les meilleurs laboratoires de recherche. Aux États-Unis, elles sont même prêtes à les financer sans condition sous réserve d’être informés de leurs innovations. On appelle cela « unrestricted grant ». Et les laboratoires les plus riches et puissants, comme Berkeley, négocient leurs conditions : ils se permettent de refuser un financement de 300 000 dollars pour une recherche sous forme de prestation, et préfèrent attendre 2 millions de dollars en unrestricted grant. »
Cette tendance commence à émerger en France dans le cadre de regroupements géographiques ou de chaires, même si les budgets ne sont pas comparables. « Ce modèle est vertueux, ajoute-t-il, dans le sens où les entreprises aident ainsi les laboratoires à être encore plus excellents. En contrepartie, elles attirent des étudiants qui travaillent sur leurs propres cas d’usages, leur apportant finalement les meilleures solutions et d’éventuelles futures recrues. »
Une question de stratégie
Il n’y a finalement pas de règle en matière de valorisation en data science, mais beaucoup de possibilités de protection qui peuvent aussi être combinées, dont l’open source ou le secret. « Il faut se poser la question de l’impact visé, poursuit Robert Marino, est-il financier ? sociétal ? Et l’on doit alors protéger l’innovation selon cet objectif, sans être dogmatique, pour créer le maximum de valeur. Parfois, il vaudra mieux faire payer l’algorithme à l’utilisateur, parfois lui fournir gratuitement mais récupérer les données générées, comme le font les laboratoires de séquençage de génomes avec les firmes pharmaceutiques. » Chaque cas est particulier.
Comme il aime à le dire : « Un algorithme développé dans un laboratoire public est souvent une solution qui cherche son problème ! » C’est notamment le rôle des SATT d’identifier les besoins des entreprises que ces solutions peuvent résoudre en évaluant l’impact des technologies, en veillant à la propriété intellectuelle, en engendrant des collaborations de recherche jusqu’à la création de start-up… « Ce qui est sûr, c’est qu’en matière de PI il faut avancer vite,martèle-t-il. En général, il n’est pas bon d’être deuxième ou troisième ! »
Et comme l’ont bien compris les américains, il ne faut pas négliger la valeur des données, fondamentale pour certains débouchés, on l’a dit. Selon les analyses du cabinet de conseil Brunswick, elle est clairement prise en considération aux États-Unis, dans une moindre mesure en Asie et peu en Europe (données 2015). Là encore, deux logiques existent : l’open data, choix de l’État français par exemple, ou le secret industriel, retenu par bon nombre d’entreprises.
Isabelle Bellin
[/vc_column_text][/vc_column][/vc_row]