La formation continue s’oriente vers le sur-mesure
⏱ 7 minLe Cnam, le CNRS, Microsoft IA, des start-up proposent des offres de formations spécifiques en data science conçues au plus près des besoins des entreprises, en présentiel ou à distance.
Outre les offres communes (inter-entreprises comme on dit), le Conservatoire national des arts et métiers (Cnam) et le CNRS se sont organisés depuis plusieurs années pour répondre aux besoins plus spécifiques de formation professionnelle avec des offres sur-mesure dites intra-entreprise. « Nous avons peu d’offres inter-entreprises en data science, précise Armel Guillet, directeur de Cnam Entreprises. Les salariés viennent plutôt se former seuls en cours du soir, dans ces domaines (voir l’article 3 de ce dossier “L’offre académique s’adapte”). En revanche, les entreprises nous sollicitent directement avec leurs problématiques, leurs besoins stratégiques et les évolutions de compétences qui en découlent. Souvent ces discussions font également intervenir les responsables des ressources humaines. Selon les métiers identifiés, nous proposons des parcours de formation sur-mesure. »
Adapter des formations existantes
Exemple avec Pro BTP, un groupe de prévoyance dans le secteur du BTP, qui a contacté Cnam Entreprises pour faire évoluer une vingtaine de ses informaticiens vers les big Data, la maîtrise de Map-Reduce ou de systèmes de traitement à grand échelle comme Spark ou Flink ainsi que de méthodes de data mining et d’apprentissage. « Nous avons adapté notre certificat de spécialisation « Analyse de données massives« habituellement dispensé en cours du soir à leurs besoins spécifiques et à leurs contraintes opérationnelles, explique Armel Guillet. Une partie des 184 heures de cours a été donné en présentiel, à Nice en l’occurrence, et 120 heures en formation à distance dans leurs locaux avec manipulation de jeux de données massives. Le tout sur cinq mois. Les modalités d’évaluation ont également été adaptées via des réalisations professionnelles liées à leur activité. »
Parmi les offres de formations standards qu’adapte le Cnam, il cite également les certificats de d’établissement de l’INTD (Institut national des techniques documentaires du Cnam) autour du management des données : la licence Pro Archives, médiation et patrimoine, qui forme à la gestion de patrimoine d’entreprise ou d’archives audiovisuelles (disponible en formation à distance) et enfin la formation bac + 5 de chef de projet en ingénierie documentaire et gestion des connaissances pour la gestion et le management de l’information (voir l’article « Et la gouvernance des documents ? « ). « Nous assurons également des interventions ponctuelles, sur 2 ou 3 jours, par exemple pour du perfectionnement autour de l’IA, ajoute-t-il, voire des interventions à l’étranger pour des administrations ou grandes institutions comme au Maroc où le Cnam est présent. »
Souplesse et économie
Pour beaucoup de salariés, il est difficile de trouver plusieurs jours pour se former. Dès lors, les entreprises sollicitent de plus en plus de formations numériques ou hybrides (présentiel et à distance), ce qui permet de limiter les déplacements et les coûts. « Nous faisons de plus en plus de Mooc d’entreprise en contextualisant nos propres Mooc notamment avec des experts maisons, ajoute Armel Guillet. Nous pouvons aussi y ajouter des modules présentiels comme une master class sur tel ou tel aspect ou un cas d’usage lié à l’entreprise. C’est particulièrement intéressant lorsqu’il y a des volumes importants de salariés de profils comparables. Cela donne aussi une dimension de social learning, et permet de constituer un socle commun. Nous avons des exemples réussis dans plusieurs domaines, mais pas encore en data science. »
Grâce à son maillage dans les territoires, le Cnam propose à de grands groupes une formation nationale (voire internationale) déployée localement si besoin, et cela pour des milliers de personnes. À l’inverse, pour des TPE/PME, des formations sont possibles dans ses 200 centres locaux d’enseignement (100 de plus ouvriront d’ici un an et demi dans des villes moyennes).
Profiter de l’expertise du CNRS
De son côté, depuis 1984, le CNRS a créé une structure dédiée à la formation continue, CNRS Formation entreprises, pour former ingénieurs, techniciens ou chercheurs extérieurs (entreprises et organismes publics). Ces formations de quelques jours sont assurées par le personnel du CNRS, avec une bonne part d’expérimentation, partout en France. Et la demande ne cesse de croître. Sur les 260 formations au catalogue en 2020, une bonne vingtaine concerne le machine learning, la data science ou le big data. Si l’on intègre également les formations en statistiques et informatique, près de 300 stagiaires les ont suivies en 2019, soit près de trois fois plus qu’en 2017, dans le cadre de plus de 70 formations, dont 10 sur-mesure.
Ce fût le cas de Bertin IT, éditeur de logiciels de cyberintelligence et cybersécurité. « Nous avions besoin de former une vingtaine de personnes sur les outils et méthodes d’apprentissage automatique adaptées au texte, explique Frédérique Segond, directrice des produits Intelligence. En outre, il nous fallait trouver une formation adaptée à un public hétérogène, mêlant beaucoup d’ingénieurs et quelques docteurs : certains avaient déjà fait du traitement du langage naturel, d’autres connaissaient quelques algorithmes, etc. »
Estimant les offres de formation en technologies numériques trop généralistes et coûteuses, elle trouve exactement la formation qu’elle cherche via CNRS Formation Entreprises : Deep Learning pour le traitement automatique des langues. « Nous avons choisi de faire deux sessions de formations respectivement pour une quinzaine et une dizaine de stagiaires, sur deux journées, en fonction de nos besoins (au lieu de 3 jours au catalogue), se rappelle-t-elle. Tout se discute ! J’ai beaucoup échangé avec l’enseignant au sujet des profils de nos salariés pour qu’il fasse des rappels sur le machine learning, les réseaux de neurones. Ensuite, il s’est focalisé sur la librairie spécifique que nous utilisons au quotidien et le langage naturel. Il les a beaucoup fait manipuler ; chacun avait son ordinateur. Cela a répondu à notre besoin, à un prix compétitif. »
Développer des formations en partenariat
Pour sa part, Orange s’est associée à Microsoft pour créer l’École IA Microsoft et développer les compétences en IA. Opérée par Simplon, cette école propose une formation à un métier d’avenir, développeur data IA, à des personnes en reconversion ou éloignées de l’emploi. La première promotion « Orange » est en cours de formation depuis mars 2019. « Nous avons besoin de ces nouveaux profils, précise Anne Beaugendre, directrice d’Orange Campus Data IA. Nous avons choisi d’accueillir certains de ces élèves dans nos locaux dans un lieu d’apprentissage dédié. Ingénieur du bâtiment, professeur de maths, issus d’écoles de commerce, jeune bachelier…, ils sont 23, de 18 à 53 ans, de neuf nationalités différentes, soutenus par Pôle Emploi. Outre des prérequis en mathématiques et en programmation, nous les avons choisis selon leur motivation, leur capacité à apprendre et à coopérer. Après sept mois de formation, ils sont depuis novembre 2019 en contrat de professionnalisation dans nos équipes (avec une semaine par mois en formation). Et nous réfléchissons à lancer une autre promotion en dehors de l’Île-de-France »
Former des machine learning ingénieurs en CDI
Autre modèle de formation conçue pour coller aux besoins des entreprises, celui de Yotta Academy, en lien étroit avec le cabinet de consultants en IA Quantmetry. Proche du modèle du Wagon (formations intensives en développement web et en data science), Yotta Academy propose de former des machine learning ingénieurs en quatre mois et demi avec un CDI garanti. « Nous sommes partis du constat que beaucoup d’entreprises freinent le recrutement de profils juniors, malgré leurs grandes compétences théoriques, au profit de la formation de ressources en interne ; elles éprouvent en effet de grandes difficultés à sortir de l’approche en mode POC (Proof Of Concept) pour passer à l’échelle, résume Sacha Samama, CEO de la start-up. De leur côté, beaucoup de data scientists ne se sentent pas légitimes, car ils n’ont travaillé dans leur cursus que sur des cas d’école et manquent d’expérience terrain. Au cours de notre programme d’excellence, sorte de MBA technique avec beaucoup de projets sur des données métier, nous formerons ces data scientists augmentés, capables d’industrialiser des modèles de machine learning en leur apportant la compétence de développement logiciel (en python principalement). » Les deux premières sessions (vingt élèves par promotion) sont prévues en mars et octobre 2020.
Originalité du modèle, la start-up recrute les candidats selon les besoins de son vivier d’entreprises, qui quant à elles s’engagent en finançant la formation à hauteur de 9 000 euros (7 000 euros restant à la charge de l’élève) et en garantissant un CDI. Une façon de faire converger deux besoins, via des job dating préalables, et de faire cofinancer la formation. « Environ 30 % de notre cible sont des docteurs en astrophysique, biochimie, physique, bio-informatique, géologie, etc., qui ont l’habitude de manipuler des données, mais ne trouvent pas de travail, ou se sont rendus compte qu’ils adoraient la modélisation et décident de se re-skiller [actualiser leurs compétences, NDLR], précise Sacha Samama ; 30 % sont des salariés de la finance ou l’actuariat en reconversion, ou encore des data analysts senior qui veulent aller vers la technique ; et 30 %, des étudiants en sortie d’école d’ingénieur ou d’université qui ont compris que leur plus-value se jouera désormais sur des compétences de développement. » Pas de doute : la formation continue a le vent en poupe.
Créer les plateformes personnalisées de formation
Pour répondre aux besoins des grands groupes qui veulent faire évoluer plusieurs dizaines de salariés du point de vue théorique, et pratique, selon leurs propres choix stratégiques, leurs langages, leurs formats de données, trois anciens étudiants de Dauphine ont créé fin 2016 DataScientest. La start-up compte déjà vingt collaborateurs. « Nous déployons des environnements de formation sécurisés et personnalisés qui donnent accès à des ressources cloud conséquentes, explique Yoel Tordjman, CEO de DataScientest. Le corpus pédagogique, souvent cocréé, est adapté à l’entreprise, avec des briques pratiques qui vont jusqu’au POC (Proof of concept) voire à la mise en production sur ses propres cas d’usage. Le cursus moyen comporte 180 à 200 heures et, point important, chaque module est validé par un test, là encore en environnement de travail réaliste, avec des données métiers. Nos plates-formes sont d’ailleurs également utilisées par les entreprises, pour auditer des candidats en phase de recrutement en les testant en environnement réaliste. »
La start-up a déjà formé plus de 1 000 Data Analysts et Data Scientists d’une trentaine de groupes ou d’institutionnels, comme Pôle Emploi ou la Mairie de Paris, et conçu plus de 1 500 heures de cours de tout niveau, de l’acquisition de données à la mise en production. « Notre offre répond aux besoins des entreprises, justifie Yoel Tordjman. Elle s’effectue surtout à distance, ce qui permet de la déployer sur différents sites à moindre coût, et de s’adapter aux disponibilités de chacun, avec néanmoins un coaching, d’abord collectif, puis par projet, dans le but d’atteindre un taux de complétion de 100 % quand les Mooc ne sont terminés qu’à 20 ou 40 % (voir l’article 1 de ce dossier “L’autoformation en data science par les Mooc”). » Les formations peuvent donner lieu à une certification délivrée par l’université Paris-Sorbonne et DataScientest en conçoit également en partenariat, comme avec l’Institut des actuaires ou les académies mises en place par les groupes Safran ou Allianz. La start-up devrait bientôt être éligible au CPF (Compte personnel de formation) pour des formations individuelles. Outre ses offres de Boot Camps classiques (Data Analyst, Data Scientist, et depuis quelques mois Data Ingénieur), elle propose des Boot Camps transverses, mêlant les compétences de ces trois métiers.