Formations en Big Data vs besoins réels des entreprises

S’il est maintenant avéré que les métiers du Big Data et leurs formations en grandes écoles sont en pleine expansion, les jeunes diplômés se retrouvent pourtant en décalage par rapport aux professionnels du secteur à la sortie de leur formation. Pistes d’analyse de ce phénomène.

Pour les futurs data scientists ou digital analysts, l’avenir semble tout tracé : un large choix de grandes écoles proposent des formations de qualité et de nombreux débouchés s’offrent à eux. Pourtant pour Nicolas Laroche, JEMS Group, certains aspects  de leur formation sont en dissonance par rapport aux besoins réels des métiers du Big Data. Entre autres accusés, l’absence de méthodologie et de bonnes pratiques.

Se former aux métiers du Big Data : un problème de méthodologie en France

Les futurs Chief data officier et ingénieurs en Big Data ont le choix du roi. Toutes les grandes écoles proposent une spécialité dans le domaine : data scientists, digital analysts… les écoles du campus de Saclay ont déjà intégré ces formations depuis quelques années (Master 2 Data Sciences). Les écoles de commerce et d’ingénieurs comme ParisTech ou l’Ensimag ont elles aussi intégré ces formations depuis quelques années (Master 2 Data Sciences) et l’IESEG sort son cursus Big Data Analytics for Business.

Nicolas Laroche fait le point sur ces cursus : « Ce que nous avons remarqué c’est qu’à la sortie des écoles, les élèves ont bien acquis des compétences techniques, ils ont étudié les nouvelles technologies, mais à côté de ça ils manquent de compétences projet et de bonnes pratiques. »

Beaucoup d’entreprises s’attardent aujourd’hui sur l’absence de compétences techniques notamment sous Hadoop ; les écoles commencent donc à former leurs élèves sur les technologies de distribution (Cloudera, MapR …) et autres fonctionnalités complémentaires (via Spark, Hive…). « Du coup, ce n’est pas un problème de compétences techniques, précise Nicolas Laroche. Appréhender une nouvelle technologie n’est pas une problématique en soi pour une population d’ingénieurs. C’est la méthode qui pose problème, l’organisation des bonnes pratiques de conception et de mise en œuvre. »

Ce n’est donc pas en connaissant parfaitement le data mining que les étudiants seront opérationnels. « Il leur manque des compétences projets, notamment par rapport aux problématiques des clients, et sont en décalage avec le marché des professionnels du milieu du Big Data. »

Une culture exacerbée de l’open source

« Les étudiants sortis d’écoles ont un aspect « techno-geek » plus prononcé que les professionnels. »

En effet, les entreprises spécialisées dans le Big Data ne travaillent pas encore avec les technologies étudiées en écoles, même si elles vont être intégrées en interne dans un futur proche. Ainsi, nous avons peu de professionnels en France capables de les manager correctement, ce qui crée un décalage avec le business.

De plus, la culture de l’open source est exacerbée dans les instituts. « C’est l’écosystème qui veut ça. Mais ils ne sont pas formés à la manière d’employer ces technologies. Ils n’ont pas de vue d’ensemble du processus, pas de bonnes pratiques qui, elles, restent à écrire. »

Pour les étudiants, l’open source est synonyme de gratuité et de collaboratif, très attirant pour développer des solutions ; mais lorsqu’on utilise une technologie open source pour répondre à une problématique professionnelle, le manque de support et la fragilité de ces technologies (durée de vie) peuvent être déterminants quant au succès du projet. Il est préférable de choisir une technologie de distribution fiable telle que MapR qui pourra faire face à des bugs que l’on rencontre à coups sûrs. « De plus, il faut respecter les contraintes de l’IT ». Les futurs professionnels ne sont pas préparés à faire face à ces difficultés.

Remettre en cause les bonnes pratiques de la BI : un enjeu important

Les étudiants ont donc des compétences techniques et apprennent de bonnes pratiques avérées. Cependant, il leur faut apprendre à rechallenger ces bonnes pratiques, ce qui ne leur est pas forcément enseigné en institut.

Un exemple : il y a encore quelques années, monter une base de données relationnelle en étoile avec des tables spécialisées était une bonne pratique dont les raisons étaient connues ; utiliser une telle base de nos jours dans le Big Data n’est plus pertinent, mais il reste à expliquer pourquoi ce changement aux nouvelles générations. Les technologies Big Data reposent sur des plateformes en cluster. Ces architectures distribuées peuvent être un avantage, mais également se muer en inconvénient : elles peuvent nécessiter de reconsidérer des jointures pour recroiser les données, et souffrir d’une perte de performance alors qu’elles sont justement choisies pour ça.

« Ce n’est pas naturel, déclare N. Laroche. Les étudiants n’ont pas forcément les capacités à remettre en question ce qu’ils viennent d’apprendre à l’école et ainsi définir les nouvelles bonnes pratiques à appliquer sur les projets actuels ; et ce n’est pas avec un POC […] qu’ils pourront développer les bons réflexes.»

Les formations proposées ont donc tout intérêt à se développer en adéquation avec les besoins et les contraintes des entreprises afin de répondre au mieux aux attentes des professionnels et du business.

Partager :
Partager sur Twitter
Partager sur LinkedIn
Partager par email