On ne vous apprendra rien si l’on vous dit que la Data a énormément pris de son importance dans les stratégies des entreprises. Et pour cause, ces dernières s’en servent pour analyser leur trafic, segmenter leur marché, optimiser leurs produits et services, créer de nouvelles features : bref, développer leurs activités. En parallèle, de nombreux entrepreneurs veulent ajouter à leur application web ou mobile une couche d’IA afin de réaliser ces mêmes optimisations.
Mais quel est l’environnement Data auquel il faut s’attendre ?
Un secteur en demande
Il est maintenant devenu courant pour toute entreprise, grande ou petite, de vouloir développer son activité par l’analyse de toutes les données qu’elle génère. Que ce soit pour réaliser des analyses de performances sur du très court terme, ou estimer / prédire des tendances sur le plus long terme, les professionnels de la Data sont en constante demande. D’autant plus avec l’incertitude que provoque la crise sanitaire, les entreprises comme tout type de structure ont besoin de se référer à des analyses poussées pour orienter leurs futures stratégies de développement.
Quanthub estime aujourd’hui qu’à l’horizon 2030, il manquera 85 millions de spécialistes pour répondre aux besoins mondiaux en 2030. De la même manière, le World Economic Forum a établi les listes des métiers en demande croissante sur le marché, devinez quel type de poste se retrouve sur le haut du peloton ?
A côté de besoins croissants pour les organisations, ceux-ci se précisent. Le secteur de la Data se spécialise, les métiers aussi. Car outre les célèbres Data Scientists, Data Engineers, & Data Analysis, nous voyons émerger de nouveaux métiers dont les compétences couvrent différents pans d’un projet Data.
Comment se structure un projet Data ?
Si l’on parle très souvent de Machine Learning et Deep Learning, vous verrez bien assez tôt que ces phases ne constituent qu’une partie d’un projet Data. En voici donc les 4 grandes étapes pour mieux comprendre et vous situer :
- La collecte : pas de projet Data sans donnée ! Il vous faudra collecter la donnée pour la stocker avant toute manipulation. Vous utiliserez sûrement des outils Cloud tels que ceux d’AWS (Amazon Web Services) pour mener à bien ces phases de collecte et stockage. Vous devrez également vous confronter à des problématiques Big Data, afin de gérer un volume de données toujours plus conséquent.
- L’exploration : une étape visant à comprendre sa donnée. Avec des outils de Data Visualisation notamment, vous serez à même de tirer les premiers insights de votre base : quelle performance passée ? quelle variable est intéressante ?
- L’exploitation : la fameuse phase de Machine Learning & Deep Learning ! Prédire des phénomènes ou événements, classifier des éléments, tel est le but de ces sous-domaines de l’IA : construire à partir de données déjà existantes. A l’origine de vos résultats d’analyse, de prédiction, de classification ? Des modèles statistiques que vous créerez à partir des algorithmes les plus poussés de Machine Learning.
- Le déploiement : à quoi bon mener toutes ces analyses si ce n’est pas pour les partager au plus grand nombre, vos clients ou managers ? C’est à cela que va servir la phare de déploiement : rendre accessible votre application web sur laquelle vous avez implémenté votre modèle pour rendre accessible tous vos résultats de prédiction. Un exemple ? Déployer une application de recommandation de recette de cuisine 🙂
Quels métiers ? Quelles compétences ?
Ce qui reste le plus apprécié par les recruteurs : la transversalité des compétences. En tant que professionnel de la Data, vous ne serez pas cantonné à une seule mission. La data reste un secteur nouveau bien qu’il tend à se segmenter. De quels métiers de la Data parle-t-on au juste ? En voici quelqu’uns, qui englobent bien d’autres postes :
- Data Scientist : il interviendra notamment sur la phase d’exploitation de la donnée en développant de solides modèles de Machine Learning ou Deep Learning.
- Data Analyst : il lui sera notamment demandé de mener des analyses poussés sur des données existantes, afin d’orienter des décisions pour l’entreprises
- Data Engineer : il est le garant de tout le pipeline Data ! Il devra s’assurer que l’ensemble de la donnée soit accessible par tous, par les clients, et les collaborateurs de l’entreprise, un poste hautement technique. S’il intervient au tout début du projet en mettant en place l’infrastructure Data, il est également, selon l’entreprise en charge de la phase de déploiement
- Machine Learning Engineer : le MLE connaît extrêmement bien l’ensemble du pipeline Data, il maîtrise à la fois les méthodes les plus abouties de Machine Learning et Deep Learning, mais aussi les outils lui permettant de développer et déployer son application web.
- DevOps : l’ingénieur DevOps va faire le pont entre l’environnement de développement et l’environnement de production lors de la création d’un produit tech : une plateforme, une application par exemple.
Statistiques, programmation en Python, gestion de bases de données avec SQL, Data Visualisation compétences en Machine Learning & Deep Learning, en gestion de problématiques Big Data voire même en développement web, les hard skills appréciées pour ces métiers ne manquent pas, mais comment s’y former ?
Les meilleures formations Data
Masters, MOOCs, bootcamp, les formations Data ne manquent pas.
Un exemple pour chaque type de formation :
- l’ENSAE : l’école d’ingénieur proposant des formations longues (de 1 à 3 ans), pour maîtriser la théorie mathématique derrière la Data Science.
- Open Classrooms : vous serez en totale autonomie en suivant un MOOCs, vous pourrez monter en compétences sur des sujets précis
- Jedha Bootcamp : leur formation Data à temps partiel ou temps complet, intensive et orientée pratique dispose d’une pédagogie basée sur les projets Data. Ce sont non moins de 15 projets réalisés sur l’ensemble de leurs 3 programmes, et pas seulement en Data Science, mais bien sur l’ensemble du pipeline Data (Data Analyse, Data Science, Data Engineering etc), afin de rendre les profils de leurs élèves autonomes et opérationnels dès la fin de leurs formations.
Chacun des programmes peut être suivi à la suite d’un autre ou indépendamment, et est adapté au niveau de ses élèves (partant de 0, avec quelques bases ou avancé), de leurs objectifs professionnels et les attentes du marché en termes de compétences en Data. Enfin, l’aspect carrière restant important, tout un accompagnement est réalisé pour optimiser l’insertion de leur élève sur un marché du travail en constante évolution.
En conclusion, le secteur de la Data au sens large (pas seulement la Data Science) est en grande demande pour chaque poste. Mais les profils deviennent de plus en plus nombreux et se différencier sur le marché du travail reste vital. Pour cela, il existe aujourd’hui des écoles de type bootcamp comme Jedha proposant des formations de qualité, permettant de se former rapidement (le marché du travail évolue beaucoup, les technologies et outils aussi) tout en étant accompagnés.