Le futur de l'industrie

Le blog de Vincent Champain

Comment trouver le meilleur emploi de datascientist

Publié le

Comment trouver le meilleur emploi de datascientist

Datascientist : portrait robot

Chargé de "trouver l’aiguille de valeur dans les bottes de données", le datascientist maîtrise à la fois les outils, les méthodes nécessaires, et leur application à son domaine de spécialité. Les outils utilisés sont des langages informatiques – Python est le plus utilisé - et des environnements facilitant l’écriture de code ou l’accès aux données (Jupyter, RStudio,…). Ce sont enfin des "frameworks"  (outils ou composantes logicielles) permettant de mettre en œuvre ces méthodes. Le plus utilisé est français (scikit).

Frameworks (source : Kaggle 2019)


La datascientist maîtrise enfin des méthodes de traitement de données mathématiques ou informatiques. Certaines sont anciennes (la régression linéaire, qui remonte à 1755), d’autres plus récentes se sont développées avec la démocratisation de capacités de calcul intensives.


Méthodes utilisées en datascience (source : Kaggle, 2019)



Les datascientists ont souvent un titre qui n’est pas celui de datascientist (25% des cas seulement) – ils peuvent être ingénieurs de recherche, développeur informatique, statisticien, actuaires…

Ils disposent enfin d’un diplôme d’ingénieur ou d’un master dans 50% des cas, et d’une thèse dans 25% des cas. Le profil précis varie selon le secteur et le type de projets : certains cabinets de conseil proposent des "datascientists" dont les compétences se limitent à paramétrer des outils, alors que le rôle correspondra ailleurs à des experts disposant d’une connaissance métier (physique, mécanique…) associée à une connaissance des méthodes suffisamment fine pour en connaître les limites ou les adapter à des cas complexes.

Ce qu’ils font vraiment

Les datascientists ne sont pas des magiciens capables de transformer immédiatement toute donnée en or. Tirer la valeur des données suppose en général trois phases, et beaucoup d’entreprises obtiennent des résultats décevants en négligeant la première et la dernière :
- L’origination des cas, qui consiste à réaliser un premier tri des cas d’usages et des données ayant une chance raisonnable de fournir des analyses intéressantes. Cette tâche est souvent réalisée non par des datascientists, mais par des équipes en charge des opérations ou de la performance. La plupart des cabinets de conseil séparent les consultants "classiques", chargés de cette partie, des datascientists qui n’interviennent que dans un deuxième temps ;
- L’analyse, qui vise à confirmer la possibilité ou non de réaliser des analyses utiles, puis à construire le modèle permettant d’automatiser cette analyse ;

- La mise à l’échelle, qui rendra le modèle réellement utile, en l’intégrant à un logiciel et en mettant en place les actions nécessaires (évolution d’un processus ou d’une organisation, création de nouveau business, …).


Ce que font les datascientists (source : Kaggle, 2019)



La grande majorité des datascientists travaille sur des problématiques liées au marketing ou à la finance. L’industrie ("manufacturing and mining"), et la santé/pharmacie, qui ont été un peu plus tardifs à valoriser leurs données,  offrent des potentiels de développement très importants dans les années à venir.


Principaux secteurs recrutant des datascientists
Source : KDnuggets

Les équipes de datascientists sont souvent de très petite taille : aux Etats-Unis, elles font moins de 5 personnes dans 45% des cas, et plus de 20 dans 25% des cas.

Combien et où ?

Selon linkedin, 2 300 personnes se déclarent "datascientists" sur Paris (certains profils de chercheurs capables de tenir ce rôle n’inscrivent pas ce mot clef sur leur profil, mais d’autres l’ajoutent après avoir suivi une formation en ligne). Ailleurs, l’offre est nettement plus limitée : on n’en compte que 150 sur Lyon.

En France le salaire est de l’ordre de 50 000 euros pour un débutant (loin des sommets américains, à environ 150 000 $). Il peut dépasser 100 000 euros pour un professionnel très expérimenté capable de traiter des modèles complexes et d’encadrer une équipe, et atteindre des montants beaucoup plus élevés pour un chercheur de renommée internationale dirigeant le laboratoire d’une multinationale.

Vu du salarié, le poste idéal devra concilier :

- Des jeux de données importants associés à des enjeux de performance ou de qualité. Si l’analyse des données ne peut apporter qu’un bénéfice mineur à l’entreprise par rapport aux efforts commerciaux, le rôle du datascientist y sera moindre ;
- Un engagement dans la durée sur ce type de profil : seront-ils réduits au premier retournement de conjoncture ou le jour où les clients les développent en interne ? le data scientist est-il une simple "ressource" ou au contraire au cœur de la valeur de l’entreprise. On regardera notamment l’organisation (à quel niveau de l’entreprise sont rattachés les data scientists ? l’expertise est-elle aussi valorisée qu’un rôle commercial ou de chef de projet ?) ou l’organisation (qui initie les projets et les négocie avec le client interne ou externe ?) ;
- Des moyens de calcul importants – même si on peut y accéder par le cloud, le fait que ces moyens existent est un bon indicateur de la maturité de l’entreprise – et une capacité de R&D (taille et positionnement, partenariats actifs avec de grands centres) capable d’aider le data scientist à progresser dans sa connaissance des outils ;
- La maturité de l’entreprise par rapport à ces questions : veut-elle répondre à une demande de clients qui "veulent du big data" sans plus de vision, ou a-t-elle au contraire une vision claire de la façon de valoriser ses datascientists sur des cas à valeur ajoutée ? La personne responsable de l’équipe a-t-elle un positionnement et une compréhension des enjeux suffisamment solides pour assurer un accès facile aux données, et une capacité à intégrer les modèles dans des applications internes ou vendues aux clients ? 

En effet, les offres d’emploi de datascientist sont nombreuses, et ce sont plus souvent les candidats qui choisissent leur entreprise que l’inverse !

Créez votre compte L’Usine Connect

Fermer
L'Usine Connect

Votre entreprise dispose d’un contrat
L’Usine Connect qui vous permet d’accéder librement à tous les contenus de L’Usine Nouvelle depuis ce poste et depuis l’extérieur.

Pour activer votre abonnement vous devez créer un compte

Créer votre Compte