À l’heure où les métiers de la donnée font régulièrement la une des journaux comme étant les plus prometteurs et rémunérateurs, il était temps d’apporter de la clarté dans cet univers… et de laisser parler les données !

Dans ce contexte, Datasama a construit une étude exhaustive, principalement diffusée sur LinkedIn, sur le marché de la Data en France.

Un questionnaire a été mis à disposition de la communauté du 15/01/2020 au 15/02/2020 via un site internet ouvert à tous. Sur le millier de réponses à celui-ci, 626 répondants sont basés en France et actuellement en poste, principalement à Paris.

Une majorité de jeunes Data Scientists parisiens

De nombreux métiers existent dans la Data. Certains ne datent que de quelques années, d’autres sont plus anciens. Sans doute grâce à l’effet “réseau” de la propagation de l’étude, l’écrasante majorité des répondants de l’étude se définissent comme Data Scientists ! On retrouve aussi des Data Engineers, des Data Analysts et des Data Architects.

Plus de la majorité ont moins de 5 ans d’expérience dans le domaine de la Data ! Rien de surprenant toutefois, ces métiers étant relativement récents, tout comme les formations qui y destinent.

Formation initiale ou reconversion ?

Il y a plus de cinq ans, Machine Learning, Deep Learning ou Data Engineering étaient totalement absents des formations d’ingénieurs ou universitaires. Il est donc intéressant de se pencher sur les profils ayant suivi une formation après la fin de leur cursus académique initial afin de monter en compétence sur ces nouveaux métiers. Ces profils reconvertis représentent 23.80% des répondants.

Rémunération par années d’expérience

Les profils juniors ayant moins de 2 ans d’expériences semblent débuter aux alentours de 44k€ / ans (package total).

Les rémunérations décollent véritablement au bout de 3-4 ans d’expérience, signe que les profils confirmés sont très recherchés alors que le vivier est toujours faible. Inversement, les formations nouvellement créées semblent rééquilibrer l’offre et la demande chez les juniors.

A noter, les rémunération ne sont pas foncièrement différentes pour les répondants en poste suite à leur formation initiale ou une reconversion.

Environnement technique

Sans surprise, Python est loin devant dans le classement et désormais incontournable chez les Data Scientists. Il est utilisé par 94.17% d’entre eux.
Pour les Data Analysts, SQL est leader avec 92.45% d’utilisation chez les répondants.

Les notebooks sont plébiscités dans toutes les catégories de métiers techniques (de 51% à 95% d’utilisation).
Les logiciels de statistiques incontournables des années 1990-2000 (SPSS, SAS) marquent très fortement le pas sur ces nouveaux métiers.

Quotidien des Data Experts

Ce n’est sans doute pas surprenant pour des “insiders” mais des étudiants ou des “outsiders” seront peut-être surpris… la tâche la plus chronophage d’un Data Scientists porte très clairement sur le travail en amont sur les données et non pas sur la sélection du modèle.

L’identification, le rassemblement et le nettoyage des données restent loin devant les autres missions ce qui place ces catégories loin devant dans le top des tâches.

Il est intéressant de constater que près d’un expert sur deux passe moins de 50% de son temps sur des tâches de développement.

Source : La Grande Étude Data, Édition 2020, Datasama

Categories: