Data analyst vs data scientist : quelles différences ?

L'intelligence artificielle et le machine learning se répandent à toute vitesse à travers notre société. Plus aucun secteur n'est épargné par le « Big Data », que ce soit le commerce, la gestion d'entreprise, la science, l'ingénierie, ou encore l'art ou le sport. Chaque action, chaque facteur dans chaque discipline est observé sous toutes ses coutures, analysé, décrypté et transformé en une montagne de données. Pour récolter et interpréter ces données, les fameuses data, les organisations ont recours à des travailleurs d'un nouveau type, les data analysts et les data scientists. 

On entend souvent ces termes, et nombreux sont ceux qui se disent « data scientist » pour se conférer une aura scientifique. Mais que font-ils exactement ? Une entreprise doit-elle engager un data scientist ou un data analyst ? Quels sont leurs carrières, leurs salaires ? Et comment devenir un data analyst ou un data scientist ? Dans notre article data analyst vs data scientist, nous présentons en détail ces deux professions et les enjeux de la data science. 

Qu'est-ce qu'un data scientist ? 

Comment un département commercial ou marketing peut-il déterminer au jour le jour les prix des produits de l'entreprise ? Jusqu'à 60 facteurs peuvent entrer en compte, beaucoup trop pour une seule tête pensante. Les informations sur ces facteurs, les datas, sont disponibles, encore faut-il développer des moyens pour les récolter et les utiliser. 

Le data scientist commence par analyser la demande : quel est le produit, quels sont les facteurs importants, quelles informations doivent être obtenues ? Ensuite, il développe des méthodes et des outils servant à récolter ces données, voire à les extraire de l'endroit où elles se trouvent. Il est donc responsable de la création, du maintien et de l'optimisation d'un véritable cadre de travail. C'est lui qui construit les algorithmes du machine learning, les teste, les améliore et les utilise. 

Data analyst : définition 

Faisant partie d'une équipe interdisciplinaire, le data analyst est en charge du traitement des données. Il doit collecter les informations, les trier, les nettoyer (éliminer les informations inutiles ou redondantes), et puis les organiser afin de les rendre utilisables. Ensuite, il passe à l'analyse de ces données dans le but de répondre à des questions précises, de résoudre des problèmes rencontrés par l'organisation commanditaire. 

Pour finir, le data analyst doit présenter les données et les résultats des analyses sous un format lisible et accessible. Son travail comporte donc un important volet communication, car de sa capacité à se faire comprendre du reste de l'organisation dépend la réussite ou l'échec de la mission. 

Différence entre data analyst et data scientist 

Comme nous avons pu le constater, les data analysts et les data scientists ne font pas exactement le même travail. En résumé, les data analysts traitent les données dans le but d'y trouver des réponses, tandis que les data scientists construisent des systèmes de récolte et d'analyse des données. Leurs travaux ne sont pas délimités par des barrières nettes, il y a des zones communes. Ci-après, nous plongeons plus en détail dans ces professions. 

Compétences 

Le data analyst doit forcément posséder de solides compétences analytiques. Il doit être capable de repérer des tendances, des trames dans un nuage d'informations. S'il peut utiliser son intuition, il doit bien évidemment aussi utiliser et maîtriser des outils d'analyse statistique. 

Comme le travail se déroule essentiellement sur ordinateur, le data analyst doit pouvoir travailler avec cet outil. Plus précisément, il doit avoir de solides compétences de codeur et maîtriser les codes Python, R, Julia ou SAS. Ces langages de programmation lui permettent de trier, nettoyer et analyser les données, et même de les visualiser. En outre, il doit aussi connaître SQL et Excel sur le bout des doigts, car les données sont toujours placées dans des bases de données complexes. Certains vont jusqu'à comparer les data analysts à des hackers. 

Le data scientist doit posséder des compétences similaires à celles du data analyst, c'est-à-dire la maîtrise des outils statistiques, des langages de programmation et des bases de données. Ce qui le différencie est sa capacité à utiliser les outils du machine learning et du deep learning. Un des outils d'analyse les plus connus est Spark. Il doit aussi maîtriser les régressions linéaires et logistiques afin de créer et d'améliorer des algorithmes utiles et performants. Pour ce faire, il doit avoir de solides connaissances en algèbre linéaire et en mathématiques, surtout concernant les fonctions à plusieurs variables. 

Responsabilités 

Dans notre comparatif data analyst vs data scientist, il apparaît que chacun a ses responsabilités propres dans le processus. Pour les organisations contemporaines, le Big Data devient une étape aussi importante que l'était l'utilisation de l'Internet dans les années 1990. Aujourd'hui, chaque PME a son site web, et demain les entreprises les plus performantes auront chacune leur processus d'analyse des données. Mais ce processus n'est pas le fait d'une petite cellule obscure remplie de matière grise, les organisations doivent se transformer pour adopter une culture « data friendly ». Il est alors primordial de connaître le rôle et les responsabilités de chaque acteur. 

Tout d'abord, il faut comprendre que chaque organisation utilise les data analysts et data scientists de manière différente. Ces métiers sont en train de s'hyperspécialiser. Néanmoins, il est possible de dégager deux domaines assez larges (pour ne pas dire vagues) permettant de les différencier. 

Le data analyst est souvent employé pour comprendre des événements passés. L'organisation souhaite savoir pourquoi ses ventes chutent, ou pourquoi elles décollent sans raison apparente… Le data analyst doit alors collecter toutes les données disponibles et les analyser pour y découvrir les réponses cachées. Ces réponses pourront ensuite être utilisées pour améliorer les processus de l'entreprise ou pour prévoir certains événements. 

Les analyses du data analyst sont multiples et variées. Il doit ainsi jongler avec les analyses diagnostiques, les analyses descriptives, les analyses prédictives et les analyses prescriptives. Les deux premiers types d'analyses servent donc à comprendre des phénomènes passés et repérer les éventuels problèmes, mettre un nom dessus pour ensuite lancer un processus de réparation et d'optimisation. Les analyses prédictives permettent de prévoir les futurs problèmes et, en cas d'impossibilité de les éviter, de prévoir à quel moment ils surviendront pour intervenir avant. Les analyses prescriptives, quant à elles, permettent de formuler des recommandations pour éviter la survenue de nouveaux problèmes, comme un médecin prescrivant de l'activité physique à son patient. 

Le data scientist, quant à lui, travaille surtout avec des modèles prédictifs : sa responsabilité est de prévoir ce qui va arriver, ou ce qui pourrait arriver en suivant certains scénarios. Pour ce faire, il crée des algorithmes et des méthodes de travail, qu'il renforce continuellement avec de nouvelles informations, des adaptations. Il doit même créer de véritables bibliothèques de techniques d'automation qui serviront ensuite à accélérer le travail pour le rendre plus efficace et efficient. 

Ainsi, le data scientist travaille plutôt sur base d'hypothèses. Il doit développer un cadre de travail complet permettant de prendre en charge toute évolution future, et c'est dans ce cadre que le data analyst viendra ensuite exercer ses talents propres. 

Les deux rôles se ressemblent dans un domaine de responsabilité très important : chacun doit être capable de communiquer avec le reste de l'organisation. Ils doivent maîtriser les outils de communication électronique, en particulier la mise en forme de tableaux et de présentations, pour partager les résultats de leurs travaux. Sans ce partage de résultats, le reste de l'organisation ne pourra pas implémenter leurs recommandations d'une manière pertinente. 

Formation 

Les data analysts et data scientists sont en forte demande et de nombreux cursus universitaires se développent en conséquence. Il existe deux méthodes pour obtenir un emploi dans ces rôles : soit obtenir son diplôme de data science, soit commencer par une carrière en entreprise et en économie après l'obtention d'un diplôme pertinent dans ces domaines. Beaucoup d'entreprises recherchent des candidats ayant eu une expérience intéressante avant de s'être tournés vers une formation ciblée. 

Il est important de comprendre cet aspect « expérience ». Dans le monde de l'entreprise, aussi bien le data analyst que le data scientist doivent s'intégrer dans des processus bien en place, soit pour les soutenir, soit pour les transformer. Ils doivent donc parfaitement comprendre ces processus de business. 

À l'heure actuelle, le parcours idéal partirait des diplômes Bac+3 ou Bac+5 suivants : marketing, mathématiques et statistiques, informatique. Une solide formation en business analyst est particulièrement recommandée pour les futurs data analysts, tandis que les data scientists auront plutôt tendance à avoir fait des études en économie, voire même obtenu un doctorat dans ce domaine. Ensuite, le candidat doit accumuler quelques années d'expérience au sein d'une ou de plusieurs entreprises, occupant des postes en lien avec leurs études. Ces années de travail leur permettront de se familiariser avec le monde de l'entreprise, de comprendre les processus en place, de repérer les forces et les faiblesses des structures et organisations. 

Ce n'est qu'après avoir obtenu ces diplômes et cette expérience que les aspirants data analyst et data scientist pourront apporter la touche finale à leur formation : le MBA en data science. 

Forts de cette formation de haut niveau, les aspirants pourront facilement se faire engager, voire réengager par un ancien employeur, et poursuivre une carrière fructueuse. Au cours du MBA en data science, ils auront appris à maîtriser les outils informatiques nécessaires (SQL, Excel, Python, R, Spark…) ainsi que les processus de travail les plus avancés. 

Pour tout aspirant n'ayant pas encore commencé son expérience professionnelle, un Bachelor en Data Science représente un intérêt tout particulier. Il pourra ainsi aborder sa future expérience avec un solide bagage et, surtout, une perspective déjà bien orientée. Au moment opportun, il pourra décider de franchir le cap du MBA en data science pour décrocher son emploi de rêve. 

Le Bachelor ou le MBA en data science peuvent également intéresser tout manager de demain souhaitant comprendre cette nouvelle discipline. Il pourra ainsi superviser au mieux la mise en place d'une « data culture » au sein de son entreprise, et gérer les nouveaux processus de travail dans lesquels s'intégreront les data analysts et les data scientists. Il est fort utile de rappeler que pour tirer le meilleur profit du travail sur les Big Data, une entreprise ne peut pas se contenter d'engager un data scientist. Elle doit transformer ses processus de travail et installer une véritable « data culture » au sein de laquelle chaque employé contribue à sa manière à la collecte des données, à leur communication et à l'implémentation des résultats de l'analyse. 

Data scientist vs data analyst : salaire 

Il existe une différence de niveau salarial entre data scientist et data analyst. Le data analyst part plutôt d'un niveau Bachelor (Bac+3) et peut raisonnablement espérer un salaire compris dans une fourchette entre 35 000 et 55 000 euros bruts par an, selon son expérience et le secteur dans lequel il travaille. Il est à noter que des data analysts de niveau Master sont de plus en plus recherchés. 

Partant d'un Master (Bac+5) voire d'un doctorat, le data scientist pourra, quant à lui, prétendre à une fourchette salariale annuelle entre 40 000 et 65 000 euros bruts. 

Pour les candidats à l'expatriation, le salaire est légèrement inférieur en Belgique (environ 5 000 euros de moins par an), et nettement supérieur en Suisse – bien entendu compensé par la différence du coût de la vie. Au Québec, le salaire est équivalent à celui en France, en revanche aux États-Unis, un data scientist peut facilement espérer 100 000 USD par an. 

En ce qui concerne l'évolution du salaire au cours de la carrière, il faut savoir que les data scientists peuvent très rapidement monter en grade. Après 5 ans de travail, ils peuvent devenir des lead data scientists, c'est-à-dire être responsables d'une équipe de data scientists. Même après un an ou deux, ils peuvent déjà se faire nommer chefs de projets. Plus loin, dans une entreprise correctement adaptée à l'ère du Big Data, les meilleurs data scientists pourront devenir Chief Data Officer. Dans ce cas, la rémunération dépassera les 80 000 euros annuels. 

 

Le data analyst, quant à lui, peut choisir entre deux évolutions possibles. Soit il se spécialisera dans le domaine de la data science et, après un MBA en data science, pourra devenir data scientist, avec les perspectives de carrière y étant associées. Sinon, il peut choisir de se tourner plutôt vers le domaine des affaires et devenir un business analyst très qualifié, un digital analyst ou un revenue manager.