#9 - Le vocabulaire de base d'un Data Analyst
4 minutes pour devenir bilingue en Data Analyse
Lusik Nersesyan
11/14/20234 min read


Data Analyst LV1 (Crédits)
👋 Hello la communauté Dataque
💡Cette semaine, nous allons essayer de comprendre le vocabulaire utilisé par les Data Analysts.
Pour cet épisode, je vous laisse entre les mains de Lusik Nersesyan, Junior Data Analyst chez Dataque.
Les termes clés à retenir en Data Analyse
1. KPI (Key Performance Indicator) : Une mesure ou un indicateur clé de performance. C'est une valeur numérique qui permet de suivre et d'évaluer la performance d'un processus, d'un projet ou d'une entreprise. Pensez à un KPI comme panneau de contrôle d’une voiture. Lorsque vous conduisez, vous avez plusieurs indicateurs sur le panneau, tels que le compteur de vitesse, la jauge de carburant et le thermomètre.
“Ce KPI est biaisé” = Grosso modo, cela veut dire que le KPI n’est pas pertinent ou que regarder seulement ce KPI ne fait pas sens.
Exemple : Pour un site d’e-commerce, regarder seulement le trafic du site web pour évaluer sa performance ne fait pas sens. Plus de visiteurs sur votre site ne signifie pas automatiquement plus de ventes, le taux de conversion est aussi un indicateur clé qui doit être associé au trafic pour évaluer la performance d’un site web.
2. SQL (Structured Query Language) : Un langage qui aide les gens à dialoguer avec les bases de données. C'est comme une langue qui vous permet de poser des questions à une base de données et d'obtenir des réponses d'elle. Vous pouvez l'utiliser pour récupérer ou modifier des informations dans une base de données.
“Je fais une query pour te sortir les chiffres” = Je te fais un petit bout de code pour t’extraire les bons chiffres de la base de données.
3. Data visualisation/Data viz : La visualisation des données est la présentation des données sous forme visuelle, telle que des graphiques, des diagrammes et des schémas, pour aider les personnes à comprendre et interpréter l'information plus facilement. Tout comme une carte simplifie la géographie complexe d'une ville, la visualisation des données simplifie des données complexes. Les outils de data visualisation les plus souvent utilisés sont Power BI, Tableau, Looker Studio et Metabase.
4. Dashboard : Une interface visuelle qui centralise un ensemble de Data visualisations. Il offre une vue d'ensemble en un coup d'œil des éléments importants, permettant aux utilisateurs de surveiller, d'analyser et de prendre des décisions éclairées en fonction des données affichées.
Le lien entre les 4 définition du dessus: Vous définissez un ensemble de KPIs pour mesurer la performance de votre produit, le Data Analyst va récupérer les chiffres en faisant une query avec SQL, il crée ensuite des data viz qu'il va centraliser sur un Dashboard.
5. Analyse de données : L'analyse de données, c'est un peu comme résoudre un puzzle avec des chiffres et de l'information. Cela consiste à examiner des données pour trouver des solutions, tirer des conclusions et comprendre ce que les chiffres vous disent. Plus particulièrement dans le milieu business, l'analyse de données permet de trouver des solutions aux diverses problématiques auxquelles les entreprises font face.
Et quelques mesures statistiques essentielles :
Il ne faut pas être un expert en mathématiques pour devenir Data Analyst. La majorité des Data Analysts utilisent principalement des mesures statistiques simples telles que :
1. Moyenne : La moyenne montre la valeur typique ou centrale d'un ensemble de données. Cela permet d'obtenir une idée de la tendance générale des données.
2. Médiane : La médiane indique la valeur qui se trouve exactement au milieu d'un ensemble de données, une fois les valeurs triées par ordre croissant ou décroissant. Comparée avec la moyenne, elle donne une idée de la valeur centrale de l'ensemble, indépendamment des valeurs extrêmes. C'est pourquoi les data analystes s'appuient parfois sur la médiane.
“J’aurais plus tendance à prendre la médiane que la moyenne” Dans un ensemble de valeurs, la médiane permet d’éliminer les valeurs extrêmes en prenant la valeur du milieu, alors que la moyenne représente la somme des valeurs divisée par le nombre d'éléments et se voit potentiellement impactée par des valeurs extrêmes.
3. Distribution : La distribution montre comment les valeurs sont réparties dans un ensemble de données. Elle offre un aperçu visuel de la structure des données et de la manière dont elles sont groupées.
“Je pense qu’on peut regarder la distribution pour avoir une idée” Une distribution permet d'analyser la répartition des données pour obtenir une perspective plus complète que seulement la moyenne ou la médiane.
4. Écart-type : L'écart-type mesure à quel point les valeurs diffèrent de la moyenne. Plus il est élevé, plus les valeurs sont dispersées autour de la moyenne, plus il est faible, plus les valeurs sont regroupées autour de la moyenne.
Merci beaucoup pour votre lecture et à la semaine prochaine pour un nouvel article.
🚨 PS: Si tu as aimé cet article, n'hésite pas à t'abonner à notre newsletter et à nous suivre sur Linkedin pour ne rater aucune de nos aventures.