Data Analyse

De la donnée brute à l'information stratégique

En quoi consiste la data analyse ?

Un processus itératif pour extraire des connaissances à partir de données

1

Collecte des données

Acquisition des données depuis diverses sources (bases de données, API, fichiers CSV/Excel)

2

Nettoyage des données

Suppression des erreurs, gestion des valeurs manquantes et normalisation des formats

3

Exploration des données

Statistiques descriptives et visualisations pour comprendre les relations entre variables

4

Analyse statistique

Tests d'hypothèses et identification des relations importantes

5

Visualisation

Présentation des résultats sous forme de graphiques et tableaux

6

Interprétation

Tirer des conclusions pertinentes et formuler des recommandations

Statistiques descriptives

Outils utilisés pour résumer et analyser les caractéristiques principales d'un jeu de données

Mesures de tendance centrale

Mesures de tendance centrale

  • Moyenne : Somme des valeurs divisée par le nombre de valeurs
  • Médiane : Valeur séparant la moitié inférieure et supérieure
  • Mode : Valeur apparaissant le plus fréquemment
Mesures de dispersion

Mesures de dispersion

  • Variance : Mesure de la dispersion par rapport à la moyenne
  • Écart-type : Racine carrée de la variance
  • Étendue : Différence entre valeur max et min
Visualisation statistique

Visualisation

  • Histogramme : Fréquence des données par plages de valeurs
  • Boxplot : Visualisation des quartiles et valeurs aberrantes

Analyse Univariée et Bivariée

Analyse univariée

Analyse univariée

  • Étude d'une seule variable à la fois
  • Décrit et résume la distribution
  • Utilise histogrammes et boxplots
  • Exemple : Distribution des salaires
Analyse bivariée

Analyse bivariée

  • Examine la relation entre deux variables
  • Corrélation de Pearson
  • Régression simple
  • Nuages de points (scatter plots)

Tests Statistiques

Tests statistiques

Tests de significativité

  • Test t : Compare les moyennes de deux groupes
  • Test de chi-carré : Teste l'indépendance entre variables catégorielles
  • ANOVA : Compare les moyennes de trois groupes ou plus
Corrélation

Analyse de corrélation

  • Corrélation de Pearson : Mesure la relation linéaire
  • Valeurs entre -1 et 1
  • Exemple : Relation taille/poids

Autres méthodes d'analyse

Séries temporelles

Séries temporelles

  • Analyse de données chronologiques
  • Identification de tendances
  • Détection de cycles saisonniers
  • Repérage d'anomalies
Segmentation

Segmentation

  • Division en groupes homogènes
  • Par comportement d'achat
  • Par caractéristiques démographiques
  • Analyse ciblée par segment
Prévisions

Prévisions simples

  • Moyennes mobiles : Lissage des fluctuations
  • Régression simple : Prédiction basée sur une variable