Data Analyse
De la donnée brute à l'information stratégique
En quoi consiste la data analyse ?
Un processus itératif pour extraire des connaissances à partir de données
1
Collecte des données
Acquisition des données depuis diverses sources (bases de données, API, fichiers CSV/Excel)
2
Nettoyage des données
Suppression des erreurs, gestion des valeurs manquantes et normalisation des formats
3
Exploration des données
Statistiques descriptives et visualisations pour comprendre les relations entre variables
4
Analyse statistique
Tests d'hypothèses et identification des relations importantes
5
Visualisation
Présentation des résultats sous forme de graphiques et tableaux
6
Interprétation
Tirer des conclusions pertinentes et formuler des recommandations
Statistiques descriptives
Outils utilisés pour résumer et analyser les caractéristiques principales d'un jeu de données

Mesures de tendance centrale
- Moyenne : Somme des valeurs divisée par le nombre de valeurs
- Médiane : Valeur séparant la moitié inférieure et supérieure
- Mode : Valeur apparaissant le plus fréquemment

Mesures de dispersion
- Variance : Mesure de la dispersion par rapport à la moyenne
- Écart-type : Racine carrée de la variance
- Étendue : Différence entre valeur max et min

Visualisation
- Histogramme : Fréquence des données par plages de valeurs
- Boxplot : Visualisation des quartiles et valeurs aberrantes
Analyse Univariée et Bivariée

Analyse univariée
- Étude d'une seule variable à la fois
- Décrit et résume la distribution
- Utilise histogrammes et boxplots
- Exemple : Distribution des salaires

Analyse bivariée
- Examine la relation entre deux variables
- Corrélation de Pearson
- Régression simple
- Nuages de points (scatter plots)
Tests Statistiques

Tests de significativité
- Test t : Compare les moyennes de deux groupes
- Test de chi-carré : Teste l'indépendance entre variables catégorielles
- ANOVA : Compare les moyennes de trois groupes ou plus

Analyse de corrélation
- Corrélation de Pearson : Mesure la relation linéaire
- Valeurs entre -1 et 1
- Exemple : Relation taille/poids
Autres méthodes d'analyse

Séries temporelles
- Analyse de données chronologiques
- Identification de tendances
- Détection de cycles saisonniers
- Repérage d'anomalies

Segmentation
- Division en groupes homogènes
- Par comportement d'achat
- Par caractéristiques démographiques
- Analyse ciblée par segment

Prévisions simples
- Moyennes mobiles : Lissage des fluctuations
- Régression simple : Prédiction basée sur une variable