DES RESSOURCES ET DES OUTILS AU SERVICE DES ACTEURS ET DES PROFESSIONNELS. |
Data | Nettoyer des donnéesDate de mise à jour : 29/10/2024
| Identifiant OffreInfo : 02_202003081063 |
Cap Métiers Nouvelle-Aquitaine |
• Importer des données avec Pandas depuis diverses sources.
• Comprendre la structure et la distribution des données.
• Supprimer les doublons.
• Gérer les valeurs manquantes par imputation.
• Identifier et traiter les valeurs aberrantes.
• Normaliser les données.
• Convertir les données catégoriques.
• Explorer les relations entre les variables.
• Analyser les tendances temporelles.
• Préparer les données pour l'analyse avancée et la visualisation.
Module 1: Importer des Données
Utiliser Pandas pour importer des données depuis différentes sources.
Maîtriser l'importation de fichiers CSV, Excel, bases de données, etc.
Module 2: Comprendre les Données
Explorer la structure des données.
Identifier les types de variables et comprendre la distribution des données.
Module 3: Gérer les Doublons
Identifier et supprimer les doublons dans les jeux de données.
Module 4: Nettoyer les Valeurs Manquantes
Identifier les valeurs manquantes dans les données.
Appliquer des techniques de gestion des données manquantes, telles que l'imputation.
Module 5: Traiter les Valeurs Aberrantes
Identifier les valeurs aberrantes et comprendre leur impact sur l'analyse.
Appliquer des méthodes pour détecter et gérer les valeurs aberrantes.
Module 6: Normaliser les Données
Comprendre l'importance de la normalisation des données.
Appliquer des techniques de normalisation pour rendre les données comparables.
Module 7: Gérer les Données Catégoriques
Convertir les données catégoriques en formats appropriés pour l'analyse.
Explorer les techniques d'encodage et de gestion des catégories.
Module 8: Explorer les Relations entre les Variables
Utiliser des méthodes statistiques pour explorer les relations entre les variables.
Identifier les corrélations et les associations dans les données.
Module 9: Analyser les Tendances Temporelles
Identifier les composantes temporelles dans les données.
Appliquer des méthodes d'analyse temporelle pour comprendre les tendances.
Module 10: Préparer des Données Exploitables
Agréger, transformer et filtrer les données pour les rendre exploitables.
Préparer les données pour des analyses plus avancées et la création de visualisations.
Nous pouvons adapter et personnaliser le programme en fonction de vos besoins par des compléments.
N'hésitez pas à nous contacter pour ajuster le programme de votre formation !
Non certificiante
Information non communiquée
Conventionnement : Non
Autre
Niveau d'entrée : Sans niveau spécifique
Aucune