Permettre aux participants de se reconvertir en spécialistes en data engineering, en acquérant les compétences nécessaires pour concevoir, construire et gérer des infrastructures de données robustes et évolutives.
Module 1 : Introduction au Data Engineering
- Fondamentaux du Data Engineering :
- Concepts clés, importance et rôles dans les entreprises.
- Architecture des Données :
- Conception et structure des systèmes de gestion de données.
- Outils et Technologies :
- Introduction aux outils de data engineering (SQL, Python, ETL tools).
Module 2 : Collecte et Ingestion des Données
- Sources de Données :
- Identification et utilisation des différentes sources de données (bases de données, APIs, web scraping).
- ETL (Extract, Transform, Load) :
- Principes et techniques d'extraction, transformation et chargement des données.
- Streaming de Données :
- Introduction au traitement des flux de données en temps réel (Apache Kafka, Apache Flink).
Module 3 : Stockage et Gestion des Données
- Bases de Données Relationnelles et NoSQL :
- Conception, gestion et optimisation des bases de données SQL et NoSQL (MySQL, MongoDB, Cassandra).
- Data Warehousing :
- Conception et implémentation d'entrepôts de données (Amazon Redshift, Google BigQuery).
- Data Lakes :
- Mise en place et gestion de data lakes pour stocker des volumes massifs de données brutes (Hadoop, Azure Data Lake).
Module 4 : Sécurité et Développement Professionnel
- Sécurité des Données :
- Meilleures pratiques pour assurer la sécurité et la confidentialité des données.
- Automatisation et DevOps :
- Utilisation de scripts et outils DevOps pour automatiser les workflows de données.
- Préparation à la Carrière :
- Techniques de rédaction de CV, lettres de motivation et préparation aux entretiens pour le domaine du data engineering.
- Portfolio Professionnel :
- Création et présentation d'un portfolio de projets en data engineering.
Attestation de formation
Non certifiante
Sans niveau spécifique