Expert en infrastructures de données massives

Autre titre inscrit sur demande au RNCP (niveau 7)

[Code Certif Info N°114987]
Type de titre / diplôme
Certification active
Niveau de qualification
7 - Savoirs hautement spécialisés
Sortie
Bac + 5 et plus
Descriptif

Aujourd’hui, la donnée est partout, permettant aux entreprises d'accroître le suivi de leur performance via des indicateurs toujours plus nombreux, d’analyser des comportements clients et par là même d’identifier des opportunités de marché. Les métiers de l'ingénieurie de la Data se retrouvent sur l’ensemble du cycle de vie de la donnée, car, dans ce contexte, les entreprises ont besoin de structurer et mettre en œuvre une stratégie autour des données de l'entreprise. Cela nécessite d'un part de solliciter des professionnels capables d'accompagner cette maîtrise d'ouvrage en conseillant le commanditaire, d'autre part de mobiliser des compétences spécifiques pour piloter la mise en œuvre de la stratégie, collecter des données, les stocker, les modéliser ou encore les protéger. A l'heure du Big Data et de l'intelligence artificielle, le métier d'expert en infrastructures de données massives connaît un très fort développement car il répond à un enjeu stratégique pour le futur de l'économie et des entreprises. Les besoins en matière de recrutement sont très élevés face à une pénurie de profils adaptés.

Activités visées :

  • Encadrer la conception d’un projet data au sein d’une organisation
  • Coordonner la réalisation d’un projet data au sein d’une organisation
  • Programmer la collecte de données depuis plusieurs sources pour un projet data au sein d’une organisation
  • Développer la mise à disposition technique des données collectées pour un projet data au sein d’une organisation
  • Mettre en place l’entrepôt de données
  • Assurer la maintenance et l'évolution de l’entrepôt de données
  • Mettre en place un data-lake
  • Assurer la gestion de l’accès aux données
Objectif
  • Analyser l’expression d’un besoin de projet data dans une étude de faisabilité en explorant, à l’aune des enjeux stratégiques de l’organisation, le besoin métier avec les parties prenantes pour valider les orientations et sélectionner les hypothèses techniques du projet avec le ou les commanditaire(s).
  • Cartographier les données disponibles en référençant les usages, les sources, les métadonnées et les données afin de valider les hypothèses techniques du projet data.
  • Concevoir un cadre technique d’exploitation des données en analysant les contraintes techniques, de moyens et la cartographie des données afin de définir une réponse technique adaptée aux ressources mobilisables dans le respect du RGPD et d’une démarche éco-responsable.
  • Réaliser une veille technique et réglementaire en sélectionnant des sources et en collectant et traitant les informations collectées afin de formuler des recommandations projet toujours en phase avec l’état de l’art.
  • Planifier la réalisation d’un projet data en attribuant les moyens nécessaires et en définissant les étapes de réalisation et les méthodes de suivi du projet afin de d’organiser sa mise en oeuvre
  • Superviser la réalisation d’un projet data en organisant les méthodes, les outils de travail et la communication entre les parties prenantes, afin d’accompagner les membres de l’équipe dans la réussite du projet
  • Communiquer tout au long de la réalisation du projet data sur les orientations, les réalisations et leurs impacts en élaborant la stratégie et les supports de communication afin d’informer toutes les parties prenantes des évolutions ou des opportunités internes comme externes, portés par le projet.
  • Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet.
  • Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet.
  • Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final.
  • Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet.
  • Partager le jeu de données en configurant des interfaces logicielles et en créant des interfaces programmables afin de mettre à disposition le jeu de données pour le développement du projet.
  • Modéliser la structure des données d’un entrepôt de données en s’appuyant sur les dimensions et les faits afin d’optimiser l’organisation des données pour les requêtes analytiques.
  • Créer un entrepôt de données à partir des paramètres du projet, des contraintes techniques et matérielles et de la modélisation de la structure des données afin de soutenir l’analyse de l’activité et l’aide à la décision stratégique de l’organisation
  • Intégrer les ETL nécessaires en entrée et en sortie d’un entrepôt de données afin de garantir la qualité et le bon formatage des données en respectant les modélisations logiques et physiques préalablement établies
  • Gérer l’entrepôt de données à l’aide des outils d’administration et de supervision dans le respect du RGPD, afin de garantir les bons accès, l’intégration des évolutions structurelles et son maintien en condition opérationnelle dans le temps.
  • Implémenter des variations dans les dimensions de l’entrepôt de données en appliquant la méthode adaptée en fonction du type de changement demandé afin d’historiser les évolutions de l’activité de l’organisation et maintenir ainsi une bonne capacité d’analyse.
Débouchés

Secteurs d’activités :

  • au sein d’entreprises de services du numérique (ESN) et d’entreprises de services spécialisées dans l’intégration, en sous-traitance et pour le compte de leurs clients, d’infrastructures data et big data ;
  • au sein d’entreprises et d’opérateurs qui mettent en œuvre des infrastructures data et/ou big data dans le cadre de leur pilotage d’activité, de leur stratégie ou encore dans le cadre du développement de nouveaux produits et services numériques.
  • au sein d’équipes R&D d’entreprises et d’opérateurs qui innovent pour imaginer les cas d’usages de la data et/ou de l’IA et développer des prototypes testables avant industrialisation.

Type d'emplois accessibles :

  • Expert en infrastructures de données massives
  • Data Base Engineer
  • Consultant big data
Répertoire National des Certifications Professionnelles (RNCP)
Code RNCP Date Fin Enregistrement Type Enregistrement Actif / Inactif
RNCP37638 31/05/2026 Enregistrement sur demande Actif
Certificateur
  • Simplon.co
Valideur
  • Simplon.co
    1ère habilitation Début validité Fin validité
    31/05/2023 31/05/2023 31/05/2026
Domaines de formation (Formacode® V13)
  • 31036 : Administration base de données
  • 24268 : Transmission données informatiques
  • 31023 : Données massives
  • 31052 : Data Warehouse
  • 71654 : Logiciel système gestion bases données
Domaine de spécialité (NSF)
326 : Informatique, traitement de l'information, réseaux de transmission des données
Accessibilité
Formation initiale Formation continue Apprentissage Contrat de pro VAE ou par expérience Demande individuelle
Textes officiels
Publication : 31/05/2023
Descriptif : Décisions d'enregistrement aux répertoires nationaux (Mai 2023) - Le 31 mai 2023 - Suite aux avis conformes de la Commission de la certification professionnelle portant sur des demandes d’enregistrement, avis produits lors de la séance du 31 mai 2023, le Directeur général de France compétences a procédé à des décisions d’enregistrement aux répertoires nationaux. Ces décisions sont publiées sur le site de France compétences et seront ultérieurement publiées au journal officiel de la République française.
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
Publication : 16/06/2023
Descriptif : Décision du 7 juin 2023 portant enregistrement au répertoire national des certifications professionnelles et au répertoire spécifique Commission de Mai 2023
Code NOR : MTRD2315297S
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
Informations mises à jour le 09/06/2023 par Certif Info.