Concepteur développeur en intelligence artificielle et analyse big data

Autre titre inscrit sur demande au RNCP (niveau 6)

[Code Certif Info N°116296]
Type de titre / diplôme
Certification active
Niveau de qualification
6 - Savoirs approfondis
Sortie
Bac + 3 et 4
Descriptif

Le marché de la donnée et de l'IA connaît une croissance exponentielle grâce à l'impact croissant de la numérisation, des objets connectés, des réseaux sociaux et des plateformes numériques. Selon des études, le marché de l'IA devrait atteindre 90 milliards de dollars en 2025. Le gouvernement français a mis en place une stratégie nationale pour l'IA, soutenue par des investissements importants.

Les métiers de la donnée sont répartis en plusieurs pôles, tels que la collecte, le traitement, l'analyse, la protection des données, le développement de modèles d'apprentissage et les opérations liées aux bases de données.

La certification de Concepteur développeur en IA et analyse Big Data répond aux compétences requises pour les data scientists et les data analysts mais aussi pour d'autres métiers liés au traitement de la donnée et de l'intelligence artificielle.

Ces professionnels sont très recherchés sur le marché du travail. Que ce soit pour rendre les données intelligentes et résoudre des problématiques métier ou exploiter les données pour faciliter la prise de décisions, la maîtrise de l'apprentissage automatique, de la science de la donnée et de la visualisation est devenue essentielle dans de nombreux secteurs.

Activités visées :

  • Mettre en place des processus de collecte de données de façon automatisée en utilisant des outils d’orchestration ou des scripts informatiques et en respectant les normes légales (RGPD).
  • Réaliser des opérations de transformation de données pour écarter les valeurs mal formatées, erronées ou simplement incohérentes et ainsi assurer la qualité des futures analyses.
  • Combiner les données pour en créer des modèles : identifier toutes les dimensions et variables qui seront nécessaires à l’analyse de la performance de chaque équipe métier et les mettre à leur disposition.
  • Réaliser une étude statistique descriptive des données (distribution, moyenne, écart-type…) pour mieux comprendre comment elles sont distribuées et ainsi expliquer les grandes tendances.
  • Utiliser des techniques d’apprentissage automatique : concevoir des programmes informatiques pour expliquer la relation entre une et plusieurs variables afin de prédire des tendances ou de regrouper les données par caractéristiques communes.
  • Organiser un travail de cadrage de projet data : réaliser une veille technologique des outils et des techniques statistiques, planifier les différentes étapes du projet tout en évaluant les risques associés.
  • Organiser et coordonner le travail nécessaire à la mise en place d’un projet data : identifier les personnes utiles à sa bonne réalisation, mettre en place des outils de gestion de projet et présenter les résultats du projet en s’adaptant au public visé.
  • Utiliser des techniques d’apprentissage profond (deep learning) pour exploiter des données non structurées (données textuelles ou visuelles) et approfondir ses analyses ou améliorer la qualité de ses prédictions.
  • Mettre en production les algorithmes d’apprentissage profond, en monitorer dans le temps les performances et les améliorer en fonction des différentes innovations technologiques.
  • Identifier les indicateurs clés de performance de chaque équipe métier en conduisant des entretiens pour comprendre précisément leurs besoins.
  • Mettre à disposition des équipes métiers des interfaces graphiques représentant les indicateurs clés de performance métier (tableaux de bord) afin de les aider dans leurs prises de décision, et ce en s’adaptant au public visé.
Objectif
  • Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
  • Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
  • Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
  • Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
  • Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
  • Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
  • Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
  • Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
  • Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
  • Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
  • Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
  • Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
  • Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
  • Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
  • Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
  • Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
  • Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
  • Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
  • Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
  • Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
  • Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
  • Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.
Débouchés

Secteurs d’activités :

  • en travailleur indépendant (freelance)
  • dans de jeunes entreprises innovantes (startup)
  • dans des grandes entreprises de technologies telles que Google, Facebook, Microsoft
  • dans des entreprises de service financier : banque, assurance, service financier
  • dans des entreprises de commerce électronique
  • dans des entreprises de santé et pharmaceutique :
  • dans des entreprises de conseil en management
  • dans de nombreuses autres industries, telles que les médias, les télécommunications, l'énergie et les transports, qui ont également besoin de compétences en données pour optimiser leurs opérations et prendre des décisions éclairées.

Type d'emplois accessibles :

  • Data Analyst
  • Data Scientist
  • Développeur en Intelligence Artificielle
  • BI Analyst
  • Chef de projet Data
  • Chief Data Scientist
  • Consultant Data
  • Développeur Data
Répertoire National des Certifications Professionnelles (RNCP)
Code RNCP Date Fin Enregistrement Type Enregistrement Actif / Inactif
RNCP38616 09/02/2027 Enregistrement sur demande Actif
Code scolarité
26X12501
Certificateur
  • Le Wagon
Valideur
  • Le Wagon
    1ère habilitation Début validité Fin validité
    09/02/2024 09/02/2027
Session de l'examen
Année de la première session Année de la dernière session
Domaines de formation (Formacode® V13)
  • 31025 : Data analytics
  • 31026 : Data science
  • 31028 : Intelligence artificielle
  • 31035 : Data visualization
  • 31052 : Data Warehouse
Liens vers les métiers (ROME)
  • M1403 - Études et prospectives socio-économiques
  • M1805 - Études et développement informatique
Domaine de spécialité (NSF)
  • 114 - Mathématiques
  • 125 - Linguistique
  • 326 - Informatique, traitement de l'information, réseaux de transmission des données
Accessibilité
Formation initiale Formation continue Apprentissage Contrat de pro VAE ou par expérience Demande individuelle
Textes officiels
Publication : 09/02/2024
Descriptif : Décisions d'enregistrement aux répertoires nationaux (Février 2024) - Vendredi 09 février 2024 - Suite aux avis conformes de la Commission de la certification professionnelle portant sur des demandes d’enregistrement, avis produits lors de la séance du 08 février 2024, le Directeur général de France compétences a procédé à des décisions d’enregistrement aux répertoires nationaux. Ces décisions sont publiées sur le site de France compétences et seront ultérieurement publiées au journal officiel de la République française.
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
URL hypertexte BO : Ouvrir le lien dans un nouvel onglet
Publication : 20/02/2024
Descriptif : Décision du 9 février 2024 portant enregistrement au répertoire national des certifications professionnelles et au répertoire spécifique
Code NOR : TSSD2404190S
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
Informations mises à jour le 12/03/2024 par Certif Info.