Expert en sciences des données

Autre titre inscrit sur demande au RNCP (niveau 7)

[Code Certif Info N°107213]
Avertissement : cette fiche est en état archivé
Type de titre / diplôme
Fiche archivée
Niveau de qualification
7 - Savoirs hautement spécialisés
Sortie
Bac + 5 et plus
Descriptif

Le métier visé est celui d'expert (Data Scientist en anglais) dans le domaine des sciences des données. Ces dernières peuvent être de toute taille, jusqu'à la qualification de « massives » (Big Data en anglais). Ces données partagent une complexité nécessitant l'utilisation de techniques mathématiques avancées avec leurs implémentations informatiques correspondantes. Ces implémentations sont localisées sur des infrastructures informatiques locales et/ou dans les nuages (cloud computing en anglais).

Objectif

Analyser, concevoir et développer des modélisations mathématiques pour enrichir les systèmes d'aide à la décision

  • Explorer, décrire et interpréter des données dans leur aspect multidimensionnel.
  • Produire des traitements de données simples en utilisant les concepts de la statistique descriptive, en vue de présenter les résultats obtenus à l'aide de tableaux, de graphiques et d'indicateurs numériques
  • Mesurer la liaison entre deux variables
  • Choisir les outils et déterminer leurs limites afin de communiquer les conclusions et leur interprétation
  • Produire des études statistiques en mettant en oeuvre les techniques d'apprentissage automatique par la machine (machine learning) pour des données avec ou sans caractères temporels

Concevoir et déployer des infrastructures informatiques distribuées pour stocker et traiter des données massives

  • Participer, avec des Data Engineers, à la rédaction d'un cahier des charges technique pour la conception et la mise en place d'une solution d'analyse des données volumineuses
  • Exploiter un système distribué d'entrepôt de données structurées et non structurées, notamment via Apache Hadoop & Apache Spark
  • Contribuer à la définition de l'architecture de stockage de données, en guidant les Data Engineers à prendre en compte les besoins de traitements algorithmiques de l'intelligence artificielle
  • Concevoir et implémenter des algorithmes pour le traitement des grands volumes de données dans le respect des bonnes pratiques de l'ingénierie logicielle (incluant les approches SQL et NoSQL)
  • Exploiter des infrastructures informatiques distribuées en mode cloud sur la plateforme Amazon AWS pour y déporter des traitements algorithmiques de l'intelligence artificielle (préparation à la certification Amazon AWS Solution Architect - Associate)


Détecter et évaluer l'état de l'art de l'intelligence artificielle pour développer des projets innovants

  • Cibler et faire ressortir des modèles linéaires, non-linéaires, généralisés ou mixtes et construire des modèles complexes ou novateurs de prévisions en utilisant les techniques de modélisation, estimations, tests et diagnostics. Identifier les variables ou composantes importantes d'un modèle afin de tester des hypothèses en utilisant les techniques de modélisation, estimations, tests et diagnostics
  • Modéliser des données observées, les interpréter pour en faire de la prédiction en utilisant des outils appropriés et en tenant compte de leur nature aléatoire
  • Déterminer et analyser des données complexes en utilisant les méthodes de fouille et de visualisation de séries temporelles et fonctionnelles, de textes (clustering, classification), de réseaux (statique ou dynamiques) ou d'images
  • Intégrer les technologies complémentaires (web sémantique, modélisation multi-agents) pour l'hybridation des approches intelligence artificielle connectivistes (réseaux de neurones) et symboliques (moteurs de raisonnement)
  • Opérationnaliser une publication scientifique en implémentation informatique pour réaliser un prototype innovant. B3C6 - Utiliser l'écosystème des solutions SAS pour la modélisation prédictive (préparation à la certification SAS® Certified Predictive Modeler Using SAS® Enterprise Miner )

 

Conduire des projets complexes en intégrant les contraintes légales et les valeurs d'éthique pour diffuser les bonnes pratiques dans les organisations

  • Intégrer les philosophies, problématiques et contraintes des réglementations françaises et européennes (CNIL, RGPD) sur la protection des données dans un projet Data Science
  • Prendre la mesure de l'environnement international sur la réglementation de la protection des données, notamment aux Etats-Unis
  • Intégrer les deux grandes familles de pratiques de gestion de projets informatiques complexes (en cascade et en agilité) ainsi que les approches du « juste-à-temps ».
Débouchés

Secteurs d'activités :

Toutes entreprises industrielles et de services, organismes publics, associations, sociétés de services et de conseil en ingénierie (y compris informatique).

Toutes ces structures ont comme point commun de générer et/ou d'avoir accès à des volumes importants de données numériques.

Type d'emplois accessibles :

  • Data Scientist
  • Machine Learning Engineer
  • Data Analyst
Répertoire National des Certifications Professionnelles (RNCP)
Code RNCP Date Fin Enregistrement Type Enregistrement Actif / Inactif
RNCP34262 10/10/2024 Enregistrement sur demande Inactif
Code scolarité
16X11401
Certificateur
  • Data sciencetech institute
Valideur
  • Data sciencetech institute
    1ère habilitation Début validité Fin validité
    10/10/2019 10/10/2019 10/10/2024
Session de l'examen
Année de la première session Année de la dernière session
Domaines de formation (Formacode® V14)
  • 31025 : Analyse de données
  • 31052 : Data Warehouse
Liens vers les métiers (ROME)
  • M1403 - Études et prospectives socio-économiques
  • M1802 - Expertise et support en systèmes d'information
  • M1805 - Études et développement informatique
  • M1806 - Conseil et maîtrise d'ouvrage en systèmes d'information
Groupes formation emploi (GFE)
  • P : Gestion et traitement de l'information
Domaine de spécialité (NSF)
  • 114 - Mathématiques
Accessibilité
Formation initiale Formation continue Apprentissage Contrat de pro VAE ou par expérience Demande individuelle
Textes officiels
Publication : 11/10/2019
Descriptif : Décisions d'enregistrement aux répertoires nationaux (octobre 2019) - vendredi 11 octobre - Suite aux avis conformes de la commission de la Certification professionnelle portant sur des demandes d'enregistrement, avis produits lors de la séance du 10 octobre 2019, le Directeur général de France compétences a procédé à des décisions d'enregistrement aux répertoires nationaux.
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
Publication : 14/02/2020
Descriptif : Décision du 21 novembre 2019 portant enregistrement dans le répertoire national des certifications professionnelles et dans le répertoire spécifique
Code NOR : MTRP2000701S
URL hypertexte JO : Ouvrir le lien dans un nouvel onglet
Informations mises à jour le 17/10/2024 par Certif Info.