Spark pour Machine Learning

3 jours II Code CNCP : 2234 II Certif info : 93835

/Spark pour Machine Learning

Apache Spark est l’un des outils open source les plus utilisés et pris en charge pour l’apprentissage automatique et le Big Data.

Dans cette formation, vous découvrirez comment travailler avec cette puissante plateforme en abordant MLlib, la bibliothèque de machine learning Spark, qui fournit des outils aux data scientists et aux analystes. Vous apprendrez le chargement de données dans Spark, le prétraitement des données au besoin pour appliquer les algorithmes MLlib et l’application de ces algorithmes à une variété de problèmes d’apprentissage automatique.

Les objectifs de la formation Spark pour Machine Learning

A l’issue de la formation « Spark Pour Machine Learning », les apprenants auront les capacités de :

  • Maîtriser l’installation de Spark
  • Connaître l’architecture d’Apache Spark
  • Comprendre les concepts d’Apache Spark
  • Maîtriser le processus de chargement de données dans Spark
  • Utiliser DataFrames pour organiser la structure de ses données
  • Maîtriser la préparation des données
  • Connaître les types d’algorithmes d’apprentissage automatique les plus couramment utilisés: clustering, classification, régression et recommandations
Lien vers site CPF

Les prérequis de la formation Spark pour Machine Learning

Les prérequis nécessaires pour la formation Spark Pour Machine Learning sont :

  • Connaissance des langages Python est un plus et également des connaissances en SQL
  • Posséder des connaissances de base des commandes Unix/Linux

Vous n’avez pas les prérequis nécessaires pour la formation Spark pour Machine Learning? Contactez-nous pour étudier ensemble un parcours sur mesure et garantir ainsi la réussite de votre projet.

Lien vers site CPF

Le public de la formation Spark pour Machine Learning

La formation certifiante « Spark pour Machine Learning», s’adresse à tout public salarié, demandeur d’emploi ou en reconversion professionnelle et souhaitant acquérir des compétences en BIG DATA, notamment:

  • Directeurs/chefs de projet ou responsable métier
  • Responsable système d’informations
  • Consultants en business intelligence
  • Ingénieurs d’étude, de recherche et développement
  • Architecte système et logiciel
  • Consultants techniques
  • Consultants business
  • Statisticiens et Mathématiciens
  • Data scientist (analyse de données) ou Data miner (fouilleur des données)
  • Tout développeur ou informaticien souhaitant développer des compétences en analyse de données et BIG DATA
Lien vers site CPF

0

Certif Info

0

Code CNCP

0

Jours

0

Heures

Contenu de la formation
Spark pour Machine Learning

Introduction à Spark Mlib

  • Introduction à Spark
  • Architecture d’Apache Spark
  • Concept du RDD
  • SparkSession
  • DataFrame
  • Dataset
  • Étapes du processus d’apprentissage automatique
  • Installation de Spark
  • Organisation des données dans DataFrames
  • Composants de Spark Mllib

Préparation et transformation des données

  • Introduction au prétraitement
  • Normalisation les données numériques
  • Standardisation des données numériques
  • Organisation des donnée numériques dans des buckets
  • Tokenization des données textuelles
  • TF-IDF (Term frequency – Inverse Document Frequency)
  • Résumé du prétraitement

Clustering

  • Introduction au clustering
  • K-means clustering
  • Classification hiérarchique
  • Résumé des techniques de clustering

Classification

Introduction à la classification

  • Prétraitement de l’ensemble de données Iris
  • Classement Naïve Bayes
  • Classification du perceptron multicouche
  • Classification des arbres de décision
  • Résumé des algorithmes de classification

Régression

  • Introduction à la régression
  • Prétraitement des données de régression
  • Régression linéaire
  • Régression d’arbre de décision
  • Régression arborescente augmentée par gradient
  • Résumé des algorithmes de régression

Recommandations

  • Comprendre les systèmes de recommandation
  • Filtrage collaboratif

Atelier pratique

Une attestation d’assiduité sera délivrée après la validation de toutes les compétences du module Spark pour Machine Learning.

Modalités De Formations

SPARK POUR MACHINE LEARNING

Le module SPARK POUR MACHINE LEARNING est disponible en 3 modalités : E-learning tutoré, Blended Learning et en présentiel.

FOAD / E-Learning tutoré

La formation certifiante Spark pour Machine Learning est disponible en e-learning tutoré. Vous serez accompagné par un formateur / tuteur tout au long de la formation.

Blended-Learning

La formation certifiante Spark pour Machine Learning est disponible en Blended learning. La partie apprentissage se déroule en e-learning, et les projets fil rouge en présentiel.

Présentiel

La formation certifiante Spark pour Machine Learning est disponible en présentiel ou en distanciel. La formation sera animée par un formateur à distance ou en classe.

Financement et Éligibilité

de la formation SPARK POUR MACHINE LEARNING

CPF

CPF « Compte Personnel de Formation.

VAE

VAE: Validation des Acquis de l’Expérience.

AIF

AIF : Aide Individuelle à la Formation par Pôle Emploi.

CPF de transition

CPF de transition pour une Reconversion Professionnelle.

Contrat PRO

Contrat d’alternance ou de Professionnalisation.

POEc

Préparation Opérationnelle Emploi Collective.

PDC

Plan de Développement de Compétences de l’entreprise.

AFPR

Action de Formation Préalable à l’Embauche.

POEi

Préparation Opérationnelle Emploi Individuelle.

Besoin d'un