Apache Spark est l’un des outils open source les plus utilisés et pris en charge pour l’apprentissage automatique et le Big Data.
Dans cette formation, vous découvrirez comment travailler avec cette puissante plateforme en abordant MLlib, la bibliothèque de machine learning Spark, qui fournit des outils aux data scientists et aux analystes. Vous apprendrez le chargement de données dans Spark, le prétraitement des données au besoin pour appliquer les algorithmes MLlib et l’application de ces algorithmes à une variété de problèmes d’apprentissage automatique.