NLP – Natural Language Processing

2 jours II Code CNCP : 2234 II Certifinfo : 93835

/NLP – Natural Language Processing

Le NLP est une discipline qui se concentre sur le traitement et la compréhension du langage naturel par des machines. L’analyse des sentiments, la classification des textes et la traduction automatique font partie des applications du NLP. Ce cours vous permettra de découvrir les éléments du pipeline de modélisation du NLP, de la récolte à la vectorisation des données. Vous apprendrez également comment entraîner, évaluer et sélectionner le meilleur modèle d’apprentissage automatique pour donner du sens à vos données textuelles.

Les objectifs de la formation NLP - Natural Language Processing

A l’issue de la formation «NLP – Natural Language Processing », les apprenants auront les capacités de :

  • Comprendre le Traitement du langage naturel (NLP)
  • Comprendre le Text Mining
  • Comprendre la classification des textes et l’analyse des sentiments
  • Utiliser des principales librairies de NLP
  • Construire un pipeline de modélisation du NLP
  • Savoir modéliser un problème de Machine Learning sur des données non structurées
  • Application d’algorithmes de machine learning sur des données textuelles
  • Perfectionner les modèles à l’aide d’hyper-paramètres
Lien vers site CPF

Les prérequis de la formation NLP - Natural Language Processing

Les prérequis nécessaires pour la formation «NLP – Natural Language Processing » sont:

  • Programmation Python (formation Cegefos : « Programmation en Python  » )
  • Concepts de base de machine learning (formation Cegefos : « Machine Learning avec Python » )

Vous n’avez pas les prérequis nécessaires pour la formation NLP – Natural Language Processing  ? Contactez-nous pour étudier ensemble un parcours sur mesure et garantir le résultat .

Lien vers site CPF

Le public de la formation NLP - Natural Language Processing

La formation certifiante «NLP – Natural Language Processing », s’adresse à tout public salarié, demandeur d’emploi ou en reconversion professionnelle et souhaitant acquérir des compétences en BIG DATA, notamment:

  • Développeurs informatiques
  • Consultants en business intelligence
  • Ingénieurs d’étude, de recherche et développement
  • Architecte système et logiciel
  • Consultants techniques
  • Consultants business
  • Tout développeur ou informaticien souhaitant développer des compétences en intelligence artificielle et BIG DATA
Lien vers site CPF

0

Certif Inffo

0

Code CNCP

0

Jours

0

Heures

Contenu de la formation
NLP – Natural Language Processing

Section 1. Découvrir le NLP

1. Traitement du langage naturel avec Python
2. Connaître les prérequis théoriques et techniques
3. Utiliser les fichiers d’exercice
4. Comprendre le NLP
5. Découvrir les domaines et les exemples d’application du NLP
6. Installer Anaconda
7. Aborder l’environnement Jupyter
8. Comprendre le pipeline de modélisation NLP
9. Support pdf
– Utiliser les fichiers d’exercice
– Comprendre le NLP
– Découvrir les domaines et les exemples d’application du NLP
– Installer Anaconda
– Aborder l’environnement Jupyter
– Comprendre le pipeline de modélisation NLP
10. TP
11. Quiz

Section 2. Traiter un texte avec Python

1. Stocker un texte brut dans une structure de données Python
2. Utiliser Pandas pour lire les données
3. Comprendre les expressions régulières
4. Utiliser les expressions régulières avec le module Re de Python
5. Étudier les fonctions les plus populaires du module Re
6. Support pdf
– Stocker un texte brut dans une structure de données Python
– Utiliser Pandas pour lire les données
– Comprendre les expressions régulières
– Utiliser les expressions régulières avec le module Re de Python
– Étudier les fonctions les plus populaires du module Re
7. TP
8. Quiz

Section 3. Préparer les données

1. Aborder les étapes de préparation des données
2. Réaliser un exemple de nettoyage de données
3. Supprimer les stopwords
4. Réaliser le stemming avec NLTK
5. Pratiquer la lemmatization avec NLTK
6. Comparer le stemming et la lemmatization
7. Support pdf
– Aborder les étapes de préparation des données
– Supprimer les caractères de ponctuation
– Supprimer les stopwords
– Réaliser le stemming avec NLTK
– Réaliser la lemmatization avec NLTK
– Comparer le stemming et la lemmatization
9. TP
10. Quiz

Section 4. Transformer un texte en chiffres

1. Comprendre la vectorisation avec CountVectorizer
2. Utiliser CountVectorizer
3. Effectuer une vectorisation contextuelle avec N-Grams
4. Étudier TF-IDF
5. Utiliser TF-IDF
6. Appréhender le feature engineering
7. Ajouter des features aux données
8. Analyser les features
9. Support pdf
– Comprendre la vectorisation
– Comprendre la vectorisation avec CountVectorizer
– Utiliser CountVectorizer
– Effectuer une vectorisation contextuelle avec N-Grams
– Étudier TF-IDF
– Utiliser TF-IDF
– Appréhender le feature engineering
10. TP
11. Quiz

Section 5. Comprendre l’expérience machine learning – NLP

1. Apprendre la méthode K-fold
2. Comprendre la matrice de confusion d’un modèle de classification
3. Comprendre les mesures de performance d’un modèle NLP
4. Aborder l’overfitting (le surapprentissage)
6. Support pdf
– Apprendre la méthode K-fold
– La validation croisée avec Scikit-learn
– Matrice de Confusion d’un modèle de classification
– Les mesures de performance d’un modèle NLP
7. Quiz

Section 6. Réaliser un modèle de classification avec SVM

1. Modéliser en machine learning
2. Aborder l’algorithme Support Vector Machine
3. Utiliser le SVM avec scikit-learn et CountVectorizer
4. Tester le modèle de classification SVM
5. Mesurer les performances du modèle de classification SVM
6. Utiliser le SVM avec la cross-validation
7. Utiliser le SVM avec TF-IDF
7. Support pdf
– Machine Learning
– Aborder l’algorithme Support Vector Machine
– Utiliser le SVM avec scikit-learn
– Tester le modèle de classification
– Utiliser le SVM avec la cross-validation
8. TP
9. Quiz

Section 7. Réaliser un modèle de classification avec le Random forest

1. Aborder l’algorithme Random forest
2. Utiliser Random forest pour construire un modèle de classification
3. Mesurer les performances d’un modèle de classification Random forest
4. Utiliser Random forest avec K-fold
5. Support pdf
– Aborder l’algorithme Random forest
– Utiliser Random forest pour construire un modèle de classification
– Mesurer les performances d’un modèle de classification Random forest
– Utiliser Random forest avec K-fold
6. TP
7. Quiz

Section 8. Perfectionner un modèle avec l’hyperparamètre

1. Programmer un hyperparamètre avec le modèle SVM
2. Programmer un hyperparamètre avec Random forest
3. Évaluer les résultats d’un hyperparamètre
4. Tester GridSearchCV avec un SVM
5. Tester GridSearchCV avec Random forest
6. Détecter les features les plus importantes avec le Random forest
7. Homogénéiser les données avec TF-IDF
8. Tester Random forest sur des données homogènes
9. Sélectionner un modèle
10. Conclure sur le traitement du NLP avec Python
15. Support pdf
₋ Programmer un hyperparamètre avec le modèle SVM
₋ Programmer un hyperparamètre avec Random forest
₋ Évaluer les résultats d’un hyperparamètre
₋ Tester GridSearchCV avec un SVM
₋ Tester GridSearchCV avec Random forest
16. TP
17. Quiz

Section 9. Examen final

1. Synthèse du cours
2. TP Général
3. Examen final

Une attestation d’assiduité sera délivré après la validation de toutes les compétences du module NLP – Natural Language Processing.

Modalités De Formations

NLP – Natural Language Processing

La formation certifiante NLP – Natural Language Processing est disponible en 3 modalités : E-learning tutoré, Blended Learning et en présentiel.

FOAD / E-Learning tutoré

La formation certifiante NLP – Natural Language Processing est disponible en e-learning ou à distance tutoré.
Vous serez accompagné par un formateur / Tuteur tout au long de la formation.

Blended-Learning

La formation NLP – Natural Language Processing est disponible en Blended learning (mixte entre e-learning et présentiel).
La partie apprentissage se déroule en e-learning, et les projets fil rouge en présentiel.

Présentiel

Le module de formation NLP – Natural Language Processing est disponible en présentiel ou en distanciel.
La formation sera animé par un formateur à distance ou en classe.

Financement et Éligibilité

de la formation NLP – Natural Language Processing

CPF

CPF « Compte Personnel de Formation.

VAE

VAE: Validation des Acquis de l’Expérience.

AIF

AIF : Aide Individuelle à la Formation par Pôle Emploi.

CPF de transition

CPF de transition pour une Reconversion Professionnelle.

Contrat PRO

Contrat d’alternance ou de Professionnalisation.

POEc

Préparation Opérationnelle Emploi Collective.

PDC

Plan de Développement de Compétences de l’entreprise.

AFPR

Action de Formation Préalable à l’Embauche.

POEi

Préparation Opérationnelle Emploi Individuelle.

Besoin d'un

Service Conseil et Commercial

01.33.52.13.00

Service Administratif et Pédagogique

01.23.52.13.02