Durée : 3 jours
Aucune session disponible.
« * » indique les champs nécessaires
« * » indique les champs nécessaires
Objectifs
Public et prérequis
Programme
– Aperçu des principes fondamentaux du NLP
– Encodage des données textuelles
– Expressions régulières
– Techniques de nettoyage de texte :
– Suppression des mots vides
– Troncature
– Lemmatisation
– Suppression de la ponctuation
– Outils : spaCy, NLTK
Exemples de travaux pratiques :
– Nettoyage de texte sur un échantillon de données à l’aide de NLTK et spaCy
– Comparaison des résultats du stemming et de la lemmatisation
– Sac de mots
– TF-IDF
– N-grammes
– Enchâssement de mots (Word2Vec, GloVe, FastText)
– Créer des représentations vectorielles
– Évaluer les performances du modèle
Exemples de travaux pratiques :
– Appliquer des techniques de vectorisation sur un corpus de textes
– Comparer les résultats de différentes méthodes de vectorisation
– Implémenter des modèles de classification de texte de base
– Évaluer les performances du modèle avec différentes représentations
– Construction de modèles prédictifs
– Techniques classiques d’apprentissage automatique
– Méthodes de classification
– Méthodes de clustering
– Analyse du sentiment
– Modélisation des sujets
– Outils : scikit-learn
Exemples de travaux pratiques :
– Analyse de sentiments sur des données de médias sociaux
– Modélisation thématique d’articles de presse à partir de données textuelles vectorisées
– Aperçu des réseaux neuronaux
– Réseaux neuronaux récurrents (RNN)
– Mécanisme d’attention
– Transformateurs
– Grands modèles de langage (LLM) : GPT, BERT
– Applications :
– Analyse de sentiments
– Résumés de textes
– Génération de contenu
– Outils : TensorFlow, PyTorch
Exemples de travaux pratiques :
– Entraînement d’un RNN pour le résumé de texte
– Entraînement d’un modèle basé sur un transformateur pour l’analyse des sentiments en utilisant des ensembles de données ouvertes.
– Mesures d’évaluation : précision, rappel, score F1
– Matrices de confusion
– Stratégies de validation
– Méthodes de validation croisée
– Techniques de déploiement de modèles
– Applications réelles des modèles NLP
Exemples de travaux pratiques :
– Évaluer un modèle NLP à l’aide de mesures spécifiques
– Effectuer une validation croisée
– Déployer le modèle via l’API
– Créer une application légère pour le déploiement
– Questions éthiques dans le NLP
– Biais dans les ensembles de données
– Transparence dans les grands modèles de langage (LLM)
– Implications du contenu généré
– Considérations sur l’équité
– Préoccupations relatives à la confidentialité des données
Exemples de travaux pratiques :
– Analyse d’une étude de cas sur les défis éthiques dans le domaine de la PNL
– Réfléchir à des solutions pour réduire les risques de modèles biaisés ou non transparents.
Sur mesure
Disponible à distance
Durée : 3 jours
A partir de : 2250 € HT
Disponible à distance
Durée : 3 jours
soit 21 heures de formation
Disponible à distance
Durée : 3 jours
soit 21 heures de formation
Disponible à distance
Durée : 3 jours
A partir de : 2250 € HT

Référence : SF33429
À partir de 1400 € HT
2 jours

Référence : SF33063
À partir de 1950 € HT
3 jours

Référence : SF33355
À partir de 1800 € HT
3 jours