Analysez vos données textuelles

Cours
fr
Français
8 h
Ce contenu est noté 0 sur 5
Source
  • Sur openclassrooms.com
Conditions
  • À son rythme
  • Accès libre
  • Certificat payant
Plus d'informations
  • 3 séquences
  • Niveau Intermédiaire

Leurs employés apprennent chaque jour avec Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Découvrir Edflex

Détails du cours

Déroulé

Partie 1 - Prétraitez des données textuelles
1. Récupérez et explorez le corpus de textes
2. Nettoyez et normalisez les données
3. Entraînez-vous à prétraiter un corpus en vue de créer un moteur de résumés
 

Partie 2 - Transformez des données textuelles
1. Représentez votre corpus en "bag of words"
2. Effectuez des plongements de mots (word embeddings)
3. Modélisez des sujets avec des méthodes non supervisées
Quiz : Partie 2

Partie 3 - Détectez automatiquement les sentiments de commentaires clients
1. Opérez une première classification naïve de sentiments
2. Allez plus loin dans la classification de mots
3. Traitez le corpus de textes à l'aide de réseaux de neurones
4. Entraînez-vous à classifier du texte

Certificat de réussite

Prérequis

Pour en profiter pleinement, n'hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :

Python pour le calcul numérique (numpy) et la création de graphiques (pyplot), que nous utiliserons dans les parties TP du cours,

Quelques notions d'algèbre linéaire : manipulation de vecteurs, multiplications de matrices, normes, et valeurs/vecteurs propres,

Quelques notions de probabilités et statistiques, telles que distribution de loi de probabilité et variance,

Les modèles non-supervisées permettront de modéliser des features automatiquement à partir du texte

Les modèles supervisées non-linéaires sont indispensables au traitement du texte, notamment les réseaux de neurones séquentiels

Intervenants

Yannis Chaouche
Lead Formateur @ Machine Learning Academy & AI Black Belt

Éditeur

OpenClassrooms (anciennement le Site du Zéro ou SdZ), est un site web qui propose des cours autour de l'informatique, des sciences et de l'entrepreneuriat.

Les cours en ligne peuvent être réalisés aussi bien par l'équipe du site, des professeurs d'universités ou de grandes écoles partenaires que par ses membres.

Aujourd'hui, les cours sont disponibles dans plusieurs format : MOOC (Massive Open Online Course), texte web, e-book, livre et en vidéo. L'entreprise délivre des certifications pour certains cours, dont une reconnue par l'état, en partenariat avec IESA multimédia.

Plateforme

OpenClassrooms (anciennement le Site du Zéro ou SdZ), est un site web qui propose des cours autour de l'informatique, des sciences et de l'entrepreneuriat.

Les cours en ligne peuvent être réalisés aussi bien par l'équipe du site, des professeurs d'universités ou de grandes écoles partenaires que par ses membres.

Aujourd'hui, les cours sont disponibles dans plusieurs format : MOOC (Massive Open Online Course), texte web, e-book, livre et en vidéo. L'entreprise délivre des certifications pour certains cours, dont une reconnue par l'état, en partenariat avec IESA multimédia.

Ce contenu est noté 4.5 sur 5
(aucun avis)
Ce contenu est noté 4.5 sur 5
(aucun avis)
Complétez cette ressource pour donner votre avis