Analysez vos données textuelles

Course
fr
French
8 h
This content is rated 0 out of 5
Source
  • From openclassrooms.com
Conditions
  • Self-paced
  • Free Access
  • Fee-based Certificate
More info
  • 3 Sequences
  • Intermediate Level

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

Course details

Syllabus

Partie 1 - Prétraitez des données textuelles
1. Récupérez et explorez le corpus de textes
2. Nettoyez et normalisez les données
3. Entraînez-vous à prétraiter un corpus en vue de créer un moteur de résumés
 

Partie 2 - Transformez des données textuelles
1. Représentez votre corpus en "bag of words"
2. Effectuez des plongements de mots (word embeddings)
3. Modélisez des sujets avec des méthodes non supervisées
Quiz : Partie 2

Partie 3 - Détectez automatiquement les sentiments de commentaires clients
1. Opérez une première classification naïve de sentiments
2. Allez plus loin dans la classification de mots
3. Traitez le corpus de textes à l'aide de réseaux de neurones
4. Entraînez-vous à classifier du texte

Certificat de réussite

Prerequisite

Pour en profiter pleinement, n'hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :

Python pour le calcul numérique (numpy) et la création de graphiques (pyplot), que nous utiliserons dans les parties TP du cours,

Quelques notions d'algèbre linéaire : manipulation de vecteurs, multiplications de matrices, normes, et valeurs/vecteurs propres,

Quelques notions de probabilités et statistiques, telles que distribution de loi de probabilité et variance,

Les modèles non-supervisées permettront de modéliser des features automatiquement à partir du texte

Les modèles supervisées non-linéaires sont indispensables au traitement du texte, notamment les réseaux de neurones séquentiels

Instructors

Yannis Chaouche
Lead Formateur @ Machine Learning Academy & AI Black Belt

Editor

OpenClassrooms (formerly Le site du Zéro or SdZ) is a website that offers courses about computer science and entrepreneurship. Online courses can be made both by site staff, professors of universities or colleges partner as by its members.

Today, courses are available in several formats: MOOC (Massive Open Online Course), web text, e-book, book and video. The company delivers certifications for certain courses, including one recognized by the state in partnership with IESA multimedia.

Platform

OpenClassrooms (formerly Le site du Zéro or SdZ) is a website that offers courses about computer science and entrepreneurship. Online courses can be made both by site staff, professors of universities or colleges partner as by its members.

Today, courses are available in several formats: MOOC (Massive Open Online Course), web text, e-book, book and video. The company delivers certifications for certain courses, including one recognized by the state in partnership with IESA multimedia.

This content is rated 4.5 out of 5
(no review)
This content is rated 4.5 out of 5
(no review)
Complete this resource to write a review