
关键信息
关于内容
Bienvenue dans ce cours de traitement du langage naturel ! L’objectif de ce cours est de comprendre les méthodes qui permettent de transformer le texte en features exploitables par des algorithmes de machine learning classiques, et les architectures et modèles qui correspondent le mieux à ce type de données. En l’occurence un ensemble de documents texte non-structurés.
Ce cours est donc divisé en 3 parties : une première qui traite de l'exploration, du nettoyage et de la normalisation du texte. Une seconde partie est dédiée au différents types de transformations qui vont nous permettre de mieux comprendre nos données textuelles et de créer des features que nous pourrons utiliser dans les algorithmes classiques de machine learning. La dernière partie sera consacrée à la classification du texte à l'aide de l'apprentissage automatique.
课程大纲
教师
Yannis Chaouche
Ingénieur Machine Learning - Professeur @ OpenClassrooms
内容设计师

平台

OpenClassrooms (原名 le Site du Zéro 或 SdZ)是一个提供计算机、科学和创业课程的网站。
在线课程可以由该网站的团队、合作大学或大学校的教授或 OpenClassrooms 成员自己教授。
目前,课程有多种形式:MOOC(大规模在线开放课程)、网络文本、电子书、书籍和视频。公司为某些课程颁发证书,包括与 IESA Multimedia 合作颁发的国家承认的证书。
Good


Good