list 2 séquences
assignment Niveau : Introductif
chat_bubble_outline Langue : Français
card_giftcard 8.4 points
Envie de partager ce MOOC dans votre entreprise ?
My Mooc
For Business
- /5
Avis de la communauté
0 avis

Les infos clés

credit_card Formation gratuite
verified_user Certification payante
timer 14 heures de cours

En résumé

Êtes-vous prêt·e à décupler la puissance de vos modèles grâce aux méthodes ensemblistes ? C'est ce que nous allons voir dans ce cours, en nous intéressant à une famille d'algorithme parmi les plus performantes actuellement.

En effet, en utilisant de manière rusée notre jeu de données, nous pouvons exploiter tout son potentiel, en créant un grand nombre de petit modèles rapidement puis en développant un méta-modèle qui les rassemble.

Suivez ce cours pour apprendre les deux familles de modèles les plus utilisées par les data scientists : les méthodes parallèles avec les forêts aléatoires et les méthodes séquentielles dont le modèle phare est le gradient boosting. 

Objectifs pédagogiques

  • Combiner différents algorithmes afin d’optimiser les performances de votre modèle global
  • Utiliser les méthodes parallèles telles que le bagging ou les forêts aléatoires
  • Utiliser les méthodes séquentielles telles que le boosting

more_horiz Lire plus
more_horiz Lire moins
dns

Le programme

Partie 1 - Apprivoisez les méthodes parallèles
1. Améliorez la performance de vos algorithmes à l’aide des méthodes ensemblistes parallèles
2. Contrôlez la variance à l’aide du bagging
3. Réduisez la corrélation entre les apprenants faibles à l’aide des forêts aléatoires
4. TP - Mesurez la puissance des forêts aléatoires
Quiz : Partie 1
 
Partie 2 - Maîtrisez les méthodes séquentielles
1. Initiez-vous aux méthodes séquentielles et au Boosting
2. Décuplez les capacités du boosting : (X)GBoost
Quiz : Partie 2
 
Certificat de réussite

Prérequis 

Ce cours de Data Science se situe au croisement des mathématiques et de l'informatique. Pour en profiter pleinement, n'hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :

  • Python pour le calcul numérique que nous utiliserons dans la partie TP du cours (librairie numpy et création de graphes avec pyplot)
  • Quelques notions d'algèbre linéaire, telles que manipulation de vecteurs, multiplications de matrices, normes
  • Quelques notions de probabilités et statistiques, telles que distribution de loi de probabilité et variance
record_voice_over

Les intervenants

Yannis Chaouche
Ingénieur Machine Learning - Professeur @ OpenClassrooms

store

Le concepteur

CentraleSupélec is the result of the merger of the Ecole Centrale Paris and the Supélec. The collaboration between the two Colleges of engineering begun in 1969 with the introduction of the joint competitive entrance exam. Since 2009, the Ecole Centrale Paris and Supélec have continually strengthened their partnerships and collaborations with the aim of encompassing the whole of their activities (engineering education, research and post graduate programs) and confirmed their shared values of excellence, innovation, entrepreneurship, internationalization and leadership. Today CentraleSupélec aims to become a reference in the field of engineering and systems sciences and a leading engineering College in the area of higher education and research, ranked amongst the best institutions in the world.
assistant

La plateforme

OpenClassrooms (anciennement le Site du Zéro ou SdZ), est un site web qui propose des cours autour de l'informatique, des sciences et de l'entrepreneuriat.

Les cours en ligne peuvent être réalisés aussi bien par l'équipe du site, des professeurs d'universités ou de grandes écoles partenaires que par ses membres.

Aujourd'hui, les cours sont disponibles dans plusieurs format : MOOC (Massive Open Online Course), texte web, e-book, livre et en vidéo. L'entreprise délivre des certifications pour certains cours, dont une reconnue par l'état, en partenariat avec IESA multimédia.

Vous êtes le concepteur de ce MOOC ?
Quelle note donnez-vous à cette ressource ?
Contenu
0/5
Plateforme
0/5
Animation
0/5