Réalisez une analyse exploratoire de données

Cours
fr
Français
15 h
Ce contenu est noté 0 sur 5
Source
  • Sur openclassrooms.com
Conditions
  • À son rythme
  • Accès libre
  • Certificat payant
Plus d'informations
  • 3 séquences
  • Niveau Intermédiaire

Leurs employés apprennent chaque jour avec Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Découvrir Edflex

Détails du cours

Déroulé

Partie 1 - Découvrez l'analyse exploratoire multidimensionnelle
1. Êtes-vous prêt à suivre ce cours ?
2. Découvrez l'intérêt de l’analyse multidimensionnelle
3. Rencontrez Emeric Nicolas, Data scientist
4. Découvrez les méthodes factorielles et la classification non supervisée
5. Téléchargez les jeux de données analysées dans ce cours
6. Représentez vos données dans un espace
Quiz : Avez-vous compris l'intérêt de l'analyse exploratoire multidimensionelle ?

Partie 2 - Découvrez l'Analyse en Composantes Principales (ACP)
1. Comprenez l'enjeu de l'Analyse en Composantes Principales
2. Découvrez les espaces que nous utiliserons
3. Interprétez le cercle des corrélations
4. Représentez les individus sur les plans factoriels
5. Choisissez le nombre de composantes
6. TP : Réalisez une ACP
7. Soyez attentifs aux spécificités de l'ACP
Quiz : Pratiquez l'ACP

Partie 3 - Partitionnez vos données
1. Recherchez une bonne partition
2. Découvrez l’algorithme k-means
3. Effectuez une classification hiérarchique
4. Interprétez votre partition
5. TP : Partitionnez vos données
6. Entraînez-vous à réaliser un détecteur de slides grâce à de l'analyse d'image

Certificat de réussite

Prérequis

  • Maîtriser les statistiques descriptives uni et bidimensionnelles, notamment:
    • connaître le vocabulaire de base et savoir représenter un échantillon
    • les différents types de variables
    • la notion de distribution (et comment la représenter)
    • la notion de corrélation et plus précisément de corrélation linéaire
  • Être familier avec la notion de vecteur (écriture, représentation graphique), de droite, d'axe.
  • Savoir utiliser le langage Python dans le cadre de la Data Science, ou le langage R.

Intervenants

Nicolas Rangeon
Nicolas Rangeon, Data scientist et formateur, Diplôme d’Ingénieur en informatique (Université de Technologie de Compiègne)

Éditeur

L’ENSAE-ENSAI Formation Continue (Cepe) est l’entité de formation continue du Genes. Depuis plus de 50 ans, le Cepe met à disposition son expertise en statistique, économie et finance. Son objectif principal est de délivrer des formations exigeantes et de qualité via des contenus scientifiques innovants et des formateurs de premier plan, toujours experts dans leur domaine d’intervention.

Plateforme

OpenClassrooms (anciennement le Site du Zéro ou SdZ), est un site web qui propose des cours autour de l'informatique, des sciences et de l'entrepreneuriat.

Les cours en ligne peuvent être réalisés aussi bien par l'équipe du site, des professeurs d'universités ou de grandes écoles partenaires que par ses membres.

Aujourd'hui, les cours sont disponibles dans plusieurs format : MOOC (Massive Open Online Course), texte web, e-book, livre et en vidéo. L'entreprise délivre des certifications pour certains cours, dont une reconnue par l'état, en partenariat avec IESA multimédia.

Ce contenu est noté 4.5 sur 5
(aucun avis)
Ce contenu est noté 4.5 sur 5
(aucun avis)
Complétez cette ressource pour donner votre avis