Réalisez une analyse exploratoire de données

Course
fr
French
15 h
This content is rated 0 out of 5
Source
  • From openclassrooms.com
Conditions
  • Self-paced
  • Free Access
  • Fee-based Certificate
More info
  • 3 Sequences
  • Intermediate Level

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

Course details

Syllabus

Partie 1 - Découvrez l'analyse exploratoire multidimensionnelle
1. Êtes-vous prêt à suivre ce cours ?
2. Découvrez l'intérêt de l’analyse multidimensionnelle
3. Rencontrez Emeric Nicolas, Data scientist
4. Découvrez les méthodes factorielles et la classification non supervisée
5. Téléchargez les jeux de données analysées dans ce cours
6. Représentez vos données dans un espace
Quiz : Avez-vous compris l'intérêt de l'analyse exploratoire multidimensionelle ?

Partie 2 - Découvrez l'Analyse en Composantes Principales (ACP)
1. Comprenez l'enjeu de l'Analyse en Composantes Principales
2. Découvrez les espaces que nous utiliserons
3. Interprétez le cercle des corrélations
4. Représentez les individus sur les plans factoriels
5. Choisissez le nombre de composantes
6. TP : Réalisez une ACP
7. Soyez attentifs aux spécificités de l'ACP
Quiz : Pratiquez l'ACP

Partie 3 - Partitionnez vos données
1. Recherchez une bonne partition
2. Découvrez l’algorithme k-means
3. Effectuez une classification hiérarchique
4. Interprétez votre partition
5. TP : Partitionnez vos données
6. Entraînez-vous à réaliser un détecteur de slides grâce à de l'analyse d'image

Certificat de réussite

Prerequisite

  • Maîtriser les statistiques descriptives uni et bidimensionnelles, notamment:
    • connaître le vocabulaire de base et savoir représenter un échantillon
    • les différents types de variables
    • la notion de distribution (et comment la représenter)
    • la notion de corrélation et plus précisément de corrélation linéaire
  • Être familier avec la notion de vecteur (écriture, représentation graphique), de droite, d'axe.
  • Savoir utiliser le langage Python dans le cadre de la Data Science, ou le langage R.

Instructors

Nicolas Rangeon
Nicolas Rangeon, Data scientist et formateur, Diplôme d’Ingénieur en informatique (Université de Technologie de Compiègne)

Editor

L’ENSAE-ENSAI Formation Continue (Cepe) est l’entité de formation continue du Genes. Depuis plus de 50 ans, le Cepe met à disposition son expertise en statistique, économie et finance. Son objectif principal est de délivrer des formations exigeantes et de qualité via des contenus scientifiques innovants et des formateurs de premier plan, toujours experts dans leur domaine d’intervention.

Platform

OpenClassrooms (formerly Le site du Zéro or SdZ) is a website that offers courses about computer science and entrepreneurship. Online courses can be made both by site staff, professors of universities or colleges partner as by its members.

Today, courses are available in several formats: MOOC (Massive Open Online Course), web text, e-book, book and video. The company delivers certifications for certain courses, including one recognized by the state in partnership with IESA multimedia.

This content is rated 4.5 out of 5
(no review)
This content is rated 4.5 out of 5
(no review)
Complete this resource to write a review