Nettoyez et analysez votre jeu de données

Course
fr
French
15 h
This content is rated 0 out of 5
Source
  • From openclassrooms.com
Conditions
  • Self-paced
  • Free Access
  • Fee-based Certificate
More info
  • 4 Sequences
  • Intermediate Level

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

Course details

Syllabus

Partie 1 - Appréhendez les bases de l'analyse statistique
1. Tirez un maximum de ce cours
2. Découvrez les statistiques : vocabulaire et tour d’horizon
3. Découvrez les 4 types de variables
Quiz : Appréhender les bases de l'analyse statistique

Partie 2 - Nettoyez un jeu de données
1. Repérez les différents types d'erreurs
2. Gérez les différentes erreurs d'un jeu de données
3. Nettoyez vos données avec Python
Quiz : Nettoyer un jeu de données

Partie 3 - Représentez vos variables
1. Représentez la distribution empirique d'une variable
2. Présentez une variable sous forme de tableau
3. Découvrez les enjeux de l'analyse univariée
4. Découvrez les mesures de tendance centrale
5. Comprenez les mesures de dispersion
6. Appréhendez les mesures de forme
7. Familiarisez-vous avec les mesures de concentration
Quiz : Représenter vos variables

Partie 4 - Réalisez une analyse bivariée
1. Comprenez les enjeux de l’analyse bivariée
2. Recherchez les corrélations
3. Analysez la corrélation entre deux variables quantitatives
4. Analysez deux variables quantitatives par régression linéaire
5. Analysez une variable quantitative et une qualitative par ANOVA
6. Analysez deux variables qualitatives avec le Chi-2
Quiz : Réaliser une analyse bivariée

Certificat de réussite

Prerequisite

  • Mathématiques de niveau Terminale ES ou S
  • Optionnellement, savoir programmer :
    • en langage R (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous au langage R pour analyser vos données")
    • ou en langage Python, niveau basique (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous à Python pour l’analyse de données")
  • Savoir manipuler les objets Dataframe (disponibles nativement sous R, ou en Python via la librairie Pandas) (si ce n'est pas le cas, je vous invite à suivre le cours "Découvrez les librairies Python pour la data science")

Cela vous sera utile pour quelques quiz et activités.

Outils nécessaires : 

  • R ou Python téléchargé sur votre ordinateur.
  • Les données utilisées dans ce cours.

Instructors

Benjamin Marlé
Graduated in Big Data from the University of Reims, France. Currently working as a freelance Data Scientist

Nicolas Rangeon
Nicolas Rangeon, Data scientist, instructor & Computer engineer (Université de Technologie de Compiègne)

Editor

L’ENSAE-ENSAI Formation Continue (Cepe) est l’entité de formation continue du Genes. Depuis plus de 50 ans, le Cepe met à disposition son expertise en statistique, économie et finance. Son objectif principal est de délivrer des formations exigeantes et de qualité via des contenus scientifiques innovants et des formateurs de premier plan, toujours experts dans leur domaine d’intervention.

Platform

OpenClassrooms (formerly Le site du Zéro or SdZ) is a website that offers courses about computer science and entrepreneurship. Online courses can be made both by site staff, professors of universities or colleges partner as by its members.

Today, courses are available in several formats: MOOC (Massive Open Online Course), web text, e-book, book and video. The company delivers certifications for certain courses, including one recognized by the state in partnership with IESA multimedia.

This content is rated 4.5 out of 5
(no review)
This content is rated 4.5 out of 5
(no review)
Complete this resource to write a review