Décrivez et nettoyez votre jeu de données

课程
fr
法语
10 时
此内容评级为 0/5
来源
  • 来自openclassrooms.com
状况
  • 自定进度
  • 免费获取
  • 收费证书
更多信息
  • 4 序列
  • 等级 介绍

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

课程详情

教学大纲

Partie 1 - Appréhendez les bases de l'analyse statistique
1. Tirez un maximum de ce cours
2. Découvrez les statistiques : vocabulaire et tour d’horizon
3. Découvrez les 4 types de variables
Quiz : Appréhender les bases de l'analyse statistique

Partie 2 - Nettoyez un jeu de données
1. Repérez les différents types d'erreurs
2. Gérez les différentes erreurs d'un jeu de données
3. Nettoyez vos données avec Python
Quiz : Nettoyer un jeu de données

Partie 3 - Représentez vos variables
1. Représentez la distribution empirique d'une variable
2. Présentez une variable sous forme de tableau
3. Découvrez les enjeux de l'analyse univariée
4. Découvrez les mesures de tendance centrale
5. Comprenez les mesures de dispersion
6. Appréhendez les mesures de forme
7. Familiarisez-vous avec les mesures de concentration
Quiz : Représenter vos variables

Partie 4 - Réalisez une analyse bivariée
1. Comprenez les enjeux de l’analyse bivariée
2. Recherchez les corrélations
3. Analysez la corrélation entre deux variables quantitatives
4. Analysez deux variables quantitatives par régression linéaire
5. Analysez une variable quantitative et une qualitative par ANOVA
6. Analysez deux variables qualitatives avec le Chi-2
Quiz : Réaliser une analyse bivariée

Certificat de réussite

先决条件

  • Mathématiques de niveau Terminale ES ou S
  • Optionnellement, savoir programmer :
    • en langage R (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous au langage R pour analyser vos données")
    • ou en langage Python, niveau basique (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous à Python pour l’analyse de données")
  • Savoir manipuler les objets Dataframe (disponibles nativement sous R, ou en Python via la librairie Pandas) (si ce n'est pas le cas, je vous invite à suivre le cours "Découvrez les librairies Python pour la data science")

Cela vous sera utile pour quelques quiz et activités.

Outils nécessaires : 

  • R ou Python téléchargé sur votre ordinateur.
  • Les données utilisées dans ce cours.

讲师

Nicolas Rangeon
Nicolas Rangeon, Data scientist et formateur, Diplôme d’Ingénieur en informatique (Université de Technologie de Compiègne)

Benjamin Marlé
Graduated in Big Data from the University of Reims, France. Currently working as a freelance Data Scientist

 

平台

OpenClassrooms (原名 le Site du Zéro 或 SdZ)是一个提供计算机、科学和创业课程的网站。

在线课程可以由该网站的团队、合作大学或大学校的教授或 OpenClassrooms 成员自己教授。

目前,课程有多种形式:MOOC(大规模在线开放课程)、网络文本、电子书、书籍和视频。公司为某些课程颁发证书,包括与 IESA Multimedia 合作颁发的国家承认的证书。

此内容评级为 4.5/5
(没有评论)
此内容评级为 4.5/5
(没有评论)
完成这个资源,写一篇评论