link Source : openclassrooms.com
list 4 séquences
assignment Niveau : Introductif
chat_bubble_outline Langue : Français
card_giftcard 80 points
Avis de la communauté
-
starstarstarstarstar
Voir l'avis

Les infos clés

credit_card Formation gratuite
verified_user Certification payante
timer 10 heures de cours

En résumé

Quel est le point commun entre un biologiste, un journaliste et un analyste marketing ? Ils communiquent tous à l’aide de graphiques, de moyennes ou de pourcentages ; bref : ils font des statistiques !

Avoir des données à disposition, c'est bien, mais savoir en tirer les informations principales, c'est essentiel. Les données sont l'or noir de notre époque : on en analyse des quantités astronomiques chaque seconde dans le monde grâce à des algorithmes. Vous avez probablement déjà entendu parler de Big Data ou de Data Science.

Dans ce cours, vous apprendrez les bases de la Data Analyse : chercher les informations essentielles dans des données, notamment à l'aide de graphiques. Vous avez déjà entendu parler de moyennes, de variances ou d’histogrammes. Nous allons ici redécouvrir tous ces concepts, mais nous irons encore plus loin en recherchant les relations qui existent à l’intérieur de vos données. Mais avant tout, nous verrons comment nettoyer des données : vous verrez en effet que vos données ne seront jamais directement exploitables sans une phase préalable.

Si vous souhaitez vous lancer dans la Data, ce cours présente les bases essentielles : il est un très bon point de départ. Si vous êtes un simple curieux, ce cours vous conviendra également.

Quel que soit votre jeu de données, il a forcément quelque chose à vous dire !

Objectifs pédagogiques :

  • Nettoyer un jeu de données.
  • Comprendre et représenter les variables.
  • Réaliser une analyse univariée.
  • Réaliser une analyse bivariée.

more_horiz Lire plus
more_horiz Lire moins
report_problem

Les prérequis

  • Mathématiques de niveau Terminale ES ou S
  • Optionnellement, savoir programmer :
    • en langage R (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous au langage R pour analyser vos données")
    • ou en langage Python, niveau basique (si ce n'est pas le cas, je vous invite à suivre le cours "Initiez-vous à Python pour l’analyse de données")
  • Savoir manipuler les objets Dataframe (disponibles nativement sous R, ou en Python via la librairie Pandas) (si ce n'est pas le cas, je vous invite à suivre le cours "Découvrez les librairies Python pour la data science")

Cela vous sera utile pour quelques quiz et activités.

Outils nécessaires : 

  • R ou Python téléchargé sur votre ordinateur.
  • Les données utilisées dans ce cours.

dns

Le programme

Partie 1 - Appréhendez les bases de l'analyse statistique
1. Tirez un maximum de ce cours
2. Découvrez les statistiques : vocabulaire et tour d’horizon
3. Découvrez les 4 types de variables
Quiz : Appréhender les bases de l'analyse statistique

Partie 2 - Nettoyez un jeu de données
1. Repérez les différents types d'erreurs
2. Gérez les différentes erreurs d'un jeu de données
3. Nettoyez vos données avec Python
Quiz : Nettoyer un jeu de données

Partie 3 - Représentez vos variables
1. Représentez la distribution empirique d'une variable
2. Présentez une variable sous forme de tableau
3. Découvrez les enjeux de l'analyse univariée
4. Découvrez les mesures de tendance centrale
5. Comprenez les mesures de dispersion
6. Appréhendez les mesures de forme
7. Familiarisez-vous avec les mesures de concentration
Quiz : Représenter vos variables

Partie 4 - Réalisez une analyse bivariée
1. Comprenez les enjeux de l’analyse bivariée
2. Recherchez les corrélations
3. Analysez la corrélation entre deux variables quantitatives
4. Analysez deux variables quantitatives par régression linéaire
5. Analysez une variable quantitative et une qualitative par ANOVA
6. Analysez deux variables qualitatives avec le Chi-2
Quiz : Réaliser une analyse bivariée

Certificat de réussite

record_voice_over

Les intervenants

Nicolas Rangeon
Nicolas Rangeon, Data scientist et formateur, Diplôme d’Ingénieur en informatique (Université de Technologie de Compiègne)

Benjamin Marlé
Graduated in Big Data from the University of Reims, France. Currently working as a freelance Data Scientist

 

assistant

La plateforme

OpenClassrooms

OpenClassrooms (anciennement le Site du Zéro ou SdZ), est un site web qui propose des cours autour de l'informatique, des sciences et de l'entrepreneuriat.

Les cours en ligne peuvent être réalisés aussi bien par l'équipe du site, des professeurs d'universités ou de grandes écoles partenaires que par ses membres.

Aujourd'hui, les cours sont disponibles dans plusieurs format : MOOC (Massive Open Online Course), texte web, e-book, livre et en vidéo. L'entreprise délivre des certifications pour certains cours, dont une reconnue par l'état, en partenariat avec IESA multimédia.

Vous êtes le concepteur de ce MOOC ?
Quelle note donnez-vous à cette ressource ?
Contenu
5/5
Plateforme
5/5
Animation
5/5