list 5 séquences
assignment Niveau : Introductif
label Informatique & Programmation
chat_bubble_outline Langue : Français
card_giftcard 9 points
- /5
Avis de la communauté
0 avis

Les infos clés

credit_card Formation gratuite
verified_user Certification payante
timer 15 heures de cours

En résumé

Quel est le point commun entre un biologiste, un journaliste et un analyste marketing ? Ils communiquent tous à l’aide de graphiques, de moyennes ou de pourcentages, bref : ils font des statistiques !

Avoir des données à disposition, c'est bien, mais savoir en tirer les informations principales, c'est essentiel. Les données sont l'or noir de notre époque : on en analyse des quantités astronomiques chaque seconde dans le monde grâce à des algorithmes. Vous avez probablement déjà entendu parler de Big Data ou de Data Science.

Dans ce cours, vous apprendrez les bases de la Data Science : chercher les informations essentielles dans des données, notamment à l'aide de graphiques. Vous avez déjà entendu parler de moyennes, de variances ou d’histogrammes. Nous allons ici redécouvrir tous ces concepts, mais nous irons encore plus loin en recherchant les relations qui existent à l’intérieur de vos données. Mais avant tout, nous verrons comment nettoyer des données : vous verrez en effet que vos données ne seront jamais directement exploitables sans une phase préalable.

Petit bonus : je vous propose d'analyser vos comportements de consommation à partir de vos relevés de compte bancaire, si vous en avez. Sinon, vous pourrez en télécharger un. Vous êtes-vous déjà posé les questions suivantes ?

Quand vous faites vos courses, à quelle vitesse consommez-vous vos produits ?

Combien faites-vous de stock ?

Consommez-vous plus en début ou en fin de mois ? les week-ends ?

Êtes-vous plus dépensier lorsque vous avez beaucoup d'argent sur votre compte ?

etc.

Si vous souhaitez vous lancer dans la Data Science, ce cours présente les bases essentielles : il est un très bon point de départ. Si vous êtes un simple curieux, ce cours vous conviendra également.

Quel que soit votre jeu de données, il a forcément quelque chose à vous dire !

Objectifs pédagogiques :

  • Nettoyer un jeu de données
  • Représenter les variables
  • Réaliser une analyse univariée
  • Réaliser une analyse bivariée

more_horiz Lire plus
more_horiz Lire moins
dns

Le programme

Prérequis :

Avoir quelques notions de mathématiques : multiplication, division, puissance, nombres entiers, nombres réels, équation de droite par fonction affine ( f(x)=ax+b ), coordonnées d'un point dans un graphique à 2 dimensions

Optionnellement, savoir programmer en langage R ou en langage Python (niveau basique) et savoir manipuler les objets Dataframe (disponibles nativement sous R, ou en Python via la librairie Pandas). Cela vous sera utile pour quelques quiz et activités évaluées. Les cours permettant d'acquérir ces prérequis sont listés dans le premier chapitre de ce cours.

 
Partie 1 - Introduction
1. Tirez parti de ce cours
 
Partie 2 - Représentez vos variables
1. Rencontrez Vincent, data analyst dans le domaine de l'énergie
2. Installez R ou Python
3. Découvrez les statistiques : vocabulaire et tour d’horizon
4. Téléchargez les données
5. Découvrez les 4 types de variables
6. Représentez la distribution empirique d'une variable
7. Présentez une variable sous forme de tableau
Quiz : Testez vos connaissances sur les statistiques descriptives
 
Partie 3 - Réalisez une analyse univariée
1. Rencontrez Ulysse, Data Analyst à OpenClassrooms
2. Laissez-vous guider par les indicateurs
3. Découvrez les mesures de tendance centrale
4. Comprenez les mesures de dispersion
5. Appréhendez les mesures de forme
6. Familiarisez-vous avec les mesures de concentration
7. Abordez encore plus de mesures
Quiz : Les mesures statistiques
 
Partie 4 - Réalisez une analyse bivariée
1. Entrez dans le monde de l’analyse bivariée
2. Recherchez les corrélations
3. Analysez la corrélation entre deux variables quantitatives
4. Analysez deux variables quantitatives par régression linéaire
5. Analysez une variable quantitative et une qualitative par ANOVA
6. Analysez deux variables qualitatives avec le Chi-2
Activité : Réalisez des analyses bivariées
 
Partie 5 - Nettoyez votre jeu de données
1. Repérez les différents types d'erreurs
2. Traitez les valeurs manquantes, les outliers et les doublons
3. TP : Nettoyez votre jeu de données
Quiz : Nettoyez votre échantillon
 
Certificat de réussite
record_voice_over

Les intervenants

Nicolas Rangeon
Nicolas Rangeon, Data scientist et formateur, Diplôme d’Ingénieur en informatique (Université de Technologie de Compiègne)

 

store

Le concepteur

L’ENSAE-ENSAI Formation Continue (Cepe) est l’entité de formation continue du Genes. Depuis plus de 50 ans, le Cepe met à disposition son expertise en statistique, économie et finance. Son objectif principal est de délivrer des formations exigeantes et de qualité via des contenus scientifiques innovants et des formateurs de premier plan, toujours experts dans leur domaine d’intervention.

assistant

La plateforme

OpenClassrooms (anciennement le Site du Zéro ou SdZ), est un site web qui propose des cours autour de l'informatique, des sciences et de l'entrepreneuriat.

Les cours en ligne peuvent être réalisés aussi bien par l'équipe du site, des professeurs d'universités ou de grandes écoles partenaires que par ses membres.

Aujourd'hui, les cours sont disponibles dans plusieurs format : MOOC (Massive Open Online Course), texte web, e-book, livre et en vidéo. L'entreprise délivre des certifications pour certains cours, dont une reconnue par l'état, en partenariat avec IESA multimédia.

Quelle note donnez-vous à cette ressource ?
Contenu
0/5
Plateforme
0/5
Animation
0/5