Key Information
About the content
Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.
Le recours aux mathématiques est minimal. L’objectif est de savoir analyser des données, de comprendre ce que l’on fait, et de pouvoir communiquer ses résultats.
Ce cours s’adresse aux étudiants et praticiens de toutes disciplines qui recherchent une formation pratique. Il sera utile à toute personne ayant le besoin d’analyser un jeu de données réel dans le cadre d’un enseignement, de son activité professionnelle ou de recherche, ou par simple curiosité d’analyser un jeu de données par soi-même (données du web, données publiques…).
Le cours s’appuie sur le logiciel libre R qui est un des logiciels de statistique les plus puissants disponibles actuellement.
Les méthodes abordées sont : les techniques descriptives, les tests, l’analyse de variance, les modèles de régression linéaire et logistique, les données censurées (de survie).
Prerequisite
Il n’y a pas de pré-requis pour suivre ce cours. Des connaissances de base en algèbre ou en programmation sont utiles mais ne sont pas nécessaires. En revanche, la volonté d’apprendre à analyser un jeu de données par soi-même est essentielle.
Ce cours s'adresse à un public francophone cherchant à se former aux bases de la statistique avec un logiciel libre (disponible gratuitement). Il vise aussi bien un public en formation initiale qu'un public en formation continue. Compte tenu des nombreux domaines d'application des statistiques et de la taille importante de la communauté R, ce cours concerne une large audience. Sciences fondamentales comme appliquées, sciences humaines, gestion de projet, les statistiques concernent potentiellement l'ensemble des professions.
Syllabus
Semaine 1
Introduction aux statistiques et à R,description d’une variable
Introduction Chapitre 1 : Définitions Chapitre 2 : Représentations graphiques Chapitre 3 : Mesures de position et de dispersion : les principes Chapitre 4 : Mesures de position et de dispersion : la pratique Lab 1 : Introduction à R studio, manipulation des fichiers et des variables
Semaine 2
Intervalles de confiance, association entre variables
Chapitre 5 : Intervalles de confiance Chapitre 6 : Coefficient de corrélation Chapitre 7 : Risque relatif et odds-ratio Lab 2 : Manipulation de données, résumés numériques et graphiques Lab 3 : RMarkdown et rapport automatisé
Semaine 3
Tests statistiques et pratique des tests
Chapitre 8 : Tests statistiques : le “p” Chapitre 9 : Tests statistiques : l’approche de Neyman et Pearson Chapitre 10 : Comparaison de deux pourcentages Chapitre 11 : Comparaison de deux moyennes Chapitre 12 : Test de nullité d’une corrélation, divers Lab 4 : Mesures d'association, tests statistiques, update sur RMarkdown
Semaine 4
Régression linéaire simple et multiple, régression logistique
Chapitre 13 : Régression linéaire simple Chapitre 14 : Régression linéaire, corrélation et test t Chapitre 15 : Régression linéaire multiple, analyse de variance Chapitre 16 : Introduction à la régression logistique Chapitre 17 : Régression logistique multiple Lab 5 : Régression linéaire et logistique
Semaine 5
Données de survie (censurées), méthodes exploratoires multidimensionnelles
Chapitre 18 : Données de survie ou censurées Chapitre 19 : Tests et modèles pour données censurées Chapitre 20 : Introduction aux méthodes exploratoires multidimensionnelles Chapitre 21 : Analyse en composantes principales Chapitre 22 : Classification hiérarchique
Instructors
Bruno Falissard
Professeur de biostatistique à l'Université Paris-Saclay, ancien élève de l'école polytechnique, pédopsychiatre et directeur du CESP/Inserm U1018 (Centre de Recherche en Épidémiologie et Santé des Populations).
Christophe Lalanne
Ingénieur de recherche (Université Paris-Diderot, AP-HP)
Content Designer

The Université Paris-Saclay was designed in 2019 to develop the continuum of knowledge from fundamental to applied sciences at a level unprecedented in France, emphasising interdisciplinarity and openness to the world. It is the successor to the University of Paris-Sud-XI, founded on 1 January 1971, and its aim is to advance knowledge of the major issues facing society through research of the highest international standard. Université Paris-Saclay provides students with a forward-looking educational framework and content. Ongoing interaction between laboratories and socio-economic players enables the results of cutting-edge research to be transformed into innovations.
The nineteen founding institutions bring to Université Paris-Saclay the strengths for which they are renowned: a close link between education and research, laboratories and major research facilities of international standards, an international reputation for engineering and management courses, and a wide range of high-level courses.
This programme, funded by IDEX Paris-Saclay in addition to the resources provided by the partners, will support the creation of MOOCs and SPOCs for the University's students, as well as continuing education courses for the socio-economic world, with which there are already strong contacts.
Platform

France Université Numérique is the broadcaster of the online courses of French higher education institutions and their partners.
It operates several platforms of diffusion, of which the best known, FUN MOOC, is the first French-speaking academic platform worldwide. Thanks to many partner institutions, this platform offers a vast catalog of courses enriched daily with various themes and current events.
Grande pédagogie de la part de Bruno Falissard, exemples concrets et appliqués, facile et intéressant à suivre. Permet in fine une progression significative !
Un cours presque parfait! Un cours bien fait dont le contenu est accessible à tous et facile à comprendre! Un grand merci à l'équipe pédagogique qui s'est surpassée!