date_range Débute le 20 novembre 2017
event_note Se termine le 1 octobre 2018
list 6 séquences
assignment Niveau : Introductif
chat_bubble_outline Langue : Français
card_giftcard 14.4 points
3.3 /5
Avis de la communauté
11 avis

Les infos clés

credit_card Formation gratuite
verified_user Certification gratuite
timer 24 heures de cours

En résumé

Le MOOC Fondamentaux pour le Big Data vous propose d’acquérir des connaissances de base en statistiques et en informatique dans les domaines de l’analyse, algèbre, probabilités, statistiques, programmation Python et bases de données.

Ce MOOC s'adresse à un public ayant des bases en mathématiques et en algorithmique (niveau L2 validé) nécessitant un rafraichissement de ces connaissances pour suivre des formations en data science et big data. Il peut être suivi en préparation du Mastère Spécialisé « Big data : Gestion et analyse des données massives », du Certificat d’Etudes Spécialisées « Data Scientist » et de la formation courte «Data Science : Introduction au Machine Learning».

more_horiz Lire plus
more_horiz Lire moins
dns

Le programme

Cette formation est précédée d’un quiz de validation de niveau. Elle est constituée de 7 parties et organisée en 6 semaines, chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. Un quiz final faisant suite à un projet validera l’ensemble du MOOC.

  • Semaine 0 : Introduction : Les enjeux du Big Data et de ce MOOC
  • Semaine 1 : Python Partie 1 / Algèbre Partie 1
  • Semaine 2 : Limites des bases de données relationnelles / Python Partie 2/ Algèbre Partie 2
  • Semaine 3 : Probabilités Partie 1/ Analyse Partie 1
  • Semaine 4 : Probabilités Partie 2/ Analyse Partie 2
  • Semaine 5 : Statistique
  • Semaine 6 : Le classifieur Perceptron
record_voice_over

Les intervenants

STÉPHAN CLÉMENÇON

Professeur au département Traitement du Signal et de l'Image de Télécom ParisTech. Ses recherches portent sur la théorie statistique de l'apprentissage. Il a récemment encadré des projets de recherche nationaux théoriques et appliqués sur ce thème. Il est responsable du Mastère Spécialisé «Big data : Gestion et analyse des données massives» et du Certificat d’Etudes Spécialisées «Data Scientist».

PIERRE SENELLART

Professeur dans l'équipe DBWeb de Télécom ParisTech. Il est le directeur de l'information du Journal of the ACM. Ses intérêts de recherche se concentrent sur les aspects pratiques et théoriques de la gestion de données du Web, en particulier le crawl et l'archivage du Web, l'extraction d'informations depuis le Web, la gestion de l'incertitude, la fouille du Web et l'interrogation sous contraintes d'accès. Il est responsable du Certificat d’Etudes Spécialisées «Data Scientist» de Télécom ParisTech.

ANNE SABOURIN

Enseignant-chercheur au département Traitement du Signal et de l'Image de Télécom ParisTech. Ses recherches portent sur l'apprentissage statistique et les méthodes bayésiennes, en particulier pour l'analyse des valeurs extrêmes et la détection d'anomalies.

JOSEPH SALMON

Enseignant-chercheur au département Traitement du Signal et de l'Image de Télécom ParisTech. Il est spécialisé en traitement statistique des images et en apprentissage statistique. Ses recherches portent sur la création et l'étude d'algorithmes pour le traitement de données en grande dimension.

ALEXANDRE GRAMFORT

Enseignant-chercheur au département Traitement du Signal et de l'Image de Telecom ParisTech. Ses recherches portent sur le traitement du signal, l'apprentissage statistique et le calcul scientifique avec pour application principale la modélisation et l'analyse de données en neurosciences. Il est un des principaux contributeurs du projet logiciel open source Scikit-Learn qui est la librairie standard pour l'apprentissage statistique en Python.

ONS JELASSI

Enseignante à la formation continue de Télécom ParisTech, responsable des formations Big Data. Elle est coordonnatrice de ce MOOC.

store

Le concepteur

L'Institut Mines-Télécom est un acteur majeur public de l’enseignement supérieur, de la recherche et de l'innovation dans les domaines de l'ingénierie et du management.

Il est composé de 10 grandes écoles Mines et Télécom sous tutelle du ministre du redressement productif (Mines Albi, Mines Alès, Mines Douai, Mines Nantes, Mines ParisTech, Mines Saint-Etienne, Télécom Bretagne, Télécom École de Management, Télécom ParisTech, Télécom SudParis) et de deux écoles filiales (Télécom Lille et Eurecom). Il entretient des relations privilégiées avec deux partenaires stratégiques, Mines Nancy, composante de l’Université de Lorraine, et Armines.

L’Institut Mines-Télécom est en pointe en matière d’innovation pédagogique. Premier groupe d’écoles d’ingénieur en France, il diplôme chaque année 8% des ingénieurs.

Les cours en ligne ouverts à tous participent d’un mouvement de création et d’animation de communautés pour la formation initiale et tout au long de la vie. L’Institut Mines-Télécom contribuera à ce mouvement et y impliquera l’ensemble de ses parties prenantes : enseignants-chercheurs, étudiants et futurs étudiants, diplômés, entreprises et de la manière la plus générale tous les apprenants intéressés par les domaines de spécialité de l’Institut.

assistant

La plateforme

France Université Numérique est le diffuseur des cours en ligne des établissements d’enseignement supérieur français et de leurs partenaires.

Il opère plusieurs plateformes de diffusion, dont la plus connue, FUN MOOC, est la première plateforme académique francophone mondiale. Grâce à de nombreux établissements partenaires, cette plateforme propose un vaste catalogue de cours s’enrichissant de jour en jour avec des thématiques variées et d’actualité.
 

Avis de la communauté
3.3 /5 Moyenne
4
2
3
1
1
Contenu
3.1/5
Plateforme
3.9/5
Animation
3/5
Le meilleur avis

Fondamentaux pour le Big Data n'est pas réellement un Mooc mais plutôt une occasion de découvrir les cours de Big Data donnés par ParisTech. Ce cours permet donc de vérifier que vous avez l'ensemble des pré-requis en statistiques, analyse, algèbre linéaire, base de données relationnelle pour intégrer un parcours de ce type et vous permettre le cas échéant de les réviser/apprendre grâce aux livres recommandés. Intéressant pour les étudiants, il leurs permettra de se faire une meilleure idée de ce qu'est un cursus Big Data, vérifier qu'ils ont le niveau nécessaire dans les différentes matières qui le compose et enfin que cela correspond à leurs attentes et envies. A recommander pour tous les étudiants qui souhaitent découvrir ce qu'est un cursus Big Data et hésitent encore. Peu recommandé pour les professionnels en recherche d'une introduction au Big Data.

GuillaumeLAURIE
GuillaumeLAURIE ,
le 27 février 2015
Vous êtes le concepteur de ce MOOC ?
Quelle note donnez-vous à cette ressource ?
Contenu
0/5
Plateforme
0/5
Animation
0/5
le 26 janvier 2018

Alors avec ce MOOC il faut savoir où on met les pieds. C'est sans conteste le MOOC le plus difficile que j'ai suivi jusqu'à présent sur la plateforme FUN il ne s'adresse clairement pas néophytes qui viennent là par curiosité mais à des gens qui ont quand même quelques bases notamment en mathématique car oui les maths composent on va dire 80% du MOOC. Mais pour ceux qui seraient déçus et bien oui mais l'analyse de grandes quantités de données s'appuie essentiellement sur des principes statistiques, notamment sur le modèle linéaire donc il faut bouffer un minimum de stats et pour pouvoir bouffer ces stats il faut déjà avoir bouffé un minimum d'analyse et d'algèbre linéaire, c'est un peu le principe du big data il n'y a pas de baguette magique. La partie Python est plutôt bien foutue y compris pour les neophytes pour le coup. La partie base de données est vraiment minimaliste alors que c'est quand même un point crucial du big data. On est vraiment sur les pré requis des concepts du big data donc il n'y a rien de vraiment pratique sur les infrastructures informatique etc (petite frustration en ce qui me concerne en tant qu'informaticien). Après les points qui fâchent : * la qualité des vidéos vraiment pas top, souvent on n'entend à peine l'intervenant * la pédagogie et le dynamisme limité à sa plus simple expression, on débite un cours face caméra devant un fond blanc. C'est simple j'avais l'impression de me retrouver en amphi en prépa intégrée d'école d'ingénieur (pas mes meilleurs souvenirs) et puis dans le cadre d'un MOOC commencer une vidéo par des arguments du genre "si vous ne comprenez pas cette vidéo de 5 minutes allez vous taper tel bouquin indigeste de 300 pages d'algèbre linéaire puis reprenez cette vidéo", euuuuuh * La dimension big data au final est plutôt noyée sous les concepts mathématiques, y compris le mini projet que j'ai réussi en utilisant quasiment le même algo Python que l'exercice précédent sur une matrice 3x3, je l'ai utilisé sur la matrice 21x5000 du mini projet (donc censé être les données un peu big qui nécessitent des traitements spécifiques) en fait non quasi même algo, l'ordi a mouliné 45 secondes au lieu de 200 millisecondes, voilà...