- 来自openclassrooms.com
Réalisez des calculs distribués sur des données massives
- 自定进度
- 免费获取
- 收费证书
- 4 序列
- 等级 介绍
课程详情
教学大纲
Partie 1 - Au fond, c’est quoi le Big Data ?
1. Prenez vos marques dans le monde du Big Data
2. Voyagez dans l’écosystème du Big Data
3. Initiez-vous au calcul distribué
Quiz : Quiz 1
Partie 2 - Réalisez des calculs massivement parallèles avec MapReduce
1. Divisez (et distribuez) pour régner
2. Parcourez les principaux algorithmes MapReduce
3. Familiarisez-vous avec Hadoop
Activité : Recréez le cœur de Google avec Hadoop : la pondération tf-idf et le PageRank
Partie 3 - Effectuez des calculs distribués sous forme de graphes avec Spark
1. Allez au-delà de MapReduce avec Spark
2. Prenez Spark en main
3. Domptez les Resilient Distributed Datasets
4. Mettez Spark au service des Data Scientists
5. Apprenez à débugger une application Spark
Activité : Mettez en place une application Spark
Partie 4 - Passez à l'échelle dans le cloud
1. Découvrez Amazon Web Services
2. Stockez des données sur S3
3. Déployez un cluster de calcul distribué
4. Réalisez la maintenance d'un cluster
Quiz : Quiz 4
Certificat de réussite
先决条件
讲师
Régis Behmo
Expert en machine learning, développeur fullstack, grimpeur invétéré et gros, très gros amateur de nouilles chinoises.
Céline Hudelot
Professeur des Universités en Informatique à CentraleSupélec.
编辑
平台
OpenClassrooms (原名 le Site du Zéro 或 SdZ)是一个提供计算机、科学和创业课程的网站。
在线课程可以由该网站的团队、合作大学或大学校的教授或 OpenClassrooms 成员自己教授。
目前,课程有多种形式:MOOC(大规模在线开放课程)、网络文本、电子书、书籍和视频。公司为某些课程颁发证书,包括与 IESA Multimedia 合作颁发的国家承认的证书。