Réalisez des calculs distribués sur des données massives

课程
fr
法语
20 时
此内容评级为 0/5
来源
  • 来自openclassrooms.com
状况
  • 自定进度
  • 免费获取
  • 收费证书
更多信息
  • 4 序列
  • 等级 介绍

他们的员工每天都在学习Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

课程详情

教学大纲

Partie 1 - Au fond, c’est quoi le Big Data ?
1. Prenez vos marques dans le monde du Big Data
2. Voyagez dans l’écosystème du Big Data
3. Initiez-vous au calcul distribué
Quiz : Quiz 1

Partie 2 - Réalisez des calculs massivement parallèles avec MapReduce
1. Divisez (et distribuez) pour régner
2. Parcourez les principaux algorithmes MapReduce
3. Familiarisez-vous avec Hadoop
Activité : Recréez le cœur de Google avec Hadoop : la pondération tf-idf et le PageRank

Partie 3 - Effectuez des calculs distribués sous forme de graphes avec Spark
1. Allez au-delà de MapReduce avec Spark
2. Prenez Spark en main
3. Domptez les Resilient Distributed Datasets
4. Mettez Spark au service des Data Scientists
5. Apprenez à débugger une application Spark
 Activité : Mettez en place une application Spark

Partie 4 - Passez à l'échelle dans le cloud
1. Découvrez Amazon Web Services
2. Stockez des données sur S3
3. Déployez un cluster de calcul distribué
4. Réalisez la maintenance d'un cluster
Quiz : Quiz 4

Certificat de réussite

先决条件

没有。

讲师

Régis Behmo
Expert en machine learning, développeur fullstack, grimpeur invétéré et gros, très gros amateur de nouilles chinoises.

Céline Hudelot
Professeur des Universités en Informatique à CentraleSupélec.

编辑

CentraleSupélec is the result of the merger of the Ecole Centrale Paris and the Supélec. The collaboration between the two Colleges of engineering begun in 1969 with the introduction of the joint competitive entrance exam. Since 2009, the Ecole Centrale Paris and Supélec have continually strengthened their partnerships and collaborations with the aim of encompassing the whole of their activities (engineering education, research and post graduate programs) and confirmed their shared values of excellence, innovation, entrepreneurship, internationalization and leadership. Today CentraleSupélec aims to become a reference in the field of engineering and systems sciences and a leading engineering College in the area of higher education and research, ranked amongst the best institutions in the world.

平台

OpenClassrooms (原名 le Site du Zéro 或 SdZ)是一个提供计算机、科学和创业课程的网站。

在线课程可以由该网站的团队、合作大学或大学校的教授或 OpenClassrooms 成员自己教授。

目前,课程有多种形式:MOOC(大规模在线开放课程)、网络文本、电子书、书籍和视频。公司为某些课程颁发证书,包括与 IESA Multimedia 合作颁发的国家承认的证书。

此内容评级为 4.5/5
(没有评论)
此内容评级为 4.5/5
(没有评论)
完成这个资源,写一篇评论