- Sur openclassrooms.com
Créez votre Data Lake
- À son rythme
- Accès libre
- Certificat payant
- 2 séquences
- Niveau Introductif
Détails du cours
Déroulé
Partie 1 - Stockez vos données de manière distribuée avec HDFS
1. Identifiez les besoins de votre data lake
2. Découvrez le système de fichiers distribué HDFS
3. Mettez les mains dans le cambouis avec HDFS
4. Déployez HDFS en production et passez à l’échelle
Quiz : Devenez incollables sur l'administration d'un cluster HDFS
Partie 2 - Sérialisez vos données avec Avro
1. Créez vos premiers schémas de données avec Avro
2. Faites évoluer vos schémas de données
3. Réalisez des analyses sur votre master dataset
Activité : Mangez des nouilles !
Certificat de réussite
Prérequis
Intervenants
Régis Behmo
Expert en machine learning, développeur fullstack, grimpeur invétéré et gros, très gros amateur de nouilles chinoises.
Éditeur
Plateforme
OpenClassrooms (anciennement le Site du Zéro ou SdZ), est un site web qui propose des cours autour de l'informatique, des sciences et de l'entrepreneuriat.
Les cours en ligne peuvent être réalisés aussi bien par l'équipe du site, des professeurs d'universités ou de grandes écoles partenaires que par ses membres.
Aujourd'hui, les cours sont disponibles dans plusieurs format : MOOC (Massive Open Online Course), texte web, e-book, livre et en vidéo. L'entreprise délivre des certifications pour certains cours, dont une reconnue par l'état, en partenariat avec IESA multimédia.