Big Data Analysis with Scala and Spark

Big Data Analysis with Scala and Spark

Curso
en
Inglês
28 h
Este conteúdo é classificado como 0 de 5
Fonte
  • De www.coursera.org
CONDIÇÕES
  • Individualizado
  • Acesso livre
  • Certificado pago
Mais informações
  • 4 sequências
  • Introductive Level

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Saiba mais

Detalhes do curso

Programa de Estudos

  • Week 1 - Getting Started + Spark Basics
    Get up and running with Scala on your computer. Complete an example assignment to familiarize yourself with our unique way of submitting assignments. In this week, we'll bridge the gap between data parallelism in the shared memory scenario (learned in the Para...
  • Week 2 - Reduction Operations & Distributed Key-Value Pairs
    This week, we'll look at a special kind of RDD called pair RDDs. With this specialized kind of RDD in hand, we'll cover essential operations on large data sets, such as reductions and joins.
  • Week 3 - Partitioning and Shuffling
    This week we'll look at some of the performance implications of using operations like joins. Is it possible to get the same result without having to pay for the overhead of moving data over the network? We'll answer this question by delving into how we can par...
  • Week 4 - Structured data: SQL, Dataframes, and Datasets
    With our newfound understanding of the cost of data movement in a Spark job, and some experience optimizing jobs for data locality last week, this week we'll focus on how we can more easily achieve similar optimizations. Can structured data help us? We'll look...

Pré-requisito

Nenhum.

Instrutores

Dr. Heather Miller
Research Scientist
EPFL

Editor

A École polytechnique fédérale de Lausanne (EPFL) é uma universidade de investigação em Lausanne, na Suíça, especializada em ciências físicas e engenharia.

A EPFL é um dos dois Institutos Federais Suíços de Tecnologia. Foi fundada pelo governo federal suíço com a seguinte missão

formar engenheiros e cientistas ao mais alto nível internacional
ser um centro nacional de excelência em ciência e tecnologia
constituir um centro de interação entre a comunidade científica e a indústria.
A EPFL é considerada uma das universidades mais prestigiadas do mundo no domínio da engenharia e da ciência. Está classificada em 17º lugar geral e 10º em engenharia no QS World University Rankings 2015; 34º lugar geral e 12º em engenharia no Times Higher Education World University Rankings 2015.

Plataforma

A Coursera é uma empresa digital que oferece um curso on-line massivo e aberto, fundado pelos professores de computação Andrew Ng e Daphne Koller Stanford University, localizado em Mountain View, Califórnia.

O Coursera trabalha com as melhores universidades e organizações para disponibilizar alguns dos seus cursos on-line e oferece cursos em várias disciplinas, incluindo: física, engenharia, humanidades, medicina, biologia, ciências sociais, matemática, negócios, ciência da computação, marketing digital, ciência de dados. e outros assuntos.Cours

Este conteúdo é classificado como 4.5 de 5
(nenhuma revisão)
Este conteúdo é classificado como 4.5 de 5
(nenhuma revisão)
Conclua este recurso para fazer uma avaliação