- De www.coursera.org
Big Data Analysis with Scala and Spark
- Individualizado
- Acesso livre
- Certificado pago
- 4 sequências
- Introductive Level
Detalhes do curso
Programa de Estudos
- Week 1 - Getting Started + Spark Basics
Get up and running with Scala on your computer. Complete an example assignment to familiarize yourself with our unique way of submitting assignments. In this week, we'll bridge the gap between data parallelism in the shared memory scenario (learned in the Para... - Week 2 - Reduction Operations & Distributed Key-Value Pairs
This week, we'll look at a special kind of RDD called pair RDDs. With this specialized kind of RDD in hand, we'll cover essential operations on large data sets, such as reductions and joins. - Week 3 - Partitioning and Shuffling
This week we'll look at some of the performance implications of using operations like joins. Is it possible to get the same result without having to pay for the overhead of moving data over the network? We'll answer this question by delving into how we can par... - Week 4 - Structured data: SQL, Dataframes, and Datasets
With our newfound understanding of the cost of data movement in a Spark job, and some experience optimizing jobs for data locality last week, this week we'll focus on how we can more easily achieve similar optimizations. Can structured data help us? We'll look...
Pré-requisito
Instrutores
Dr. Heather Miller
Research Scientist
EPFL
Editor
A École polytechnique fédérale de Lausanne (EPFL) é uma universidade de investigação em Lausanne, na Suíça, especializada em ciências físicas e engenharia.
A EPFL é um dos dois Institutos Federais Suíços de Tecnologia. Foi fundada pelo governo federal suíço com a seguinte missão
formar engenheiros e cientistas ao mais alto nível internacional
ser um centro nacional de excelência em ciência e tecnologia
constituir um centro de interação entre a comunidade científica e a indústria.
A EPFL é considerada uma das universidades mais prestigiadas do mundo no domínio da engenharia e da ciência. Está classificada em 17º lugar geral e 10º em engenharia no QS World University Rankings 2015; 34º lugar geral e 12º em engenharia no Times Higher Education World University Rankings 2015.
Plataforma
A Coursera é uma empresa digital que oferece um curso on-line massivo e aberto, fundado pelos professores de computação Andrew Ng e Daphne Koller Stanford University, localizado em Mountain View, Califórnia.
O Coursera trabalha com as melhores universidades e organizações para disponibilizar alguns dos seus cursos on-line e oferece cursos em várias disciplinas, incluindo: física, engenharia, humanidades, medicina, biologia, ciências sociais, matemática, negócios, ciência da computação, marketing digital, ciência de dados. e outros assuntos.Cours