- 来自www.coursera.org
Big Data Analysis with Scala and Spark
课程
en
英语
28 时
此内容评级为 0/5
- 自定进度
- 免费获取
- 收费证书
- 4 序列
- 等级 介绍
课程详情
教学大纲
- Week 1 - Getting Started + Spark Basics
Get up and running with Scala on your computer. Complete an example assignment to familiarize yourself with our unique way of submitting assignments. In this week, we'll bridge the gap between data parallelism in the shared memory scenario (learned in the Para... - Week 2 - Reduction Operations & Distributed Key-Value Pairs
This week, we'll look at a special kind of RDD called pair RDDs. With this specialized kind of RDD in hand, we'll cover essential operations on large data sets, such as reductions and joins. - Week 3 - Partitioning and Shuffling
This week we'll look at some of the performance implications of using operations like joins. Is it possible to get the same result without having to pay for the overhead of moving data over the network? We'll answer this question by delving into how we can par... - Week 4 - Structured data: SQL, Dataframes, and Datasets
With our newfound understanding of the cost of data movement in a Spark job, and some experience optimizing jobs for data locality last week, this week we'll focus on how we can more easily achieve similar optimizations. Can structured data help us? We'll look...
先决条件
没有。
讲师
Dr. Heather Miller
Research Scientist
EPFL
编辑
洛桑联邦理工学院(EPFL)是位于瑞士洛桑的一所研究型大学,专门从事物理科学和工程学研究。
洛桑联邦理工学院是瑞士两所联邦理工学院之一。它由瑞士联邦政府创办,其使命如下:
培养具有国际最高水平的工程师和科学家
成为国家科技卓越中心
成为科学界与工业界互动的中心。
EPFL 被认为是世界工程和科学领域最负盛名的大学之一。在 2015 年 QS 世界大学排名中,该校总排名第 17 位,工程学专业排名第 10 位;在 2015 年泰晤士高等教育世界大学排名中,该校总排名第 34 位,工程学专业排名第 12 位。
平台
Coursera是一家数字公司,提供由位于加利福尼亚州山景城的计算机教师Andrew Ng和达芙妮科勒斯坦福大学创建的大型开放式在线课程。
Coursera与顶尖大学和组织合作,在线提供一些课程,并提供许多科目的课程,包括:物理,工程,人文,医学,生物学,社会科学,数学,商业,计算机科学,数字营销,数据科学 和其他科目。
此内容评级为 4.5/5
(没有评论)此内容评级为 4.5/5
(没有评论)完成这个资源,写一篇评论