Big Data Analysis with Apache Spark
link Origem: www.edx.org
date_range Inicia em 15 de junho de 2016
event_note Termina em 20 de junho de 2016
list 4 sequencias
assignment Nível: Introdutório
chat_bubble_outline Idioma : Inglês
card_giftcard 1 ponto
Avaliações
-
starstarstarstarstar
Ver avaliação

Informações principais

credit_card Free accesso

Sobre o conteúdo

Organizations use their data to support and influence decisions and build data-intensive products and services, such as recommendation, prediction, and diagnostic systems. The collection of skills required by organizations to support these functions has been grouped under the term ‘data science’.

This statistics and data analysis course will attempt to articulate the expected output of data scientists and then teach students how to use PySpark (part of Spark) to deliver against these expectations. The course assignments include log mining, textual entity recognition, and collaborative filtering exercises that teach students how to manipulate data sets using parallel processing with PySpark.

This course covers advanced undergraduate-level material. It requires a programming background and experience with Python (or the ability to learn it quickly). All exercises will use PySpark (the Python API for Spark), and previous experience with Spark equivalent to Introduction to Spark, is required.

more_horiz Ler mais
more_horiz Ler menos
dns

Programa de estudos

  • How to use Apache Spark to perform data analysis
  • How to use parallel programming to explore data sets
  • Apply log mining, textual entity recognition and collaborative filtering techniques to real-world data questions
record_voice_over

Instrutores

  • Anthony D. Joseph
  • Jon Bates
store

Criador do conteúdo

Berkeley

A Universidade da Califórnia, Berkeley, foi fundada em 1868 e o seu campus principal - concebido como uma "Cidade de Aprendizagem" - foi estabelecido em Berkeley, na Baía de São Francisco. O corpo docente de Berkeley é constituído por 1.582 professores a tempo inteiro e 500 a tempo parcial, dispersos por mais de 130 departamentos académicos e mais de 80 unidades de investigação interdisciplinares. Os antigos alunos de Berkeley receberam 28 prémios Nobel e, entre os actuais professores, há oito laureados com o Prémio Nobel, 32 MacArthur Fellows e quatro vencedores do Prémio Pulitzer.

Em setembro de 2012, para assinalar o compromisso de Berkeley com a inovação no ensino e na aprendizagem, foi criado o Berkeley Resource Center for Online Education (BRCOE). O Centro é um centro de recursos e um catalisador operacional para todos os recursos internos do campus e externos para aconselhar, coordenar e facilitar as iniciativas de educação em linha da Universidade, desde cursos com e sem créditos, a programas de licenciatura em linha e projectos MOOC, incluindo a iniciativa MOOCLab.

assistant

Plataforma

Edx

EdX est une plateforme d'apprentissage en ligne (dite FLOT ou MOOC). Elle héberge et met gratuitement à disposition des cours en ligne de niveau universitaire à travers le monde entier. Elle mène également des recherches sur l'apprentissage en ligne et la façon dont les utilisateurs utilisent celle-ci. Elle est à but non lucratif et la plateforme utilise un logiciel open source.

EdX a été fondée par le Massachusetts Institute of Technology et par l'université Harvard en mai 2012. En 2014, environ 50 écoles, associations et organisations internationales offrent ou projettent d'offrir des cours sur EdX. En juillet 2014, elle avait plus de 2,5 millions d'utilisateurs suivant plus de 200 cours en ligne.

Les deux universités américaines qui financent la plateforme ont investi 60 millions USD dans son développement. La plateforme France Université Numérique utilise la technologie openedX, supportée par Google.

Você é o criador deste MOOC?
Qual a sua apinião sobre esse recurso?
Conteúdo
5/5
Platforma
5/5
Didática
5/5