Core Concepts in Data Analysis

МООК
en
Английский
48 h
This content is rated 4.5 out of 5
Source
  • From www.coursera.org
Conditions
  • Self-paced
  • Free Access
  • Бесплатный сертификат
More info
  • 8 Sequences
  • Introductive Level

Their employees are learning daily with Edflex

  • Safran
  • Air France
  • TotalEnergies
  • Generali
Learn more

Course details

Syllabus

Week 1. Intro: Examples of data and data analysis problems; visualization.       

                     

Week 2. 1D analysis. Feature scales. Histogram. Two common types of histograms: Gaussian and Power Law. Central values. Minkowski distance and data recovery view. Validation with Bootstrap.           

                       

Week 3-4. 2D analysis cases:

(Both quantitative: Scatter-plot, linear regression, correlation and determinacy coefficients: meaning and properties. Both nominal: Contingency table, Quetelet index, Pearson chi-squared coefficient, its double meaning and visualization).                                                              

Week 5-6. Learning multivariate correlations

(Bayes approach and Naïve Bayes classifier with a Bag-of-words text model; Decision trees and criteria for building them.)                      

                       

Week 7. Principal components (PCA) and SVD

(SVD model behind PCA: student marks as the product of subject factor scores and subject loadings. Application to deriving a hidden underlying factor. Data visualization with PCA. Conventional PCA and data normalization issues.)

 

Week 8. Clustering with k-means

(K-Means iterations and K-Means features   

K-Means criterion. Anomalous clusters and intelligent K-Means.)

Prerequisite

None.

Instructors

  • Boris Mirkin - Department of Data Analysis and Artificial Intelligence

Editor

L'Université nationale de recherche « École des hautes études en sciences économiques » (EHESE), de Moscou a été fondée en 1992 à l'initiative d'économistes russes.

Université d'État depuis 2001, d'abord sous tutelle du ministère du développement économique, elle est depuis 2008 un établissement d'enseignement supérieur et de recherche rattaché directement au gouvernement de la fédération de Russie. Son statut actuel d'université nationale de recherche de Russie lui a été conféré en 2009, après un concours inter-universitaire.

Elle est connue à l'international sous le nom de Higher School of Economics (HSE).

Outre Moscou, l'école possède trois campus-filiales : à Saint-Pétersbourg, Nijni Novgorod et Perm.

Régulièrement classée dans le Top 100 des meilleures universités mondiales selon le QS World University Rankings, elle est la seconde plus réputée4 de Russie.

Platform

Coursera - это цифровая компания, предлагающая массовые открытые онлайн-курсы, основанные учителями компьютеров Эндрю Нгом и Стэнфордским университетом Дафни Коллер, расположенные в Маунтин-Вью, штат Калифорния.

Coursera работает с ведущими университетами и организациями, чтобы сделать некоторые из своих курсов доступными в Интернете, и предлагает курсы по многим предметам, включая: физику, инженерию, гуманитарные науки, медицину, биологию, социальные науки, математику, бизнес, информатику, цифровой маркетинг, науку о данных и другие предметы.

Complete this resource to write a review