- 来自www.coursera.org
Core Concepts in Data Analysis
- 自定进度
- 免费获取
- 免费证书
- 8 序列
- 等级 介绍
课程详情
教学大纲
Week 1. Intro: Examples of data and data analysis problems; visualization.
Week 2. 1D analysis. Feature scales. Histogram. Two common types of histograms: Gaussian and Power Law. Central values. Minkowski distance and data recovery view. Validation with Bootstrap.
Week 3-4. 2D analysis cases:
(Both quantitative: Scatter-plot, linear regression, correlation and determinacy coefficients: meaning and properties. Both nominal: Contingency table, Quetelet index, Pearson chi-squared coefficient, its double meaning and visualization).
Week 5-6. Learning multivariate correlations
(Bayes approach and Naïve Bayes classifier with a Bag-of-words text model; Decision trees and criteria for building them.)
Week 7. Principal components (PCA) and SVD
(SVD model behind PCA: student marks as the product of subject factor scores and subject loadings. Application to deriving a hidden underlying factor. Data visualization with PCA. Conventional PCA and data normalization issues.)
Week 8. Clustering with k-means
(K-Means iterations and K-Means features
K-Means criterion. Anomalous clusters and intelligent K-Means.)
先决条件
讲师
- Boris Mirkin - Department of Data Analysis and Artificial Intelligence
编辑
莫斯科国立研究大学 "高等经济学院"(EHESE)于 1992 年在俄罗斯经济学家的倡议下成立。
自 2001 年以来,它一直是一所国立大学,最初由经济发展部监管,自 2008 年以来,它一直是直属于俄罗斯联邦政府的高等教育和研究机构。经过校际竞赛,该校于 2009 年被授予俄罗斯国立研究型大学的地位。
它在国际上被称为高等经济学院(HSE)。
除莫斯科外,该校还在圣彼得堡、下诺夫哥罗德和彼尔姆设有三个附属校区。
在 QS 世界大学排名中,该校经常名列世界最佳大学前 100 名,在俄罗斯名列第二4。
平台
Coursera是一家数字公司,提供由位于加利福尼亚州山景城的计算机教师Andrew Ng和达芙妮科勒斯坦福大学创建的大型开放式在线课程。
Coursera与顶尖大学和组织合作,在线提供一些课程,并提供许多科目的课程,包括:物理,工程,人文,医学,生物学,社会科学,数学,商业,计算机科学,数字营销,数据科学 和其他科目。