
Важная информация
Резюме
В машинном обучении встречаются задачи, где нужно изучить структуру данных, найти в них скрытые взаимосвязи и закономерности. Например, нам может понадобиться описать каждого клиента банка с помощью меньшего количества переменных — для этого можно использовать методы понижения размерности, основанные на матричных разложениях. Такие методы пытаются сформировать новые признаки на основе старых, сохранив как можно больше информации в данных. Другим примером может служить задача тематического моделирования, в которой для набора текстов нужно построить модель, объясняющую процесс формирования этих текстов из небольшого количества тем. Такие задачи назвают обучением без учителя. В отличие от обучения с учителем, в них не предполагают восстановление зависимости между объектами и целевой переменной. Из этого курса вы узнаете об алгоритмах кластеризации данных, с помощью которых, например, можно искать группы схожих клиентов мобильного оператора. Вы научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные.
Программа
- Week 1 - Кластеризация
Добро пожаловать на курс "Поиск структуры в данных"! В этом курсе вы узнаете про задачи машинного обучения, в которых требуется не предсказать целевую переменную, а найти некоторые внутренние закономерности в данных — например, сгруппировать объекты по схожест... - Week 2 - Понижение размерности и матричные разложения
В предыдущем модуле мы обсуждали, как кластеризовать объекты, а в этом модуле займёмся признаками. Нередко возникают ситуации, в которых далеко не все признаки нужны для решения задачи — или же нужны все, но при этом их слишком много. В этом случае нужно перей... - Week 3 - Визуализация и поиск аномалий
Добро пожаловать на третью неделю курса! В ней мы обсудим две задачи: обнаружение аномалий и визуализация данных. Обнаружение аномалий направлено на поиск объектов, которые являются особенными в некотором смысле. Например, это могут объекты с такими значениями... - Week 4 - Тематическое моделирование
Люди уже много веков сохраняют свои знания в виде книг, а крупнейшая на сегодняшний день коллекция информации — Интернет — состоит из огромного количества текстов. Тексты, по сути, являются наиболее популярным видом данных, и поэтому очень важно уметь искать в...
Пользователи
Victor Kantor
Evgeniy Riabenko
Evgeny Sokolov
Константин Воронцов
доктор физико-математических наук, профессор
Кафедра интеллектуальных систем
Emeli Dral
Разработчик

Платформа

Coursera - это цифровая компания, предлагающая массовые открытые онлайн-курсы, основанные учителями компьютеров Эндрю Нгом и Стэнфордским университетом Дафни Коллер, расположенные в Маунтин-Вью, штат Калифорния.
Coursera работает с ведущими университетами и организациями, чтобы сделать некоторые из своих курсов доступными в Интернете, и предлагает курсы по многим предметам, включая: физику, инженерию, гуманитарные науки, медицину, биологию, социальные науки, математику, бизнес, информатику, цифровой маркетинг, науку о данных и другие предметы.