Чему мы вас научим в этом курсе?
Мы разберем задачу хакатона 2020 года по выделению факторов, в наибольшей степени влияющих на продолжительность жизни в России, с точки зрения фундаментальных и прикладных подходов к понижению размерности данных. В заключении построим ансамбль моделей для предсказания продолжительности жизни, базируясь на выделенных факторах.
Курс разбит на 4 части. В первой части мы последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели - линейную регрессии, решающие деревья и случайный лес. А также ансамбли машинного обучения.
Во второй части на практике разберем:
Третья часть посвящена матричным методам:
В четвертой части рассмотрим нелинейные подходы:
Кому подойдёт этот материал?
Скачать курс:
		
			
								- Процесс и модель машинного обучения
 - Заполнение пропусков в данных
 - Линейная регрессия и L1/L2 регуляризация
 - Решающие деревья и ансамбли стекинга
 - Корреляция и взаимная информация
 - Метод главных компонент (PCA)
 - Сингулярное разложение (SVD)
 - Анализ независимых компонент (ICA)
 - Многомерное шкалирование (MDS)
 - t-SNE, UMAP, LargeVis
 
- Продвинутый Python
 - Основы математической статистики
 
Мы разберем задачу хакатона 2020 года по выделению факторов, в наибольшей степени влияющих на продолжительность жизни в России, с точки зрения фундаментальных и прикладных подходов к понижению размерности данных. В заключении построим ансамбль моделей для предсказания продолжительности жизни, базируясь на выделенных факторах.
Курс разбит на 4 части. В первой части мы последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели - линейную регрессии, решающие деревья и случайный лес. А также ансамбли машинного обучения.
Во второй части на практике разберем:
- Очистку и предобработку данных - ETL
 - Линейную регрессию для экстраполяции данных
 - Линейную регрессию с регуляризацией для выделения факторов
 - Информационные критерии понижения размерности
 
Третья часть посвящена матричным методам:
- Метод главных компонент (PCA)
 - Сингулярное разложение (SVD)
 - Анализ независимых компонент (ICA)
 - Положительно-определенные матрицы (NMF)
 
В четвертой части рассмотрим нелинейные подходы:
- Многомерное шкалирование (MDS).
 - t-SNE
 - UMAP
 - LargeVis
 
Кому подойдёт этот материал?
- Аналитики Python, изучающие машинное обучение
 - Программисты больших данных
 - Исследователи больших данных
 
Скачать курс:
				Скрытое содержимое могут видеть только пользователи групп(ы): PREMIUM