
- Длительность: 3 месяца
- Объем часов: 44 акад.ч.
- Сертификат + Свидетельство о повышении квалификации
- Начало занятий: Сбор заявок
Системное понимание машинного обучения для управления проектами/командами по разработкам в области искусственного интеллекта, умение корректно решать практические задачи с использованием алгоритмов машинного обучения, подготовка для работы на позиции специалист по данным (Data Scientist) – три цели, которые ставит перед слушателями данный курс.
Курс включает следующие темы:
Неделя 1
Введение в курс. Подготовка данных для моделирования в Python c использованием пакетов Numpy и Pandas: объекты Ndarray, Series, DataFrame, а также атрибуты методы и функции для работы с ними.
Неделя 2
Обучение с учителем – Регрессия. Математическая модель линейной регрессии. Нахождение коэффициентов методом градиентного спуска. Модели линейной регрессии с полиномиальными переменными и регуляризацией. Метрики оценки качества моделей регрессии. Валидация моделей.
Неделя 3
Обучение с учителем – Классификация. Модели классификации: линейная модель и модели на основе ансамблей деревьев решений. Метрики оценки качества моделей классификации. Задачи бинарной и мультикласс классификации. Проблема несбалансированных классов. Оптимизация гиперпараметров модели.
Подготовка данных для моделирования, генерация новых переменных.
Неделя 4
Анализ и прогнозирование временных рядов. Понятие временного ряда. Стационарные и нестационарные временные ряды, понятие тренда, сезонности, цикличности. “Наивные” модели. Семейство моделей ARIMA. Метрики оценки качества моделей прогнозирования временных рядов.
Неделя 5
Фреймворк H2O для машинного обучения.
Мини дататон: решение практических кейсов с помощью моделей регрессии, классификации и прогнозирования временных рядов.
Неделя 6
Обучение без учителя. Кластерный анализ. Задачи и оценка качества кластеризации. Типы кластеризации: плоская, иерархическая, мягкая. Метод K-Means. Сравнение плоских методов. Агломеративная кластеризация, построение дендрограммы.
Неделя 7
Моделирование и анализ текстовой информации. Задачи Natural Language Processing. Способы представления текста в моделировании. Ключевые методы предобработки текстовой информации. Пакеты для обработки текстовой информации в языке Python.
Неделя 8
Нейронные сети. Виды нейронных сетей. Глубокое обучение. Алгоритм обратного распространения ошибки. Пример решения задачи классификации изображений с помощью многослойной полносвязной нейронной сети. Фреймворк Keras.
Неделя 9
Рекуррентные нейронные сети и их применение. LSTM. Сверточные нейронные сети. Операции “свертка” и “пулинг”. Эмбеддинги. Применение нейронных сетей при обработке текста и изображений. Пример решения задачи классификации текстовой информации с помощью рекуррентной нейронной сети.
Неделя 10
Рекомендательные системы. Коллаборативная фильтрация. Факторизация матриц. Нейросетевые подходы в рекомендательных системах. Методы оценки рекомендательных систем. Проблема холодного старта.
Неделя 11
Защита выпускных проектов.