Рет қаралды 21,024
Курс по Data Science pymagic.ru
Мое сообщество ВКонтакте pymagic
Telegram t.me/pymagic
Соревнования на Kaggle www.kaggle.com/c/nyc-taxi-tri...
Таймкоды:
00:00 Разбор соревнования на Kaggle
00:28 Кратко о чем ролик - AutoML LAMA, подбор гиперпараметров при помощи Optuna
00:52 Обзор соревнования Kaggle - New York City Taxi Trip Duration
01:48 Импорт данных, какие еще внешние данные понадобятся и как их скачать
02:52 Смотрим на данные
03:38 EDA - Разведочный анализ данных
04:08 EDA. Анализ основных статистик, выбросы
06:07 Feature engineering, добавление новых признаков, трансформация текущих
08:33 Анализ распределения целевой переменной, логарифмирование
09:30 Анализ и удаление выбросов
10:49 EDA. Анализ признаков (длительность от часа, когда была начала поездка и т д), корреляция
12:12 Подготовка к обучению модели LightGBM
13:07 Построение целевой функции для Optuna для оптимизации гиперпараметров
15:04 Поиск оптимальных параметров при помощи Optuna, визуализация
16:43 Обучаем итоговую модель на подобранных параметрах, смотрим значение метрики RMSLE
17:43 AutoML LAMA с чего начинать / Создание задачи, ролей, структуры модели
20:03 Обучение при помощи AutoML LAMA / Подбор моделей / Анализ результатов
22:49 Feature importance у модели LightGBM and Optuna
23:40 Feature importance у AutoML LAMA
24:59 Сообщество PyMagic в ВКонтакте
Группа в ВКонтакте pymagic
Telegram t.me/pymagic
#DataScience #Kaggle