Рет қаралды 12,785
Разбор популярных вопросов с собеседований на позицию Data Scientist
Таймкоды:
00:00 Топ-вопросы на собеседовании Data Scientist
04:45 Дисбаланс классов
02:30 Oversampling
03:14 Undersampling
04:25 Встроенные методы стратификации
04:39 Cross-validation (кросс-валидация)
06:45 Критерии для применения t-Стьюдента для аб тестирования
07:53 Градиентный бустинг и случайный лес, отличия
09:05 ROC-AUC
13:40 SQL разбор вопроса с собеседования
Отличная статья про различные виды кросс-валидации:
towardsdatascience.com/unders...
Clubhouse miracl6
Группа в ВКонтакте pymagic
Telegram t.me/pymagic
#DataScience