ТОП вопросы с СОБЕСЕДОВАНИЯ на Data Science / Дисбаланс классов, ROC-AUC, Градиентный бустинг

  Рет қаралды 12,785

miracl6

miracl6

Күн бұрын

Разбор популярных вопросов с собеседований на позицию Data Scientist
Таймкоды:
00:00 Топ-вопросы на собеседовании Data Scientist
04:45 Дисбаланс классов
02:30 Oversampling
03:14 Undersampling
04:25 Встроенные методы стратификации
04:39 Cross-validation (кросс-валидация)
06:45 Критерии для применения t-Стьюдента для аб тестирования
07:53 Градиентный бустинг и случайный лес, отличия
09:05 ROC-AUC
13:40 SQL разбор вопроса с собеседования
Отличная статья про различные виды кросс-валидации:
towardsdatascience.com/unders...
Clubhouse miracl6
Группа в ВКонтакте pymagic
Telegram t.me/pymagic
#DataScience

Пікірлер: 46
@evgheniigaisinschii3106
@evgheniigaisinschii3106 2 жыл бұрын
Спасибо вам! Это и другие ваши видео помогли мне пройти первое собеседование))
@seregapetrov6848
@seregapetrov6848 3 жыл бұрын
Спасибо за твои труды:)
@user-sd4pu2tz6d
@user-sd4pu2tz6d 3 жыл бұрын
Отличное видео 👍👍👍👍
@paljm345
@paljm345 3 жыл бұрын
Смотреть, одно наслаждение)))
@thampasaurusrex3716
@thampasaurusrex3716 3 жыл бұрын
Супер видос! Перешёл по рекламе в инсте, вообще не пожалел. Давай видос про трансформеры в nlp)
@OlegDavydov1
@OlegDavydov1 3 жыл бұрын
Анастасия, спасибо за ваши труды! Интересно было бы послушать про калибровки моделей и про стекинг/блендинг, особенно их практическое применение
@mafioznik-mg5zq
@mafioznik-mg5zq 3 жыл бұрын
очень интересно
@dmitriykalashnikov85
@dmitriykalashnikov85 3 жыл бұрын
Очень интересно, спасибо. Было бы еще здорово узнать какие задачки по питону дают на собесах, какие библиотеки в приоритете
@rustamquliyev1304
@rustamquliyev1304 3 жыл бұрын
Классное видео! Какие утилиты, программы и библиотеки вы используете при работе? Инересно было бы узнать так как недавно рашил использовать tableau и понял сколько лишнего времени я тратил на визуализацию в Питоне. Может еще пару находок услышу)
@denischo2133
@denischo2133 3 жыл бұрын
Очень интересно, а применяют аналитики данных (data analyst) машинное обучение? Я обучаюсь на данном направлении и в основном учу мат. Статистику и теорвер, надо ли изучать мл и используется ли оно в аб тестах? Если да, то какие именно? Регрессиям, случайные леса?
@user-qp6rm3bb7t
@user-qp6rm3bb7t 3 жыл бұрын
Не могли бы помочь? Рассматриваю для себя сферу Big Data(не обязательно Data Science) и хотел спросить, имеет ли смысл развиваться в этой сфере если в моем регионе эта сфера не развита и переезжать нет большого желания?
@user-eg1vy8pk1v
@user-eg1vy8pk1v 3 жыл бұрын
Джунам, конечно надо структурировать инфу, алгоритм что и когда применять.
@programisli
@programisli 3 жыл бұрын
Понятно даже программисту и очень интересно.
@harutmargaryan9980
@harutmargaryan9980 3 жыл бұрын
Ого кого я вижу. Решили выучить DS ?)
@dannydies4304
@dannydies4304 3 жыл бұрын
Миниатюра видео выглядит отлично. Хорошо выделяется и стиль подобран подходящий. Лучше чем раньше.
@gienek_mscislawski
@gienek_mscislawski 3 жыл бұрын
где такое худи брала?)
@nikitanatalin1882
@nikitanatalin1882 7 ай бұрын
Не совсем понял про дисбаланс классов. Название для тайм кода стоит «Дисбаланс классов», а говорится про перекрестную проверку…
@user-ei2oo5oh9s
@user-ei2oo5oh9s Жыл бұрын
В t-тесте требуется нормальность t-статистики, а не исходных данных, насколько помню). Просто с нормальным распределением исходных данных ЦПТ для t-статистики работает быстрее)
@user-gs6of5vv6r
@user-gs6of5vv6r 3 жыл бұрын
сними видео или курс про pyspark
@artemsivtsov6876
@artemsivtsov6876 3 жыл бұрын
Меня вот сегодня спрашивали на тему нейронных сетей следующее: всем известно что сверточные нейронки лучше различают картинки, но в 2016-2017 году на наборе данных mnist полносвязная нейронка смогла достичь результата практически как у сверточной (отличие в тысячных accuracy). Почему это произошло и почему прошло так много времени? (Ресурсы компьютеров не изменились значительно, т.е. причина в самой сети, а не во внешних факторах)
@user-py8iz3sd1v
@user-py8iz3sd1v 3 жыл бұрын
Насть, привет. Скажи, а от тебя будет туториал по scikit?)) P.s. сейчас в тытубе только в английской версии в более менее нормальном формате
@user-py8iz3sd1v
@user-py8iz3sd1v 3 жыл бұрын
@@miracl6 да, желательно конечно с объяснением основных отличий в методах
@user-py8iz3sd1v
@user-py8iz3sd1v 3 жыл бұрын
@@miracl6 что-то вроде этого kzfaq.info/get/bejne/g595p9BqmrDefGQ.html
@user-py8iz3sd1v
@user-py8iz3sd1v 3 жыл бұрын
@@miracl6 ну или конкретно про библиотеку)
@user-py8iz3sd1v
@user-py8iz3sd1v 3 жыл бұрын
@@miracl6 Насть привет) с праздником тебя) ты делаешь очень крутое и полезное дело, желаю тебе продолжать в том же духе.
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
Можете рассказать пример из практики, когда применяется t-критерий(и подобные)?
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
@@miracl6 параллель с А/Б тестированием? Это оно и есть?
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
@@miracl6 спасибо!
@zaharyanq8340
@zaharyanq8340 3 жыл бұрын
Го рум тур
@user-sx3lu6dx1z
@user-sx3lu6dx1z 7 ай бұрын
Я хотя бы понимаю о чем речь в видео, учеба прошла не зря)
@SkySystems
@SkySystems 3 жыл бұрын
Привет! Ты радикально поменяла стиль? :)
@SkySystems
@SkySystems 3 жыл бұрын
@@miracl6 раньше классические рубашки были, а теперь usa-camp))
@maratimus
@maratimus 3 жыл бұрын
*Задай нам домашние задания по какой-нибудь задаче на платформе kaggle, типа конкурса среди подписчиков📯, а потом разбери решение, заодно и у там свою учётку прокачаешь🚀🚀🚀. Просмотрел несколько выпусков, все становится как-то однообразно, теряется интерес.*
@MrBlack-cv8qn
@MrBlack-cv8qn 2 жыл бұрын
фэлс)
@havemerc
@havemerc 3 жыл бұрын
Я бы на вашем месте рассказал почему НЕ НАДО гуглить ответы на вопросы на собеседовании, если ты недостаточно знаешь, чтобы пройти собеседовании, то ты как собрался работать то?! Пройди оплавчиваемую стажировку, набей опыт, так думаю будет лучше
@havemerc
@havemerc 3 жыл бұрын
@@miracl6 о , я в это охотно верю, я с каким уже только идиотизмом не встречался , работаю инженером, как-то приходил на собеседование в аутсорс-компанию по обслуживанию серверов (опять же некорректно была составлена вакансия на хх.ру), я - инженер по наладке и испытаниям, а требовался по факту сисадмин, так ещё и требования там : знать полный стек сетевых технологий , программирование на 1с, администрирование в Линукс, уметь паять, чинить технику , производить монтаж , общаться с клиентами с графиком работы с 9 до 18 5 через 2, с испытательным сроком в 3 месяца с зп в 25 тысяч рублей, никогда так в жизни не смеялся ))
@havemerc
@havemerc 3 жыл бұрын
@@miracl6 а это, печально, проводит собеседование не непосредственный начальник , а кадровик, который не знает что вообще такое дата саенс и вообще этот совдеповский формат собеседования меня смешит, возьмите человека на испытательный срок и посмотрите что он умеет, ну зачем испытательный срок ещё нужен ?! Чтобы в первые месяцы меньше зп платить , чем положено ?)
@user-hqgh
@user-hqgh 3 жыл бұрын
Красивая девочка 👧❤️
@MrTandem31
@MrTandem31 2 жыл бұрын
Еще и умная
@user-gb5op3sc4i
@user-gb5op3sc4i Жыл бұрын
@@MrTandem31 но продажная
@egor_andryushchenko
@egor_andryushchenko 3 жыл бұрын
Можно выражаться чуть-чуть попроще, более обобщенно(желательно вообще обощить по максимуму) , вдаваться в подробности вообще желания нет.
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
Куда уж обобщеннее?! 😂
@egor_andryushchenko
@egor_andryushchenko 3 жыл бұрын
@@miracl6 Мне трудно привести пример по той причине, что Data Science не моя, скажем так, компетенция, и мне как простому человеку(тоже айтишнику, если это простой человек) трудно понять о чем речь в видео в общем(и причём тут код на фоне видео...)
@egor_andryushchenko
@egor_andryushchenko 3 жыл бұрын
@@miracl6 думаю что все-таки не надо)
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
@@egor_andryushchenko 😂😂😂👍🏻👍🏻👍🏻
تجربة أغرب توصيلة شحن ضد القطع تماما
00:56
صدام العزي
Рет қаралды 47 МЛН
Looks realistic #tiktok
00:22
Анастасия Тарасова
Рет қаралды 98 МЛН
Survival skills: A great idea with duct tape #survival #lifehacks #camping
00:27
8. МО-1 ФКН: PR-AUC и ROC-AUC
1:09:21
Лекции одного дата-шрушера
Рет қаралды 792