Разбор СТАТИСТИКИ в Python для Data Science / EASY level

  Рет қаралды 16,437

miracl6

miracl6

3 жыл бұрын

Рассматриваем основные темы из теоретического урока по статистике, учимся применять и понимать различные определения и критерии на практике, какие функции задействованы, почему важно визуально отображать ваши основные статистики, и почему вы иногда встречаете в EDA тот или иной график.
Группа в ВКонтакте pymagic
Telegram t.me/pymagic
#DataScience #Статистика

Пікірлер: 40
@urun398
@urun398 3 жыл бұрын
Очень понравился такой формат видео. Было бы здорово увидеть больше видео подобного плана, гле именно практические примеры, так значительно проще и понятнее сразу все становится
@innfdtfjord3340
@innfdtfjord3340 3 жыл бұрын
Очень полезно и доступно, спасибо)
@linkernick5379
@linkernick5379 3 жыл бұрын
Спасибо, нравится смотреть ваши уроки и просто рассуждения обо всём.
@user-ti1tn1dk9y
@user-ti1tn1dk9y 3 жыл бұрын
Именно то, чего не хватало сейчас для решения задачи, спасибо)))
@mahammadmammadov9307
@mahammadmammadov9307 3 жыл бұрын
очень давно искал такое объяснение, спасибо вам огромное за ваш труд)))))
@timickb
@timickb 3 жыл бұрын
Лучшее, что увидел за неделю
@user-nr1rs5ft4b
@user-nr1rs5ft4b 3 жыл бұрын
Спасибо вам
@SergeyTheBold
@SergeyTheBold 3 жыл бұрын
Классный канал, респект!
@destro7770
@destro7770 3 жыл бұрын
спасибо, узнал много нового, как раз пишу диссертацию на пандасе)
@user-kf8gf5qp7p
@user-kf8gf5qp7p 3 жыл бұрын
Спасибо!!!
@user-nb3zz4yc1l
@user-nb3zz4yc1l 3 жыл бұрын
Super!!!
@osvab000
@osvab000 3 жыл бұрын
Лайкую!
@davitmartirossian3267
@davitmartirossian3267 2 жыл бұрын
Спосибо тебе огромное)))))
@valentynbugaichuk9751
@valentynbugaichuk9751 3 жыл бұрын
Делал лабу по корреляционному анализу с этим датасетом, только на R. Было интересно послушать как вы подходите к анализу, ваши размышления и тд. Спасибо
@user-ep2jp5qd1h
@user-ep2jp5qd1h 4 ай бұрын
@miracl6, контент - потрясающий, спасибо! Можно такого и почаще!)) На мой взгляд есть неточности: 1. Почему распределение бимодальное, если на гистограммах видим явно выраженную одну моду, т. е. распределение унимодальное получается?)) 2. р-значение намного меньше приведенного alpha=0.05, 1.52e-24 - это 1.52 * 10**(-24) и в соответствии с этим отклоняем H0 и принимаем H1.
@georgyshipovnikov5109
@georgyshipovnikov5109 3 жыл бұрын
Ждём сложный уровень !)
@erostar7489
@erostar7489 3 жыл бұрын
Настя, спасибо за видео! Вы молодец ) вопрос появился такой: нужно ли для регрессии распределение из биномиального генерировать в нормальное?
@osvab000
@osvab000 3 жыл бұрын
Если р < 0.05 - отклоняем 0-гипотезу, если p > 0.05 то у нас нет оснований для отклонения 0 -гипотезы. Можно и так объяснить эти дилеммы.
@OleksiiM4
@OleksiiM4 3 жыл бұрын
Классное видео. Хотелось бы добавить, чисто для себя, смысл проверки тех или иных гипотез. Возможно это видео предназначалось больше для того, чтобы посмотреть как считать статистики с помощью фреймворков Python, но после каждой гипотезы так и напрашивался вопрос "ИЧО??". А в целом 10 слоновых котиков из 10
@OleksiiM4
@OleksiiM4 3 жыл бұрын
@@miracl6 Меня немного сбила проверка второй гипотезы на двух подвыборках, но потом я услышал, что это было сделано просто показать как работает функция t Сьюдента
@pultural
@pultural 3 жыл бұрын
все такие небольшая неясность присутствует. хотел бы для себя уяснить правильно ли я понял, что: альфа (а) - это (пороговый) уровень значимости (задаём по таблице), p в данном примере - это p-value из критерия Шапиро-Уилка (stat - статистика этого критерия). в итоге мы получили, что p < a (=0,05), значит отвергается нулевая гипотеза, так как с вероятностью 1 - а = 0,95 (95%) распределение не является нормальным. P. S. За видео однозначно лайк, вы, Анастасия, и ваш канал замечательные, буду ждать с нетерпением ещё контента по теме DS!
@skyz6830
@skyz6830 3 жыл бұрын
Вот бы ещё блокнот)
@avecoder
@avecoder 3 жыл бұрын
вот каким на самом деле должен быть канал Like Nastya ))
@VS-le2ep
@VS-le2ep 7 ай бұрын
Значение 1.5e-24 намного больше 0,05? Оговорка?
@user-py8iz3sd1v
@user-py8iz3sd1v 3 жыл бұрын
Настя,здравствуйте. Спасибо за видео, было интересно. Скажите, Вы можете написать методы pandas которыми чаще всего пользуетесь? Заранее спасибо
@user-py8iz3sd1v
@user-py8iz3sd1v 3 жыл бұрын
@@miracl6 огонь) спасибо большое за труд
@user-nw9dx4fj9s
@user-nw9dx4fj9s 3 жыл бұрын
очень классно, спасибо тебе! зашерь пожалуйста блокнотик нам, будем очень признательны, в тренды ютуба тебя выведем за это, чесслово =)
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
6:55 а почему не F-распределение? 14:16 А я часто встречал, что для ген совокупности это среднеквадратичное отклонение, а для выборки - стандартное отклонение. Так как на самом-то деле?) Спасибо за видео!
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
@@miracl6 вам спасибо за то, что занимаетесь подобными роликами. Было бы так же интересно увидеть от вас например серию роликов, полноценного проекта. Полностью все стадии поэтапно: предобработка, feature engineering, обучение и подбор гиперпараметров с самыми популярными моделями мо и т. д. Было бы очень круто! Ну это так) Пожелание подписчика)
@ivan_inanych
@ivan_inanych 2 жыл бұрын
откуда автор знала, что я пришёл сюда вспоминать свой курс института
@svyatocheckjoe9820
@svyatocheckjoe9820 3 жыл бұрын
Ребят, приветствую. Есть вопрос по процессу обучения на эту специальность. Как мне лучше Учить матешу, начиная подряд со школьного уровня, или учить области математики конкретно из DS при необходимости спускаясь до школы? Вопрос возможно глупый, но у меня вызывает сомнения. Как минимум этот вопрос напрямую имеет отношение к временным затратам. Буду благодарен, если опишите ваш процесс обучения. Учусь самостоятельно, в университете, параллельно, получаю специальность из Computer Science.
@ickermaid1461
@ickermaid1461 3 жыл бұрын
Спасибо, очень познавательное видео, но разве у нас не наоборот ситуация обстоит? Когда p-value < 0.05, то мы принимаем нулевую гипотезу. Или я что-то напутал?
@leaschneider67
@leaschneider67 2 жыл бұрын
P-value - вероятность ошибиться насчёт того, что обнаруженная закономерность есть в ГС. То есть, чем больше это значение, тем больше будет наша ошибка в том, чтобы отвергнуть нулевую гипотезу. Значит, если вероятность меньше 5% - скорее всего, есть какая-то закономерность, потому что вероятность ошибиться очень маленькая))
@MrTSkV
@MrTSkV 3 жыл бұрын
Мода, медиана и среднее будут не совпадать и у унимодального распределения, если оно скошено. Бимодальность не обязательна.
@iryna268
@iryna268 2 жыл бұрын
Спасибо! Классные видео на канале ! У меня возник вопрос по коррелиции. Я видела информацию о том, что если корреляция малекнька(0.0..) c таргетом и эта feature не имеет нормального распределения , то нам стоит нормализовать данные этой feature . А в случае если корреляция высокая не стоит ничего делать даже если feature не имеет нормального распределения. Так ли это ? Если да, то как нормализация помогает в первом случае ? и почему не имеет значения в втором? Спасибо за ответ !
@alexshepotko1166
@alexshepotko1166 3 жыл бұрын
А на каком уровне нужно знать питон, чтобы работать Data scientist?
@evgenyartyomov3697
@evgenyartyomov3697 3 жыл бұрын
когда некст левел будет ?
@olgarenard67
@olgarenard67 2 жыл бұрын
+++
@Shamshurin_Alexander
@Shamshurin_Alexander 2 жыл бұрын
Начал изучать статистику, начал путаться в опнятиях/определениях: ест описательнАЯ статистикА и описательнЫЕ статистикИ. Не могу до конца понять разницу
@VS-le2ep
@VS-le2ep 7 ай бұрын
описательная статистика - раздел науки (погугли), а статистики - это свойства конкретные, характеристики чего-либо
1❤️
00:17
Nonomen ノノメン
Рет қаралды 9 МЛН
OMG😳 #tiktok #shorts #potapova_blog
00:58
Potapova_blog
Рет қаралды 4,2 МЛН
THEY WANTED TO TAKE ALL HIS GOODIES 🍫🥤🍟😂
00:17
OKUNJATA
Рет қаралды 13 МЛН
🌊Насколько Глубокий Океан ? #shorts
00:42
Математическая статистика на python
1:57:20
Aleksandr Dzhumurat
Рет қаралды 6 М.
Представила свой проект. Матчинг товаров. Курс Data Science Плюс.
8:42
Alanovna vlog. Мой путь в Data Science.
Рет қаралды 2 М.
Эти жанры музыки = твой успех (Data Science)
25:01
Вадик Углов
Рет қаралды 6 М.
Описательная статистика на Python
8:12
Retro Calculate Devices
Рет қаралды 209
01-11 Описательные статистики и pandas
12:33
Прикладная статистика
Рет қаралды 2,2 М.
Успех в музыке неизбежен (Data Science)
40:22
Вадик Углов
Рет қаралды 27 М.
1❤️
00:17
Nonomen ノノメン
Рет қаралды 9 МЛН