Kaggle Data Science Project - Predict the effect of Genetic Variants

  Рет қаралды 10,917

miracl6

miracl6

4 жыл бұрын

Курс Data Science для начинающих PyMagic
Подробная информация о курсе, программа обучения по ссылке - pymagic.ru
В этом видео мы сделаем с вами проект на Kaggle, попробуем написать наш первый код на этой площадке, приняв участие в соревновании по классификации генетических мутаций на основании клинических данных.
Разберем часть моментов, которые могут помочь вам улучшить ваш скор и положение в турнирной таблице.
Notebook: www.kaggle.com...
Как вязаться со мной, если вам нужна помощь/остались какие-либо вопросы:
Instagram* / miracl6_
Группы в ВКонтакте pymagic
Telegram t.me/pymagic
*Компания Meta - организация, деятельность которой запрещена на территории Российской Федерации
#Kaggle #DataScience

Пікірлер: 28
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
Отличное видео! Было бы очень интересно увидеть еще из подобной серии! Подобные видео важны как воздух для новичков! А то с индусами(с их английским) так себе занятие.)
@vrabosh
@vrabosh 3 жыл бұрын
Кассно обьясняешь, делай больше таких ноутбуков и видео пояснения к ним.
@queeni486
@queeni486 2 жыл бұрын
Спасибо, вы умница! 👍
@yuryprokhorov7
@yuryprokhorov7 4 жыл бұрын
Круто, спасибо!
@OleksiiM4
@OleksiiM4 3 жыл бұрын
Очень полезное видео. Правда хотелось бы услышать больше деталей про XGBoost - что это такое, для чего он используется и что за модель он реализует и что такое стоп-слова при препроцессинге текста, поскольку эти моменты далеко не очевидны
@romannaumov6477
@romannaumov6477 4 жыл бұрын
Спасибо! Очень полезное видео! Разбор задач с распознаванием изображений очень интересны:)
@user-kl7nj9ds5c
@user-kl7nj9ds5c 3 жыл бұрын
Спасибо!!!
@soraxsorax2535
@soraxsorax2535 3 жыл бұрын
Вязаться с вами было бы довольно интересно. Бабушка меня хорошо обучила
@felixmusic3645
@felixmusic3645 4 жыл бұрын
Еще бывают интересные хакатоны по DS. Я в начале лета учавствовал в prohack от McKinsey&Company с призовым фондом 25000$. Занял что-то 480 место из 860 ))) но преисполнился в познании за этот месяц очень лихо. Причем начал сразу с него, минуя kaggle. С kaggle как раз брал различные интересные куски из ноутбуков по задачам регрессии. После хакатона один парень из Африки опубликовал свой ноутбук на kaggle, у него RMSE в два раза меньше моей была, мы еще с ним пообщались немного, я тоже свой ноутбук опубликовал по его совету. А пару дней назад у меня ноут сдох, беда-печаль. Кстати, kaggle предоставляет облако для работы, 4 ядра и 8гб памяти, кажется. Так что если комп у кого слабый, можно юзать этот сервис. Есть и другие платформы бесплатные, но kaggle мне показалась самой мощной из них.
@andreygolobokov372
@andreygolobokov372 4 жыл бұрын
интересны соревнования с распознаванием аудио.
@DataEngTi
@DataEngTi 4 жыл бұрын
Я бы с радостью послушал про sota решения в разных спецификах изображений и нлп тоже) Спасибо за видео!
@petyap7600
@petyap7600 3 жыл бұрын
Сайт Papers with code гугли.
@user-ju3zk2mx3b
@user-ju3zk2mx3b 4 жыл бұрын
Это довольно интересно, интересно было бы спарсить открытые данные и использовать методы НЛП для задач классификации или кластеризации.
@salivona
@salivona 3 жыл бұрын
Спасибо!
@ehrlich6795
@ehrlich6795 3 жыл бұрын
Девочка как и тема - бомба!
@user-zh1zd9je9u
@user-zh1zd9je9u 4 жыл бұрын
Добрый день. Довольный грубый подход. Почему не использовалось приведение слов к основной форме? из-за этого матрица признаков имеет очень высокую размерность. Почему не использовался, например, w2v который на выходе имеет более низкую размерность векторного представления слов - словосочетаний. Будет ли обзор современных трансформеров?
@jamesmiller2521
@jamesmiller2521 4 жыл бұрын
Примета для начинающих: если вам удалось сабмитнуть свой вариант с первого раза, то вы - Избранный )))
@user-uy8nb1pn7g
@user-uy8nb1pn7g 3 жыл бұрын
В титанике с первого раза влетел в топ 10% не понимая что я вообще делаю С определением цены дома посложнее, мало того что я часа три не мог засабмиттить потому что там в описании два столбца: id и saleprice, а должно быть три: indех, id и saleprice. Для кого-то это сразу понятно а у меня оторвалась ж**а. Так ещё и получил 4600 из 4800 место)
@vladislavevteev8822
@vladislavevteev8822 3 жыл бұрын
@@miracl6 мой стандарт в каждом соревновании это забыть при генерации сабмита при помощи "pd.to_csv()" указать index=False, и ломать голову почему kaggle не хочет пускать мой гениальный baseline в LB.
@galymzhankenesbekov2924
@galymzhankenesbekov2924 3 жыл бұрын
Отличное видео) на распознавание объектов пожалуйста.
@gulfstream1800
@gulfstream1800 4 жыл бұрын
Топ
@TheKarlitoMontana
@TheKarlitoMontana 4 жыл бұрын
Это всё хорошо, но девочка красивая :)
@linkernick5379
@linkernick5379 3 жыл бұрын
Почму "но"? Более подходящий союз "и"!
@serverbotbot8809
@serverbotbot8809 3 жыл бұрын
А почему гусь?
@Rosko6nii90
@Rosko6nii90 2 жыл бұрын
Делай ролики без видео, где видно тебя. Ты очень кравсивая и это отвлекает. P.S. - но всё равно остаётся твой голос... заниматься не возможно
@djey36
@djey36 Жыл бұрын
@@miracl6 возможно таки и вполне нормальная. Согласен с автором.
Finger Heart - Fancy Refill (Inside Out Animation)
00:30
FASH
Рет қаралды 32 МЛН
Jumping off balcony pulls her tooth! 🫣🦷
01:00
Justin Flom
Рет қаралды 33 МЛН
A teacher captured the cutest moment at the nursery #shorts
00:33
Fabiosa Stories
Рет қаралды 61 МЛН
👨‍🔧📐
00:43
Kan Andrey
Рет қаралды 9 МЛН
Exploratory Data Analysis with Pandas Python
40:22
Rob Mulla
Рет қаралды 454 М.
Разбор реальной data science задачи
38:51
Alexander Ershov
Рет қаралды 193 М.
День из жизни аналитика данных (мой день в 2023)
5:45
Аналитика и growth mind-set
Рет қаралды 68 М.
Finger Heart - Fancy Refill (Inside Out Animation)
00:30
FASH
Рет қаралды 32 МЛН