EDA, Разведочный и первичный анализ данных | Система рекомендаций | MATPLOTLIB, SEABORN, PANDAS

  Рет қаралды 4,464

machine learrrning

machine learrrning

Күн бұрын

Практическое задание на boosty boosty.to/machine_learrrning/...
Поддержать канал можно оформив подписку на boosty.to/machine_learrrning
Канал в TG t.me/machine_learrrning
Группа в VK machine_learrrning
Курсы на платформе Stepik:
1. Библиотеки Python для Data Science stepik.org/a/129105
2. Введение в нейронные сети (Keras/Tensorflow) stepik.org/a/127274
На занятии рассмотрим:
1. Анализ набора данных H&M
2. Система рекомендаций, основанная на похожести клиентов (Collaborative filtering)
0:00 Вводная
0:46 Поддержка на boosty.to/machine_learrrning
1:17 Знакомство с данными
2:00 Датасет Articles
4:03 Анализ категории товара
4:44 Анализ категории в зависимости от раздела товара
7:15 Анализ типа товара
8:20 Анализ графических элементов на товаре
8:57 Анализ цвета товара
9:50 Датасет Customers
10:46 Аномалия в данных
11:56 Анализ возраста клиентов
12:35 Анализ статуса в клубе H&M
12:54 Анализ частоты отправки сообщений
14:04 Датасет Transactions
14:21 Анализ стоимости покупок
15:05 Выбросы в стоимости
15:42 Анализ частопокупающих клиентов
16:21 Анализ стоимости покупок внутри одной группы
21:15 Анализ стоимости по времени
24:35 Система рекомендаций, основанная на коллаборации (collaborative filtering)
28:48 Косинусная похожесть (cosine similarity)
32:54 Получение рекомендаций для клиента
35:36 ♡

Пікірлер: 22
@user-fz3lw9yk1r
@user-fz3lw9yk1r 22 күн бұрын
Отличное аидео, спасибо!!
@vitaliibali
@vitaliibali 2 жыл бұрын
Класс! Класс! Очень хорошо объясняешь!
@elenabareysha9232
@elenabareysha9232 Жыл бұрын
Умница! Спасибо! Всё чётко, по порядку, даже тайменг видео есть
@machine_learrrning
@machine_learrrning Жыл бұрын
Пожалуйста! Рада, что таймкоды к видео нравятся :)
@user-zj6cw9mt3d
@user-zj6cw9mt3d 2 жыл бұрын
Cпасибо за Вашу работу
@qodirjonsafarov5416
@qodirjonsafarov5416 Жыл бұрын
Спасибо :)
@san1araNN
@san1araNN 7 ай бұрын
Круто, очень интересно ! Если углубиться, то можно найти наибольший коэффициент схожести сравнив всех со всеми, дабы повысить вероятность конверсии в покупку благодаря рекомендации )
@Krylof41
@Krylof41 10 ай бұрын
Юлия, спасибо за разбор! Сразу возникла идея, что людям, покупающим детские товары, рекомендацию нужно допиливать, т.е. если полгода назад он покупал (условно) вещи для новорожденного, и похож на какого-то клиента, который только купил такие же вещи, то остальные товары из категории ему рекомендовать бессмысленно. Ведь он уже больше похож на тех клиентов, которые покупают вещи для полугодовалых детей и т.д. Т.е. это пргнозирование на временных рядах с учетом изменчивости похожести клиентов между собой?) Так вообще стоит делать и целесообразно ли?)
@carbon2409
@carbon2409 Жыл бұрын
Здравствуйте! Большое спасибо за очень ценные знания. Не могли бы, пожалуйста, оставить ссылочку на этот ноутбук, спасибо!
@machine_learrrning
@machine_learrrning Жыл бұрын
Добрый день! Большое спасибо за приятные слова :) Держите ссылку на ноутбук: colab.research.google.com/drive/1k2921Wd-YlaGY2yLz3T07ujydrn_GZNm
@ThrallPraudmur
@ThrallPraudmur Жыл бұрын
@@machine_learrrning Добрый день!) А на Ваш анализ данных по Netflix можно попросить даже не ноутбук, а сами .csv файлики, чтобы поупражняться?
@ThrallPraudmur
@ThrallPraudmur Жыл бұрын
И тут на Kaggle почему-то не получается зарегистрироваться... Или были ограничения на пользователей из России?
@machine_learrrning
@machine_learrrning Жыл бұрын
H&M: articles.csv - drive.google.com/file/d/1R_v1aeFQGConcEwoVCWk79iJeZ6-xyKI customers.csv - drive.google.com/file/d/1wK-n8XBUc1-M-tAiJdkkSQcL2ajf5Lbm transactions.csv - drive.google.com/file/d/1jz2hHg7iwxSAnAisnlQyiPwV2a8ZG_sB Netflix: drive.google.com/file/d/1cunfb3ij7N1aRIhmlx6dXhiQfpecphrc
@machine_learrrning
@machine_learrrning Жыл бұрын
Ограничения никакие на пользователей из РФ не накладывались. Регистрироваться лучше с почты gmail, так точно проблем не будет Но есть одна проблема с верификацией телефона, она решается через техподдержку каггла, они вручную верифицируют номер телефона
@vukavuka7519
@vukavuka7519 2 жыл бұрын
Здравствуйте, будет подобная практика на boosty?
@machine_learrrning
@machine_learrrning 2 жыл бұрын
Здравствуйте! Будет, если хотите :) В скором времени тогда начну работу над практическими задачами для этой темы
@vukavuka7519
@vukavuka7519 2 жыл бұрын
@@machine_learrrning очень хотим
@machine_learrrning
@machine_learrrning 2 жыл бұрын
@@vukavuka7519 Подобные практические задания на boosty boosty.to/machine_learrrning/posts/34b83c32-6e6d-4763-b6fe-ac7f7a076619
@vukavuka7519
@vukavuka7519 2 жыл бұрын
@@machine_learrrning ❤
@egornekr
@egornekr Жыл бұрын
Возможно тупой вопрос :) почему при заполнении NaN (28:22) лямбда, нельзя было просто fillna бахнуть?
@machine_learrrning
@machine_learrrning Жыл бұрын
Нисколько не тупой вопрос :) Пропуски могли бы заполнить через fillna, но здесь нам нужно оставить только два значение: 1. 0 - если не было покупки 2. 1 - если была покупка и не важно, сколько раз fillna просто бы заполнил nan на 0, но значения больше 1 остались бы
@user-jf4qj9nw2l
@user-jf4qj9nw2l Жыл бұрын
Как то зашел в достаточно большой магазин одежды, ни какого рапределения по размерам, то есть указателей примитивных нет размеров!!! :((( Как это может быть??? А может :))) люди это писец тунгусский :))))
OMG😳 #tiktok #shorts #potapova_blog
00:58
Potapova_blog
Рет қаралды 3,9 МЛН
孩子多的烦恼?#火影忍者 #家庭 #佐助
00:31
火影忍者一家
Рет қаралды 18 МЛН
Survival skills: A great idea with duct tape #survival #lifehacks #camping
00:27
Первичная обработка (очистка) данных
1:05:32
Учиться - значит делать!
Рет қаралды 3,4 М.
OMG😳 #tiktok #shorts #potapova_blog
00:58
Potapova_blog
Рет қаралды 3,9 МЛН