Кластеризация / Разбор задачи по Data Science: Сегментация клиентов

  Рет қаралды 10,525

miracl6

miracl6

Күн бұрын

Регистрируйтесь и используйте объектное хранилище Selectel для хранения неструктурированных данных. Первый месяц - бесплатно: slc.tl/0mt81
-----------------------------------------------
Курс по Data Science набор на 4 поток pymagic.ru
Код из видео на python boosty.to/miracl6/posts/9c182...
Таймкоды:
00:00 Кластеризация клиентов
00:41 Разница между кластеризации и классификацией
01:25 Курс по Data Science. Требования к поступлению
03:16 Разбор данных о клиентах
04:04 Объектное хранилище Selectel
06:15 Добавление новых признаков в датасет. Предварительный анализ данных (статистики)
09:48 Методы снижения размерности (PCA, T-SNE, UMAP)
13:22 KMeans. Как правильно подбирать число кластеров
16:09 Интерпретация результатов KMeans
17:46 Spectral Clustering
18:15 Пример, когда не релевантно ориентироваться при кластеризации только на проекции сжатых данных
19:10 Agglomerative Clustering
20:37 Интерпретация результатов Agglomerative Clustering
21:17 Выводы, рекомендации для бизнеса
#DataScience #python
-----------------------------------------------
Мое сообщество ВКонтакте pymagic
Telegram t.me/pymagic

Пікірлер: 40
@user-sn1qp2xq8l
@user-sn1qp2xq8l Жыл бұрын
Большое спасибо! Очень наглядно и все по сути! Побольше бы таких видео, по возможности.
@aldargarmaev5990
@aldargarmaev5990 Жыл бұрын
Спасибо за разборы! Лучший формат для изучения задач
@user-ij1lb3np1x
@user-ij1lb3np1x Жыл бұрын
Как же этого видоса не хватало две недельки назад при выполнение тестового задания с собеседования) Спасибо!
@puzzlo_2
@puzzlo_2 Жыл бұрын
как всё со стороны просто и ужасаюсь, как будет всё сложно, если самому туда окунуться ). спасибо за видео !
@spraysferry9841
@spraysferry9841 7 ай бұрын
Я только начинаю свой путь в дата сайнс. Спасибо за ваш труд и за то что делаете такие видео!
@aleksgor1408
@aleksgor1408 Жыл бұрын
Спасибо, хороший разбор. Больше нигде таких полезных разборов не видел, четких. И столько всего интересного, код красивый, визуализации )). ПРям кайф, еще больше начинаешь любить ds. Жаль что уже другой курс купил. Интересно даже, что же в полном курсе. Продолжайте еще разборы интересные делать.
@Ruslanurie
@Ruslanurie Жыл бұрын
Круто! Есть и предобработка и создание фичей и разные модели и анализ и визуализация. И всё в одном видео. Спасибо)
@old-empire
@old-empire Жыл бұрын
Офигенно!
@user-kt4sp5il7i
@user-kt4sp5il7i 5 ай бұрын
Отличное объяснение, спасибо за контент!
@mikekertser5384
@mikekertser5384 Жыл бұрын
Очень интересное видео! Спасибо! :)
@oeaoo
@oeaoo Жыл бұрын
Учитывая что я в анной теме технологически близок к нулю (но понимаю математику и статистику) было очень интересно. Когда-то игрался с R для анализа логов, чем-то напомнило. Ну, и универ, конечно. Спасибо и успехов!
@user-yb3dk1cj6p
@user-yb3dk1cj6p Жыл бұрын
Приятно слушать)
@user-uw3vb6co1g
@user-uw3vb6co1g Жыл бұрын
С первого раза раза (пару месяцев назад) не понял чем кластеризация отличается от классификации, а щас как понял!
@tanyavasileva1232
@tanyavasileva1232 Жыл бұрын
Большое спасибо за видос и за гитхаб
@user-kt4sp5il7i
@user-kt4sp5il7i 5 ай бұрын
Добрый день! Поделитесь пожалуйста файлом "utils" , нигде не могу найти😊
@user-sj9mb7io9j
@user-sj9mb7io9j Жыл бұрын
Тот самый момент когда нифига не понятно (человеку который мат. анализ и высшую алгебру проходил в универе, а так же плотно общался с людьми, которые в 90е-00е реализовывали програмно и кластеризацию и снижение размерности) - но благодаря лёгкому и понятному стилю изложения - очень интересно. Т.е. с одной стороны сложно, а с другой стороны понимаешь что это вполне познаваемо. С одной стороны практическая рекомендация, с другой - источник вдохновения. Спасибо.
@user-kt4sp5il7i
@user-kt4sp5il7i 5 ай бұрын
Анастасия Добрый день! Как попасть к вам на курс? Так же хотел спросить про "utils", не могу найти файл га Гите)
@mwave3388
@mwave3388 Жыл бұрын
Привет. Использовала кластеризацию для feature engineering?
@aijedi45
@aijedi45 Жыл бұрын
Есть ли смысл использовать автоэнкодер для снижения размерности?
@dimitribolt6006
@dimitribolt6006 Жыл бұрын
Аааа... ну это же надо, так говорить абсолютно неверные вещи с таким уверенным видом.... Преподаватель математики этой барышни наверное готов совершить самоубийство от стыда, что вырстил такого специалиста. По сути: Все приведенные методы могут работать исключительно с Euclidean and metric расстояниями между измерениями (прошу прощения, я не знаю как это правильно называется в русскоязычной терминологии). В частности в любом учебнике на первой же странице написано, что K-Means выдаст неинтерпретируемую фигню на категориальных данных. (Для критиков: какую-бы distance matrix мы не посторили на категориальных данных, например самую простую Gower’s distance (or similarity) они будут nonEuclidean and nonMetric. На обывательском языке на примере census (девушка употребляет термин СоцДем): невозможно сказать, кто из "single" или "divorced" ближе к "married" - нет такой евклидовой меры) Коллеги - читайте учебники (и очнень желательно оригинальные англоязычные). Такие курсы-лекции нанесут вашей квалификации непоправимый вред!
@dimitribolt6006
@dimitribolt6006 Жыл бұрын
@@miracl6 😀
@user-qo7yu5qk1u
@user-qo7yu5qk1u Жыл бұрын
Спасибо за видео! Как раз мучалась с валидацией количества кластеров. Очень помог силуэт :) спойлер: все плохо, надо крутить дальше Вопрос: есть ли датасеты, которые невозможно качественно/нормально/адекватно кластеризовать? У меня 10 признаков и все одинаково важны 🥲
@user-qo7yu5qk1u
@user-qo7yu5qk1u Жыл бұрын
@@miracl6 спасибо большое! :)
@user-qw5ii4dm7n
@user-qw5ii4dm7n 7 ай бұрын
женщина ты кто ? ты молодец )))))
@user-lu9rg8yj7k
@user-lu9rg8yj7k Жыл бұрын
Главное запомнить пару слов, успех обеспечен. Регрессия кластеризации пердиманокля:-)
@lestail
@lestail Жыл бұрын
Можно обновленную ссылку на github
@user-vb2gq7rn3c
@user-vb2gq7rn3c Жыл бұрын
Страница с гитхаба не открывается...
@vitaliibali
@vitaliibali Жыл бұрын
а еще самые богатые больше пьют вина и больше едят мяса
@user-hr3lj2zw9p
@user-hr3lj2zw9p Жыл бұрын
Как все сложно....
@user-hr3lj2zw9p
@user-hr3lj2zw9p Жыл бұрын
@@miracl6 , конечно, лишь как гуманитарию нужно интегралы изучить и ещё несколько разделов высшей математики. 😎
@dmitrypetrov3052
@dmitrypetrov3052 Жыл бұрын
@@user-hr3lj2zw9p так-то интегралы ещё в школе изучают, а математика в DS довольно простая: 1-2 курс технического вуза и далеко не в полном объёме.
@user-hr3lj2zw9p
@user-hr3lj2zw9p Жыл бұрын
@@dmitrypetrov3052 , у меня юридический ВУЗ был, сейчас считаю только пени, госпошлину, очень редко налоги. Что в школе было уже не помню - давно это было. Посмотрел кое-что в интернете про интегралы, что-то общее понял, но глубоко пока не вникал.
@dmitrypetrov3052
@dmitrypetrov3052 Жыл бұрын
@@user-hr3lj2zw9p можно поглядеть шпаргалку по математике для DS от Яндекса: drive.google.com/file/d/1FCy0VSid9VO4oSZAXx80x4eGGG32J-33/view
@user-hr3lj2zw9p
@user-hr3lj2zw9p Жыл бұрын
@@dmitrypetrov3052 , странно, что Яндекс МФТИ в конспекте колонтитулы указаны. И странно, что комментарий тут оставлял и он исчез.
@zoom8346
@zoom8346 Жыл бұрын
Поделитесь пожалуйста инструментами from utils) Plot_clustering
@whywhy867
@whywhy867 Жыл бұрын
+
@user-kt4sp5il7i
@user-kt4sp5il7i 5 ай бұрын
Поделитесь пожалуйста инструментами utils, нигде не могу найти😊
@user-kt4sp5il7i
@user-kt4sp5il7i 5 ай бұрын
@@whywhy867 вас так же попрошу поделитесь инструментами from utils)
DEFINITELY NOT HAPPENING ON MY WATCH! 😒
00:12
Laro Benz
Рет қаралды 15 МЛН
Became invisible for one day!  #funny #wednesday #memes
00:25
Watch Me
Рет қаралды 54 МЛН
Me: Don't cross there's cars coming
00:16
LOL
Рет қаралды 15 МЛН
Разбор реальной data science задачи
38:51
Alexander Ershov
Рет қаралды 190 М.
Сегментация клиентов
5:31
Neuromap. Tech
Рет қаралды 2,4 М.
Красиво, но телефон жаль
0:32
Бесполезные Новости
Рет қаралды 184 М.
Самый дорогой кабель Apple
0:37
Romancev768
Рет қаралды 323 М.
Как слушать музыку с помощью чека?
0:36
Опять съемные крышки в смартфонах? #cmf
0:50