No video

Михаил Марюфич - Hadoop в Облаке - это ОК

  Рет қаралды 198

SmartData

SmartData

Күн бұрын

Ближайшая конференция - SmartData 2024, 4 сентября (online), 8-9 сентября, (Москва + трансляция).
Подробности и билеты: jrg.su/KFFBS7
- -
Для OK Hadoop - это ключевой компонент инфраструктуры данных: он активно используется как для реализации продуктовой аналитики, так и для продакшена рекомендательных систем. С точки зрения объемов это более 200 PB в HDFS, 70k vcores, 200 TB RAM.
Вся инфраструктура в Одноклассниках (и не только) разворачивается во внутреннем контейнерном облаке и этому есть причины:
- унификация эксплуатации как железа, так и приложений;
- кардинальное повышение утилизации доступного железа.
В прошлом году очередь дошла и до Hadoop. Михаил рассказывает:
- о причинах отказа от классических подходов по развертыванию и эксплуатации Hadoop-кластеров;
- о том, как провести миграцию сотен петабайт так, чтобы пользователи этого не заметили;
- о сложности жизни с соседями (теперь на одной машине с Hadoop может поселиться другая программа, претендующая на ресурсы);
- и, конечно же, о том, какие преимущества получили в итоге (спойлер - значительные).

Пікірлер
HDFS | Что это такое и как оно работает? [Hadoop HDFS]
52:13
Евгений Виндюков
Рет қаралды 2,4 М.
小丑把天使丢游泳池里#short #angel #clown
00:15
Super Beauty team
Рет қаралды 48 МЛН
А ВЫ УМЕЕТЕ ПЛАВАТЬ?? #shorts
00:21
Паша Осадчий
Рет қаралды 2,2 МЛН
Прикладной Data Science: как стать ML-инженером
1:26:26
Яндекс Практикум
Рет қаралды 6 М.