Артем Шутак - Вставить в ClickHouse и не умереть

  Рет қаралды 11,101

SmartData

SmartData

2 жыл бұрын

Ближайшая конференция - SmartData 2024, 4 сентября (online), 8-9 сентября, (Москва + трансляция).
Подробности и билеты: jrg.su/KFFBS7
- -
Казалось бы, что может быть проще, чем вставить данные в БД?! Но в Одноклассниках это делают 2 года и ClickHouse не перестает удивлять.
Артём Шутак из Одноклассников. Их инсталляция - это примерно 1PB и 100 машин. И команда реально настрадалась: ClickHouse тормозил, данные дублировались и/или терялись, иногда просто не вставлялись.
В докладе подробно рассматривается задача вставки данных в ClickHouse для всех самых популярных сценариев:
- «игрушечная» инсталляция на одном сервере;
- горизонтально масштабируемый кластер с репликацией данных между дата
- особенности батчевой и стриминговой вставки.
Также напишем свой собственный классный механизм вставки в ClickHouse, который используется в Одноклассниках.
Приходите на доклад, и Артём поделится тем, что знает про вставку в ClickHouse. Доклад нацелен на инженеров и архитекторов, как планирующих интегрировать ClickHouse в свою экосистему, так и тех, кто уже работает с ним, но не полностью доволен текущим положением дел.
Скачать презентацию: assets.ctfassets.net/oxjq45e8...

Пікірлер: 10
@airdropking5973
@airdropking5973 11 ай бұрын
спасибо за лекцию
@PeterVolna
@PeterVolna Жыл бұрын
Гениальный доклад, спасибо
@CvyatG
@CvyatG 5 ай бұрын
Очень интересный доклад
@highwayautolife3155
@highwayautolife3155 Ай бұрын
Интересно!
@YuriyNasretdinov
@YuriyNasretdinov Жыл бұрын
Спасибо за отличную иллюстрацию, чем плохи вставка в Distributed таблицы и ожидание от Kafka Engine, что она магически делает всё хорошо :). (я всегда придерживался идеи, что вставка должна быть только в ReplicatedMergeTree напрямую и ребалансировка тоже должна делаться вручную, например сделать на кластер сразу 60 шардов, что легко делится на 1, 2, 3, ..., 12, 15, 30 и т.д. узлов, и перемещать таблицы тупо репликацией).
@ilshatkarazbaev6300
@ilshatkarazbaev6300 2 жыл бұрын
Спасибо за доклад. Конечно, стоило руками ребеленсировать заранее. Если делать ребалансировку из коробки, то это может занять много времени и в сложно обработать каждый частный случай
@spartan_j117
@spartan_j117 7 ай бұрын
9:48 дефолтный энджин на сингл ноде 🤣
@ivani3237
@ivani3237 Жыл бұрын
ну нафик, уже год на сноуфлейке - забыл как страшный сон все эти непредсказуемые и неописанные поведения, танцы с бубнами над ручным шардированием, танцы с бубнами над вставкой, танцы с бубнами над администрированием...
@user-qh6im2ik2q
@user-qh6im2ik2q 4 ай бұрын
а сколько данных?
Вредные советы ClickHouse
32:04
Yandex Cloud
Рет қаралды 6 М.
The joker's house has been invaded by a pseudo-human#joker #shorts
00:39
Untitled Joker
Рет қаралды 5 МЛН
бесит старшая сестра!? #роблокс #анимация #мем
00:58
КРУТОЙ ПАПА на
Рет қаралды 2,9 МЛН
ClickHouse: настоящее и будущее
30:53
Yandex for Developers
Рет қаралды 9 М.
ClickHouse тормозит / Кирилл Шваков (TrafficStars)
53:11
The joker's house has been invaded by a pseudo-human#joker #shorts
00:39
Untitled Joker
Рет қаралды 5 МЛН