Články podle tagu: clickhouse
Skipping indexy ClickHouse: bloom, set, minmax
Jak skipping indexy v ClickHouse urychlují dotazy na sloupce mimo ORDER BY. Rozbor minmax, set, bloom_filter, ngrambf_v1, tokenbf_v1 s příklady z gamingu a EXPLAIN.
Materializovaná zobrazení ClickHouse: triggery na INSERT
Jak fungují MV v ClickHouse: inkrementální agregace, řetězce minuta→hodina→den, vzor Null+Kafka, POPULATE a jeho nebezpečí. Příklady s SummingMergeTree a AggregatingMergeTree.
Speciální enginy ClickHouse: když MergeTree není potřeba
Přehled enginů ClickHouse Memory, Buffer, Null, Log, URL, S3 a PostgreSQL. Příklady pro cache koeficientů, bufferizaci vložení z Kafka a live dat z externích DB.
Slovníky v ClickHouse: rychlý lookup bez JOIN
Jak používat slovníky ClickHouse k nahrazení JOIN mikrosekundovým vyhledáváním v paměti. Typy flat/hashed/range, zdroje dat, dictGet a příklady pro gaming.
TTL v ClickHouse: správa životního cyklu dat
Jak TTL v ClickHouse automaticky maže, přesouvá na HDD/S3, agreguje a anonymizuje data. Příklady pro GDPR, tiered storage a seskupování starých záznamů.
ORDER BY a PRIMARY KEY v ClickHouse: výběr indexu
Jak správně vybrat ORDER BY v ClickHouse: sparse index, kardinalita sloupců, rovnost vs rozsah, kontrola pomocí EXPLAIN. Pravidla a příklady pro gambling.
Partitionování v ClickHouse: strategie a operace
Jak partitionování v ClickHouse urychluje DROP a správu dat. Výběr velikosti partition, system.parts, DETACH/ATTACH, FREEZE, MOVE na SSD/HDD a skript pro mazání starých dat.
CollapsingMergeTree v ClickHouse: aktualizace bez UPDATE
Jak CollapsingMergeTree a VersionedCollapsingMergeTree nahrazují UPDATE v ClickHouse: sign-sloupec, sbalování párů, SUM(amount*sign), problém pořadí a řešení pomocí verzí.
SummingMergeTree a AggregatingMergeTree v ClickHouse
Inkrementální agregace v ClickHouse: jak SummingMergeTree a AggregatingMergeTree urychlují dashboardy 100krát. Příklady, materializovaná zobrazení, nástrahy a srovnání.
ReplacingMergeTree v ClickHouse: úplný průvodce
Zjistěte, jak ReplacingMergeTree odstraňuje duplicity, pracuje s verzemi a FINAL. Příklady, nástrahy a srovnání s CollapsingMergeTree pro pokročilou deduplikaci.
ClickHouse: proč sloupcové DBMS urychlují analytiku 100krát
Vysvětlujeme na reálných benchmarkách a schématu sázek: ClickHouse versus PostgreSQL a MySQL. Architektura, příklady dotazů, use cases. Čtení na 5 minut.
Materializovaná zobrazení ClickHouse: nuancí a řešení
Jak fungují MV v ClickHouse? Kritické rozdíly oproti klasickým DBMS, omezení UPDATE/DELETE a osvědčené postupy. Zjistěte, jak se vyhnout chybám v návrhu.
ClickHouse: deduplikace a ztráty v MV
Rozbor ztrát dat v ClickHouse kvůli deduplikaci bloků v materialized views. Nastavení insert_deduplicate=0 a deduplicate_blocks_in_dependent_materialized_views=1. Nastavte úložiště bez ztrát – čtěte podrobnosti.
Kafka Engine ClickHouse: atomarita bez ztrát
Nastavení Kafka Engine v ClickHouse pro spolehlivé vkládání ze streamů. Demonstrace offset-commitu, vyhnutí se ztrátám při selháních. Průvodce pro middle/senior dev.
ClickHouse s Airflow místo PostgreSQL pro Big Data
Zjistěte, proč Airflow + ClickHouse vytlačuje PostgreSQL v analýze. Srovnání výkonu, příklady pro data engineers. Přejděte na columnar DB pro ETL-pipeline.
CTE v ClickHouse: makro místo optimalizace
Rozkládáme, proč se WITH v ClickHouse spouští opakovaně a jak ho nahradit dočasnými tabulkami. Příklady kódu, explain, srovnání pro vývojáře. Zrychlete dotazy bez pastí.
Diagnostika CPU 80 % v ClickHouse
Nástroje pro hledání problematických dotazů v ClickHouse: system.processes, query_log, EXPLAIN. Kroky diagnostiky, příklady SQL, checklist. Optimalizujte zátěž bez výpadku.