Artykuły według tagu: clickhouse

Skipping indeksy ClickHouse: bloom, set, minmax

Jak skipping indeksy w ClickHouse przyspieszają zapytania po kolumnach spoza ORDER BY. Analiza minmax, set, bloom_filter, ngrambf_v1, tokenbf_v1 z przykładami z gamingu i EXPLAIN.

Materializowane widoki ClickHouse: wyzwalacze na INSERT

Jak działają MV w ClickHouse: agregacja inkrementalna, łańcuchy minuta→godzina→dzień, wzorzec Null+Kafka, POPULATE i jego zagrożenia. Przykłady z SummingMergeTree i AggregatingMergeTree.

Specjalne silniki ClickHouse: kiedy MergeTree nie jest potrzebny

Przegląd silników ClickHouse: Memory, Buffer, Null, Log, URL, S3 i PostgreSQL. Przykłady dla pamięci podręcznej współczynników, buforowania wstawek z Kafka i danych na żywo z zewnętrznych baz danych.

Słowniki w ClickHouse: szybki lookup bez JOIN

Jak używać słowników ClickHouse do zastąpienia JOIN mikrosekundowym wyszukiwaniem w pamięci. Typy flat/hashed/range, źródła danych, dictGet i przykłady dla gamingu.

TTL w ClickHouse: zarządzanie cyklem życia danych

Jak TTL w ClickHouse automatycznie usuwa, przenosi na HDD/S3, agreguje i anonimizuje dane. Przykłady dla GDPR, tiered storage i grupowania starych rekordów.

ORDER BY i PRIMARY KEY w ClickHouse: wybór indeksu

Jak prawidłowo wybrać ORDER BY w ClickHouse: sparse index, kardynalność kolumn, równość vs zakres, sprawdzenie przez EXPLAIN. Zasady i przykłady dla gamlingu.

Partycjonowanie w ClickHouse: strategie i operacje

Jak partycjonowanie w ClickHouse przyspiesza DROP i zarządzanie danymi. Wybór rozmiaru partycji, system.parts, DETACH/ATTACH, FREEZE, MOVE na SSD/HDD i skrypt usuwania starych danych.

CollapsingMergeTree w ClickHouse: aktualizacja bez UPDATE

Jak CollapsingMergeTree i VersionedCollapsingMergeTree zastępują UPDATE w ClickHouse: kolumna sign, zwijanie par, SUM(amount*sign), problem kolejności i rozwiązanie przez wersje.

SummingMergeTree i AggregatingMergeTree w ClickHouse

Inkrementalna agregacja w ClickHouse: jak SummingMergeTree i AggregatingMergeTree przyspieszają dashboardy 100 razy. Przykłady, widoki zmaterializowane, pułapki i porównanie.

ReplacingMergeTree w ClickHouse: kompletny przewodnik

Dowiedz się, jak ReplacingMergeTree usuwa duplikaty, działa z wersjami i FINAL. Przykłady, pułapki i porównanie z CollapsingMergeTree dla zaawansowanej deduplikacji.

ClickHouse: dlaczego kolumnowe bazy danych przyspieszają analitykę 100 razy

Wyjaśniamy na rzeczywistych benchmarkach i schemacie zakładów: ClickHouse vs PostgreSQL i MySQL. Architektura, przykłady zapytań, przypadki użycia. Czytać 5 minut.

Materializowane widoki ClickHouse: niuanse i rozwiązania

Jak działają MV w ClickHouse? Krytyczne różnice od klasycznych systemów zarządzania bazami danych, ograniczenia UPDATE/DELETE i praktyczne wskazówki. Dowiedz się, jak uniknąć błędów w projektowaniu.

ClickHouse: deduplikacja i straty w MV

Analiza strat danych w ClickHouse z powodu deduplikacji bloków w materialized views. Ustawienia insert_deduplicate=0 i deduplicate_blocks_in_dependent_materialized_views=1. Skonfiguruj przechowywanie bez strat — przeczytaj szczegóły.

Kafka Engine ClickHouse: atomowość bez strat

Konfiguracja Kafka Engine w ClickHouse dla niezawodnych wstawek ze strumieni. Demonstracja offset-commitu, unikanie strat przy awariach. Przewodnik dla middle/senior dev.

ClickHouse z Airflow zamiast PostgreSQL dla Big Data

Dowiedz się, dlaczego Airflow + ClickHouse wypiera PostgreSQL w analityce. Porównanie wydajności, przykłady dla data engineers. Przechodź na columnar DB dla ETL-pipeline’ów.

CTE w ClickHouse: makro zamiast optymalizacji

Rozbieramy, dlaczego WITH w ClickHouse wykonuje się wielokrotnie i jak zastąpić tabelami tymczasowymi. Przykłady kodu, explain, porównania dla deweloperów. Przyspiesz zapytania bez pułapek.

Diagnostyka CPU 80% w ClickHouse

Narzędzia do wyszukiwania problematycznych zapytań w ClickHouse: system.processes, query_log, EXPLAIN. Kroki diagnostyki, przykłady SQL, lista kontrolna. Optymalizuj obciążenie bez przestojów.