Articles par tag: clickhouse
Index de saut ClickHouse : bloom, set, minmax
Comment les index de saut ClickHouse accélèrent les requêtes sur les colonnes en dehors de ORDER BY. Analyse de minmax, set, bloom_filter, ngrambf_v1, tokenbf_v1 avec des exemples issus du jeu et EXPLAIN.
ClickHouse Materialized Views : déclencheurs sur INSERT
Comment fonctionnent les MV dans ClickHouse : agrégation incrémentale, chaînes minute→heure→jour, motif Null+Kafka, POPULATE et ses dangers. Exemples avec SummingMergeTree et AggregatingMergeTree.
Moteurs ClickHouse spéciaux : quand MergeTree n'est pas nécessaire
Aperçu des moteurs ClickHouse Memory, Buffer, Null, Log, URL, S3 et PostgreSQL. Exemples pour le cache de coefficients, le buffering d'insertions depuis Kafka et les données en direct depuis des bases de données externes.
Dictionnaires dans ClickHouse : recherche rapide sans JOIN
Comment utiliser les dictionnaires ClickHouse pour remplacer JOIN par une recherche en mémoire en microsecondes. Types : flat/hashed/range, sources de données, dictGet et exemples pour les jeux d'argent.
TTL dans ClickHouse : gestion du cycle de vie des données
Comment TTL dans ClickHouse supprime automatiquement, déplace vers HDD/S3, agrège et anonymise les données. Exemples pour le RGPD, le stockage hiérarchisé et le regroupement des anciens enregistrements.
ORDER BY et PRIMARY KEY dans ClickHouse : sélection d'index
Comment choisir correctement ORDER BY dans ClickHouse : index sparse, cardinalité des colonnes, égalité vs plage, vérification via EXPLAIN. Règles et exemples pour les jeux d'argent.
Partitionnement dans ClickHouse : Stratégies et Opérations
Comment le partitionnement dans ClickHouse accélère les DROP et la gestion des données. Choix de la taille des partitions, system.parts, DETACH/ATTACH, FREEZE, MOVE vers SSD/HDD, et un script pour supprimer les anciennes données.
CollapsingMergeTree dans ClickHouse : mise à jour sans UPDATE
Comment CollapsingMergeTree et VersionedCollapsingMergeTree remplacent UPDATE dans ClickHouse : colonne signe, paires de collapse, SUM(montant*signe), problème d'ordre et solution via les versions.
SummingMergeTree et AggregatingMergeTree dans ClickHouse
Agrégation incrémentale dans ClickHouse : comment SummingMergeTree et AggregatingMergeTree accélèrent les tableaux de bord par 100 fois. Exemples, vues matérialisées, pièges et comparaison.
ReplacingMergeTree dans ClickHouse : Guide complet
Apprenez comment ReplacingMergeTree supprime les doublons, fonctionne avec les versions et FINAL. Exemples, pièges et comparaison avec CollapsingMergeTree pour une déduplication avancée.
ClickHouse : pourquoi un SGBD columnar accélère l'analyse par 100 fois
Nous expliquons à l'aide de benchmarks réels et d'un schéma de paris : ClickHouse vs PostgreSQL et MySQL. Architecture, exemples de requêtes, cas d'utilisation. Lisez 5 minutes.
Vues matérialisées ClickHouse : Nuances et solutions
Comment fonctionnent les MV dans ClickHouse ? Différences critiques par rapport aux SGBD classiques, limitations UPDATE/DELETE et meilleures pratiques. Apprenez à éviter les erreurs de conception.
ClickHouse : déduplication et pertes dans MV
Analyse des pertes de données dans ClickHouse dues à la déduplication de blocs dans les vues matérialisées. Paramètres insert_deduplicate=0 et deduplicate_blocks_in_dependent_materialized_views=1. Configurez un stockage sans perte — lisez les détails.
Kafka Engine ClickHouse : atomicité sans pertes
Mise en place de Kafka Engine dans ClickHouse pour des insertions fiables à partir de flux. Démonstration du commit d'offset, évitant les pertes en cas de pannes. Guide pour dev middle/senior.
ClickHouse avec Airflow au lieu de PostgreSQL pour Big Data
Découvrez pourquoi Airflow + ClickHouse remplace PostgreSQL dans l'analyse. Comparaison des performances, exemples pour les ingénieurs de données. Passez à une base de données colonnaire pour les pipelines ETL.
CTE dans ClickHouse : macro au lieu d'optimisation
Analyse de la raison pour laquelle WITH dans ClickHouse s'exécute plusieurs fois et comment le remplacer par des tables temporaires. Exemples de code, EXPLAIN, comparaisons pour les développeurs. Accélérez vos requêtes sans pièges.
Diagnostic CPU 80 % dans ClickHouse
Outils pour trouver les requêtes problématiques dans ClickHouse : system.processes, query_log, EXPLAIN. Étapes de diagnostic, exemples SQL, liste de vérification. Optimiser la charge sans temps d'arrêt.