Artículos por etiqueta: clickhouse

Índices de omisión de ClickHouse: bloom, set, minmax

Cómo los índices de omisión de ClickHouse aceleran las consultas en columnas fuera de ORDER BY. Desglose de minmax, set, bloom_filter, ngrambf_v1, tokenbf_v1 con ejemplos de juegos y EXPLAIN.

Vistas Materializadas de ClickHouse: disparadores en INSERT

Cómo funcionan las MV en ClickHouse: agregación incremental, cadenas minuto→hora→día, patrón Null+Kafka, POPULATE y sus peligros. Ejemplos con SummingMergeTree y AggregatingMergeTree.

Motores Especiales de ClickHouse: Cuando MergeTree No Es Necesario

Descripción general de los motores Memory, Buffer, Null, Log, URL, S3 y PostgreSQL de ClickHouse. Ejemplos para caché de coeficientes, almacenamiento en búfer de inserciones desde Kafka y datos en vivo desde bases de datos externas.

Diccionarios en ClickHouse: búsqueda rápida sin JOIN

Cómo usar los diccionarios de ClickHouse para reemplazar JOIN con búsqueda en memoria de microsegundos. Tipos: flat/hashed/range, fuentes de datos, dictGet y ejemplos para apuestas.

TTL en ClickHouse: gestión del ciclo de vida de los datos

Cómo TTL en ClickHouse elimina automáticamente, mueve a HDD/S3, agrega y anonimiza datos. Ejemplos para GDPR, almacenamiento por niveles y agrupación de registros antiguos.

ORDER BY y PRIMARY KEY en ClickHouse: selección de índices

Cómo elegir correctamente ORDER BY en ClickHouse: índice disperso, cardinalidad de columnas, igualdad vs rango, verificación mediante EXPLAIN. Reglas y ejemplos para apuestas.

Particionamiento en ClickHouse: Estrategias y Operaciones

Cómo el particionamiento en ClickHouse acelera DROP y la gestión de datos. Elección del tamaño de partición, system.parts, DETACH/ATTACH, FREEZE, MOVE a SSD/HDD y un script para eliminar datos antiguos.

CollapsingMergeTree en ClickHouse: actualizar sin UPDATE

Cómo CollapsingMergeTree y VersionedCollapsingMergeTree reemplazan UPDATE en ClickHouse: columna de signo, pares de colapso, SUM(monto*signo), problema de ordenamiento y solución mediante versiones.

SummingMergeTree y AggregatingMergeTree en ClickHouse

Agregación incremental en ClickHouse: cómo SummingMergeTree y AggregatingMergeTree aceleran los paneles 100 veces. Ejemplos, vistas materializadas, trampas y comparación.

ReplacingMergeTree en ClickHouse: Guía completa

Aprende cómo ReplacingMergeTree elimina duplicados, trabaja con versiones y FINAL. Ejemplos, errores comunes y comparación con CollapsingMergeTree para deduplicación avanzada.

ClickHouse: por qué un DBMS columnar acelera el análisis 100 veces

Explicamos con benchmarks reales y un esquema de apuestas: ClickHouse vs PostgreSQL y MySQL. Arquitectura, ejemplos de consultas, casos de uso. Lectura de 5 minutos.

Vistas Materializadas de ClickHouse: Matices y Soluciones

¿Cómo funcionan las MV en ClickHouse? Diferencias críticas con DBMS clásicos, limitaciones de UPDATE/DELETE y mejores prácticas. Aprende cómo evitar errores de diseño.

ClickHouse: desduplicación y pérdidas en MV

Análisis de pérdidas de datos en ClickHouse debido a la desduplicación de bloques en vistas materializadas. Configuraciones insert_deduplicate=0 y deduplicate_blocks_in_dependent_materialized_views=1. Configura almacenamiento sin pérdidas — lee los detalles.

Kafka Engine ClickHouse: atomicidad sin pérdidas

Configuración de Kafka Engine en ClickHouse para inserciones confiables desde flujos. Demostración de offset-commit, evitando pérdidas en fallos. Guía para desarrolladores middle/senior.

ClickHouse con Airflow en lugar de PostgreSQL para Big Data

Aprende por qué Airflow + ClickHouse está desplazando a PostgreSQL en analítica. Comparación de rendimiento, ejemplos para ingenieros de datos. Cambia a DB columnar para pipelines ETL.

CTE en ClickHouse: macro en lugar de optimización

Desglosando por qué WITH en ClickHouse se ejecuta múltiples veces y cómo reemplazarlo con tablas temporales. Ejemplos de código, EXPLAIN, comparaciones para desarrolladores. Acelera las consultas sin trampas.

Diagnósticos de CPU al 80% en ClickHouse

Herramientas para encontrar consultas problemáticas en ClickHouse: system.processes, query_log, EXPLAIN. Pasos de diagnósticos, ejemplos SQL, lista de verificación. Optimizar la carga sin tiempo de inactividad.