Artículos por etiqueta: clickhouse
Índices de omisión de ClickHouse: bloom, set, minmax
Cómo los índices de omisión de ClickHouse aceleran las consultas en columnas fuera de ORDER BY. Desglose de minmax, set, bloom_filter, ngrambf_v1, tokenbf_v1 con ejemplos de juegos y EXPLAIN.
Vistas Materializadas de ClickHouse: disparadores en INSERT
Cómo funcionan las MV en ClickHouse: agregación incremental, cadenas minuto→hora→día, patrón Null+Kafka, POPULATE y sus peligros. Ejemplos con SummingMergeTree y AggregatingMergeTree.
Motores Especiales de ClickHouse: Cuando MergeTree No Es Necesario
Descripción general de los motores Memory, Buffer, Null, Log, URL, S3 y PostgreSQL de ClickHouse. Ejemplos para caché de coeficientes, almacenamiento en búfer de inserciones desde Kafka y datos en vivo desde bases de datos externas.
Diccionarios en ClickHouse: búsqueda rápida sin JOIN
Cómo usar los diccionarios de ClickHouse para reemplazar JOIN con búsqueda en memoria de microsegundos. Tipos: flat/hashed/range, fuentes de datos, dictGet y ejemplos para apuestas.
TTL en ClickHouse: gestión del ciclo de vida de los datos
Cómo TTL en ClickHouse elimina automáticamente, mueve a HDD/S3, agrega y anonimiza datos. Ejemplos para GDPR, almacenamiento por niveles y agrupación de registros antiguos.
ORDER BY y PRIMARY KEY en ClickHouse: selección de índices
Cómo elegir correctamente ORDER BY en ClickHouse: índice disperso, cardinalidad de columnas, igualdad vs rango, verificación mediante EXPLAIN. Reglas y ejemplos para apuestas.
Particionamiento en ClickHouse: Estrategias y Operaciones
Cómo el particionamiento en ClickHouse acelera DROP y la gestión de datos. Elección del tamaño de partición, system.parts, DETACH/ATTACH, FREEZE, MOVE a SSD/HDD y un script para eliminar datos antiguos.
CollapsingMergeTree en ClickHouse: actualizar sin UPDATE
Cómo CollapsingMergeTree y VersionedCollapsingMergeTree reemplazan UPDATE en ClickHouse: columna de signo, pares de colapso, SUM(monto*signo), problema de ordenamiento y solución mediante versiones.
SummingMergeTree y AggregatingMergeTree en ClickHouse
Agregación incremental en ClickHouse: cómo SummingMergeTree y AggregatingMergeTree aceleran los paneles 100 veces. Ejemplos, vistas materializadas, trampas y comparación.
ReplacingMergeTree en ClickHouse: Guía completa
Aprende cómo ReplacingMergeTree elimina duplicados, trabaja con versiones y FINAL. Ejemplos, errores comunes y comparación con CollapsingMergeTree para deduplicación avanzada.
ClickHouse: por qué un DBMS columnar acelera el análisis 100 veces
Explicamos con benchmarks reales y un esquema de apuestas: ClickHouse vs PostgreSQL y MySQL. Arquitectura, ejemplos de consultas, casos de uso. Lectura de 5 minutos.
Vistas Materializadas de ClickHouse: Matices y Soluciones
¿Cómo funcionan las MV en ClickHouse? Diferencias críticas con DBMS clásicos, limitaciones de UPDATE/DELETE y mejores prácticas. Aprende cómo evitar errores de diseño.
ClickHouse: desduplicación y pérdidas en MV
Análisis de pérdidas de datos en ClickHouse debido a la desduplicación de bloques en vistas materializadas. Configuraciones insert_deduplicate=0 y deduplicate_blocks_in_dependent_materialized_views=1. Configura almacenamiento sin pérdidas — lee los detalles.
Kafka Engine ClickHouse: atomicidad sin pérdidas
Configuración de Kafka Engine en ClickHouse para inserciones confiables desde flujos. Demostración de offset-commit, evitando pérdidas en fallos. Guía para desarrolladores middle/senior.
ClickHouse con Airflow en lugar de PostgreSQL para Big Data
Aprende por qué Airflow + ClickHouse está desplazando a PostgreSQL en analítica. Comparación de rendimiento, ejemplos para ingenieros de datos. Cambia a DB columnar para pipelines ETL.
CTE en ClickHouse: macro en lugar de optimización
Desglosando por qué WITH en ClickHouse se ejecuta múltiples veces y cómo reemplazarlo con tablas temporales. Ejemplos de código, EXPLAIN, comparaciones para desarrolladores. Acelera las consultas sin trampas.
Diagnósticos de CPU al 80% en ClickHouse
Herramientas para encontrar consultas problemáticas en ClickHouse: system.processes, query_log, EXPLAIN. Pasos de diagnósticos, ejemplos SQL, lista de verificación. Optimizar la carga sin tiempo de inactividad.