按标签查看文章: deduplication
ClickHouse中的ReplacingMergeTree:完整指南
了解ReplacingMergeTree如何去除重复项、与版本和FINAL配合使用。包含示例、陷阱以及与CollapsingMergeTree的高级去重对比。
Discourse 中 GIF 重复导致备份失败
一个热门 GIF 如何因 ext4 限制导致 Discourse 备份失败。针对开发者的问题分析和解决方案。
ClickHouse:MV 中的去重和数据丢失
ClickHouse 中由于物化视图中的块去重导致的数据丢失分析。设置 insert_deduplicate=0 和 deduplicate_blocks_in_dependent_materialized_views=1。配置无损存储 — 阅读详情。
maxpack:版本化数据的去重
maxpack 为 Node.js、CPython 等版本化项目提供高达 50 倍压缩。基准测试,与 tar+zstd、7z 的比较。在您自己的数据集上测试,适用于 IT 专家。