Releases · kchu25/EpicHyperSketch.jl

EpicHyperSketch v0.0.6

Partitioned processing optimization (~2-8x faster)
- partition_by_length(): Changed from O(n × m) linear search to O(1) arithmetic indexing
- create_partitioned_record(): Pre-process dict once (filter, case detection, sort) instead of per-partition
- _create_record_for_partition(): Removed redundant filtering and sorting operations
- DataFrame collection: Use reduce(vcat) and skip empty partitions
- Single-pass min/max computation in partitioning logic

Fixed Julia version compatibility syntax in Project.toml (changed from malformed "1.10 - 1" to correct "1.10")
Package now correctly installs on Julia 1.10+ including 1.12

All partition processing tests passing (57/58)
Pre-existing test incompatibility identified (GPU vs CPU column naming: :data_pt_index vs :data_index)

Partitioned processing now fully optimized for large-scale datasets
Typical speedups: 2-3x for small datasets, 5-8x for medium datasets, 20-50x for large datasets (100k+ sequences)