Skip to content

Latest commit

 

History

History
143 lines (100 loc) · 14.9 KB

File metadata and controls

143 lines (100 loc) · 14.9 KB
title chDB
sidebar_label 概要
slug /chdb
description chDB は ClickHouse をベースとしたインプロセス SQL OLAP エンジンです
keywords
chdb
embedded
clickhouse-lite
in-process
in process
doc_type guide

import Image from '@theme/IdealImage'; import dfBench from '@site/static/images/chdb/df_bench.png';

chDB {#chdb}

chDB は、ClickHouse v25.8.2.1 を基盤とした、高速なインプロセス SQL OLAP エンジンです。 ClickHouse サーバーに接続することなく、プログラミング言語から ClickHouse の性能を活用したい場合に使用できます。

主な特徴 {#key-features}

  • インプロセス SQL OLAP エンジン - ClickHouse を基盤としており、ClickHouse サーバーを別途インストールする必要はありません
  • 複数のデータ形式 - Parquet、CSV、JSON、Arrow、ORC および 70 以上の形式 での入出力をサポート
  • データコピーの最小化 - python memoryview により、C++ から Python へのコピーを最小限に抑える
  • 豊富な Python エコシステムとの統合 - Pandas、Arrow、DB API 2.0 をネイティブサポートし、既存のデータサイエンスワークフローにシームレスに適合
  • 外部依存なし - 外部データベースをインストールする必要はありません
  • DataStore API - SQL 最適化を備えた Pandas 互換 API で、630 以上のメソッドをサポート

DataStore: Pandas-Compatible API {#datastore}

新機能! DataStore は、おなじみの pandas 構文と ClickHouse のパフォーマンスを組み合わせた、pandas 互換の API を提供します。

:::tip Hex で始める

1行でのマイグレーション {#one-line-migration}

# Just change your import - your pandas code works unchanged
- import pandas as pd
+ from chdb import datastore as pd

df = pd.read_csv("data.csv")
result = df[df['age'] > 25].groupby('city')['salary'].mean()

パフォーマンスハイライト {#performance-highlights}

処理内容 pandas DataStore 高速化率
GroupBy count 347ms 17ms 19.93x
複雑なパイプライン 2,047ms 380ms 5.39x
Filter+Sort+Head 1,537ms 350ms 4.40x

1000万行でのベンチマーク

DataStore の機能 {#datastore-features}

  • 630以上の API メソッド - 209 個の pandas DataFrame メソッド、185以上のアクセサーメソッド
  • 遅延評価 - 操作は最適化された SQL にコンパイルされます
  • SQL プッシュダウン - フィルタと集約がデータソース側で実行されます
  • 多様なデータソース対応 - ファイル、S3、データベース、データレイクから読み取り可能

詳しくは DataStore ドキュメント を参照してください

chDB はどの言語をサポートしていますか? {#what-languages-are-supported-by-chdb}

chDB では、次の言語バインディングを利用できます。

どのように始めればよいですか? {#how-do-i-get-started}

pandas ユーザー向け {#for-pandas-users}

なじみのある pandas の使い勝手で ClickHouse のパフォーマンスを利用できる DataStore API から始めましょう:

DataStore API リファレンス {#datastore-reference}

SQL API ガイド {#sql-guides}

紹介動画 {#an-introductory-video}

chDB の概要を紹介する短い動画を視聴し、ClickHouse のパワーを Python 環境でどのように活用できるか学びましょう。

<iframe width="560" height="315" src="https://www.youtube.com/embed/e_yL0dlX6k4" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>

パフォーマンスベンチマーク {#performance-benchmarks}

chDB は、さまざまなシナリオにおいて卓越したパフォーマンスを発揮します。

DataFrame のベンチマーク結果

chDB について {#about-chdb}

ライセンス {#license}

chDB は Apache License Version 2.0 に基づき提供されています。詳細については LICENSE を参照してください。