chdb-sql
par clickhouse
Exécutez ClickHouse SQL directement en Python — aucun serveur nécessaire. Interrogez des fichiers locaux, des bases de données distantes et du stockage cloud avec toute la puissance de ClickHouse SQL.
npx skills add https://github.com/clickhouse/agent-skills --skill chdb-sqlchdb SQL — ClickHouse in Your Python Process
Run ClickHouse SQL directly in Python — no server needed. Query local files, remote databases, and cloud storage with full ClickHouse SQL power.
pip install chdb
Decision Tree: Pick the Right API
1. One-off query on files or databases → chdb.query()
2. Multi-step analysis with tables → Session
3. DB-API 2.0 connection → chdb.connect()
4. Pandas-style DataFrame operations → Use chdb-datastore skill instead
chdb.query() — One Line, Any Data
import chdb
chdb.query("SELECT * FROM file('data.parquet', Parquet) WHERE price > 100 LIMIT 10") # local files
chdb.query("SELECT * FROM mysql('db:3306', 'shop', 'orders', 'root', 'pass')") # databases
chdb.query("SELECT * FROM s3('s3://bucket/data.parquet', NOSIGN) LIMIT 10") # cloud storage
chdb.query("SELECT * FROM deltaLake('s3://bucket/delta/table', NOSIGN) LIMIT 10") # data lakes
# Cross-source join
chdb.query("""
SELECT u.name, o.amount FROM mysql('db:3306', 'crm', 'users', 'root', 'pass') AS u
JOIN file('orders.parquet', Parquet) AS o ON u.id = o.user_id ORDER BY o.amount DESC
""")
data = {"name": ["Alice", "Bob"], "score": [95, 87]}
chdb.query("SELECT * FROM Python(data) ORDER BY score DESC") # Python data
df = chdb.query("SELECT * FROM numbers(10)", "DataFrame") # output formats
chdb.query("SELECT toDate({d:String}) + number FROM numbers({n:UInt64})",
"DataFrame", params={"d": "2025-01-01", "n": 30}) # parametrized
Table functions → table-functions.md | SQL functions → sql-functions.md | Full API → api-reference.md
Session — Stateful Analysis Pipelines
from chdb import session as chs
sess = chs.Session("./analytics_db") # persistent; Session() for in-memory
sess.query("CREATE TABLE users ENGINE=MergeTree() ORDER BY id AS SELECT * FROM mysql('db:3306','crm','users','root','pass')")
sess.query("CREATE TABLE events ENGINE=MergeTree() ORDER BY (ts,user_id) AS SELECT * FROM s3('s3://logs/events/*.parquet',NOSIGN)")
sess.query("""
SELECT u.country, count() AS cnt, uniqExact(e.user_id) AS users
FROM events e JOIN users u ON e.user_id = u.id
WHERE e.ts >= today() - 7 GROUP BY u.country ORDER BY cnt DESC
""", "Pretty").show()
sess.close()
Connection API (DB-API 2.0)
from chdb import dbapi
conn = dbapi.connect()
cur = conn.cursor()
cur.execute("SELECT * FROM file('data.parquet', Parquet) WHERE value > 100")
print(cur.fetchall())
cur.close()
conn.close()
Troubleshooting
| Problem | Fix |
|---|---|
ImportError: No module named 'chdb' | pip install chdb |
DB::Exception: FILE_NOT_FOUND | Check file path; use absolute path or verify cwd |
DB::Exception: Unknown table function | Check function name spelling (e.g., deltaLake not deltalake) |
| Connection refused to remote DB | Check host:port format; ensure remote DB allows connections |
| Environment check | Run python scripts/verify_install.py (from skill directory) |
References
- API Reference — query/Session/connect signatures
- Table Functions — All ClickHouse table functions
- SQL Functions — Commonly used SQL functions
- Examples — 9 runnable examples with expected output
- Official Docs
Note: This skill teaches how to use chdb SQL. For pandas-style operations, use the
chdb-datastoreskill. For contributing to chdb source code, see CLAUDE.md in the project root.
Plus de skills de clickhouse
chdb-datastore
clickhouse
DataStore est un remplacement paresseux de pandas basé sur ClickHouse. Votre code pandas existant fonctionne sans modification — mais les opérations sont compilées en SQL optimisé et exécutées uniquement lorsque les résultats sont nécessaires (par exemple, print(), len(), itération).
official
clickhouse-architecture-advisor
clickhouse
À UTILISER ABSOLUMENT lors de la conception d'architectures ClickHouse, du choix entre des modèles d'ingestion ou de modélisation, ou de la traduction des meilleures pratiques en systèmes spécifiques à une charge de travail…
official
clickhouse-best-practices
clickhouse
28 règles de bonnes pratiques ClickHouse organisées par conception de schéma, optimisation des requêtes et stratégie d'ingestion de données. Couvre trois domaines critiques : sélection de la clé primaire et des types de données (décisions de conception immuables), optimisation des JOIN et des requêtes, et regroupement des insertions avec évitement des mutations. Inclut 28 règles priorisées par impact, avec des règles de conception de schéma et d'optimisation des requêtes marquées CRITIQUES en raison du stockage columnar et des mécanismes d'index clairsemés de ClickHouse. Fournit des procédures de révision structurées pour...
official
clickhousectl-cloud-deploy
clickhouse
Utiliser lorsque l'utilisateur souhaite déployer ClickHouse dans le cloud, passer en production, utiliser ClickHouse Cloud, héberger un service ClickHouse géré, ou migrer depuis un environnement local…
official
clickhousectl-local-dev
clickhouse
Utiliser lorsque l'utilisateur souhaite créer une application avec ClickHouse, configurer un environnement de développement local ClickHouse, installer ClickHouse, créer un serveur local,…
official
setup
clickhouse
Guide les utilisateurs dans la configuration de la connexion au serveur ClickHouse MCP fourni avec ce plugin. À utiliser lors de la première installation du plugin ou en cas de problème…
official
clickhouse-js-node-coding
clickhouse
Référence : https://clickhouse.com/docs/integrations/javascript
official
clickhouse-js-node-troubleshooting
clickhouse
Référence : https://clickhouse.com/docs/integrations/javascript
official