dbt MCP Server

官方

dbt(数据构建工具)的官方MCP服务器,提供与dbt Core/Cloud CLI的集成、项目元数据发现、模型信息以及语义层查询功能。

文档

dbt MCP 服务器

OpenSSF Best Practices

此 MCP(模型上下文协议)服务器提供多种与 dbt 交互的工具。您可以使用此 MCP 服务器为 AI 代理提供 dbt Core、dbt Fusion 和 dbt Platform 中的项目上下文。

请阅读我们的文档此处了解更多信息。这篇博客文章详细介绍了 dbt MCP 服务器的更多可能性。

实验性 MCP 捆绑包

我们在每个版本中发布一个实验性的模型上下文协议捆绑包 (dbt-mcp.mcpb),以便支持 MCPB 的客户端无需额外设置即可导入此服务器。从最新版本的发布资产中下载捆绑包,并按照 Anthropic 的 mcpb CLI 文档进行安装或检查。

反馈

如果您有意见或问题,请创建 GitHub Issue 或加入社区 Slack 中的 #tools-dbt-mcp 频道。

架构

dbt MCP 服务器架构允许您的代理连接到各种工具。

architecture diagram of the dbt MCP server

工具

SQL

用于在 dbt Platform 基础设施上执行和生成 SQL 的工具。

  • execute_sql:在 dbt Platform 基础设施上执行 SQL,并支持语义层。
  • text_to_sql:使用项目上下文从自然语言生成 SQL。

语义层

要了解有关 dbt 语义层的更多信息,请点击此处

  • get_dimension_values:获取维度的不同值;可选择限定到特定指标。
  • get_dimensions:获取指定指标的维度。
  • get_entities:获取指定指标的实体。
  • get_metrics_compiled_sql:返回指标的编译 SQL,而不执行查询。
  • list_metrics:检索所有已定义的指标。
  • list_saved_queries:检索所有已保存的查询。
  • query_metrics:执行带有筛选和分组选项的指标查询。

发现

要了解有关 dbt 发现 API 的更多信息,请点击此处

  • get_all_macros:检索宏;可选择按包筛选或仅返回包名称。
  • get_all_models:检索所有模型的名称和描述。
  • get_all_sources:获取所有源及其新鲜度状态;可选择按源名称筛选。
  • get_exposure_details:获取曝光详细信息,包括所有者、父项和新鲜度状态。
  • get_exposures:获取所有曝光(下游仪表板、应用程序或分析)。
  • get_lineage:获取完整的血缘图(祖先和后代),支持类型和深度筛选。
  • get_macro_details:获取特定宏的详细信息。
  • get_mart_models:检索所有数据集市模型。
  • get_model_children:获取模型的下游依赖项。
  • get_model_details:获取模型详细信息,包括编译后的 SQL、列和模式。
  • get_model_health:获取健康信号:运行状态、测试结果和上游源新鲜度。
  • get_model_parents:获取模型的上游依赖项。
  • get_model_performance:获取模型的执行历史;可选择包含测试结果。
  • get_related_models:使用语义搜索查找相似模型。
  • get_seed_details:获取特定种子文件的详细信息。
  • get_semantic_model_details:获取特定语义模型的详细信息。
  • get_snapshot_details:获取特定快照的详细信息。
  • get_source_details:获取源详细信息,包括列和新鲜度。
  • get_test_details:获取特定测试的详细信息。
  • search:[Alpha] 在整个 dbt 项目中搜索资源(尚未普遍可用)。

dbt CLI

允许您的客户端通过 MCP 工具使用 dbt 命令可能会修改您的数据模型、源和仓库对象。仅在您信任客户端并了解潜在影响的情况下继续。

  • build:按 DAG 顺序执行模型、测试、快照和种子文件。
  • clone:将选定节点从指定状态克隆到目标模式。
  • compile:从模型/测试/分析生成可执行 SQL;用于验证 Jinja 逻辑。
  • docs:为 dbt 项目生成文档。
  • get_lineage_dev:从本地 manifest.json 检索血缘,支持类型和深度筛选。
  • get_node_details_dev:从本地 manifest.json 检索节点详细信息(模型、种子文件、快照、源)。
  • list:按类型列出 dbt 项目中的资源,支持选择器。
  • parse:解析并验证项目文件的语法正确性。
  • run:执行模型以在数据库中物化它们。
  • show:对数据库执行 SQL 并返回结果。
  • test:运行测试以验证数据和模型的完整性。

管理 API

要了解有关 dbt 管理 API 的更多信息,请点击此处

  • cancel_job_run:取消正在运行的作业。
  • get_job_details:获取作业配置,包括触发器、调度和 dbt 命令。
  • get_job_run_details:获取运行详细信息,包括状态、计时、步骤和工件。
  • get_job_run_error:获取作业运行的错误和/或警告详细信息;可选择仅包含或显示警告。
  • list_job_run_artifacts:列出作业运行中的可用工件。
  • list_jobs:列出 dbt Platform 账户中的作业;可选择按项目或环境筛选。
  • list_jobs_runs:列出作业运行;可选择按作业、状态或排序字段筛选。
  • list_projects:列出 dbt Platform 账户中的所有项目。
  • retry_job_run:重试失败的作业运行。
  • trigger_job_run:触发作业运行;可选择覆盖 git 分支、模式或其他设置。

dbt 代码生成

这些工具帮助自动化 dbt 项目文件的样板代码生成。

  • generate_model_yaml:生成包含列的模型 YAML;可选择继承上游描述。
  • generate_source:通过内省数据库模式生成源 YAML;可选择包含列。
  • generate_staging_model:从源表生成暂存模型 SQL。

dbt LSP

一组利用 Fusion 引擎进行高级 SQL 编译和列级血缘分析的工具。

  • fusion.compile_sql:通过 dbt Platform 在项目上下文中编译 SQL。
  • fusion.get_column_lineage:通过 dbt Platform 追踪列级血缘。
  • get_column_lineage:在本地追踪列级血缘(需要通过 dbt Labs VSCE 安装 dbt-lsp)。

产品文档

用于从 docs.getdbt.com 的官方 dbt 文档中搜索和获取内容的工具。

  • get_product_doc_pages:按路径或 URL 获取一个或多个 docs.getdbt.com 页面的完整 Markdown 内容。
  • search_product_docs:在 docs.getdbt.com 中搜索与查询匹配的页面;返回按相关性排序的标题、URL 和描述。使用 get_product_doc_pages 获取完整内容。

MCP 服务器元数据

这些工具提供有关 MCP 服务器本身的信息。

  • get_mcp_server_branch:返回正在运行的 dbt MCP 服务器的当前 git 分支。
  • get_mcp_server_version:返回 dbt MCP 服务器的当前版本。

示例

通常,您会将 dbt MCP 服务器连接到诸如 Claude 或 Cursor 之类的代理产品。但是,如果您有兴趣创建自己的代理,请查看示例目录以了解如何开始。

依赖项

依赖项被固定到特定版本,不会自动更新。仅通过自动拉取请求提交与安全相关的依赖项更新。

贡献

阅读 CONTRIBUTING.md 了解如何参与的说明!