Reexpress MCP Server

oficial

Habilite a verificação estatística de Similaridade-Distância-Magnitude para seus fluxos de trabalho de busca, software e ciência de dados.

Documentação

Servidor Model-Context-Protocol (MCP) Reexpress

Para LLMs com chamada de ferramentas (ex.: Claude Opus 4.7) e clientes MCP executando em macOS (Tahoe 26 ou posterior em Apple silicon) ou Linux

Visão geral em vídeo1: Aqui

Watch the YouTube video

Screenshot image of the rendered HTML output from the Reexpress tool.

Re

O Servidor MCP Reexpress é uma solução pronta para uso que adiciona verificação estatística de última geração aos seus pipelines complexos de LLM, bem como ao uso cotidiano de LLMs para busca e QA em ambientes de desenvolvimento de software e ciência de dados. É a primeira segunda opinião de IA confiável e estatisticamente robusta para seus fluxos de trabalho com IA.

Basta instalar o servidor MCP e adicionar o prompt Reexpress ao final do texto do seu chat. O LLM com chamada de ferramentas (ex.: o modelo de LLM da Anthropic, Claude Opus 4.7) verificará sua resposta com o estimador de Similaridade-Distância-Magnitude (SDM) pré-treinado do Reexpress, que combina gpt-5.5-2026-04-23, gemini-3.1-pro-preview e gemini-embedding-2, juntamente com a saída do LLM com chamada de ferramentas, e calcula uma estimativa robusta da incerteza preditiva em relação a um banco de dados de exemplos de treinamento e calibração do conjunto de dados OpenVerification1. Exclusivo do método Reexpress, você pode adaptar facilmente o modelo às suas tarefas: Basta chamar as ferramentas ReexpressAddTrue ou ReexpressAddFalse após a conclusão de uma verificação, e as chamadas futuras à ferramenta Reexpress levarão dinamicamente suas atualizações em consideração ao calcular a probabilidade de verificação. Também incluímos os scripts de treinamento do modelo, para que você possa executar um retreinamento completo quando forem necessárias mudanças mais substanciais ou se quiser usar LLMs subjacentes alternativos.

[!NOTE] Além de fornecer a você (o usuário) uma estimativa fundamentada de confiança na saída dadas as suas instruções, o próprio LLM com chamada de ferramentas pode usar a saída da verificação para refinar progressivamente sua resposta, determinar se precisa de recursos ou ferramentas externas adicionais, ou se chegou a um impasse e precisa pedir mais esclarecimentos ou informações. É o que chamamos de raciocínio com verificação SDM --- uma capacidade totalmente nova no kit de ferramentas de IA que acreditamos que abrirá uma gama muito mais ampla de casos de uso para LLMs e agentes de LLM, tanto para indivíduos quanto para empresas.

Os dados são enviados apenas por meio de chamadas padrão de API de LLM para Azure/OpenAI e Google, com as chamadas gemini-3.1-pro-preview recebendo acesso padrão de busca na web através da API; todo o processamento para o estimador SDM é feito localmente no seu computador. O Reexpress MCP possui um sistema de acesso a arquivos simples e conservador, mas eficaz: Você controla quais arquivos adicionais (se houver) são enviados para as APIs de LLM, especificando explicitamente os arquivos por meio das ferramentas de acesso a arquivos ReexpressDirectorySet() e ReexpressFileSet().

Novidades na versão 2.4.0

O cartão de modelo está disponível aqui.

A versão 2.4.0 usa gpt-5.5-2026-04-23 e gemini-3.1-pro-preview como modelos generativos. Assim como na 2.3.0.preview, o gemini-embedding-2 substitui o modelo local granite-3.3-8b-instruct como modelo de representação de concordância. Isso simplifica muito a execução do Servidor, já que você não precisa mais executar localmente um modelo de múltiplos bilhões de parâmetros. Além disso, também expandimos o conjunto de dados OpenVerification1 com novos exemplos. Consulte o cartão de modelo para obter detalhes.

Notas adicionais em changelog.md.

Requisitos do Sistema

O servidor MCP é executado em Linux e macOS. O principal requisito é que a máquina que executa o servidor MCP precise ser capaz de executar localmente um pequeno modelo PyTorch de 3 milhões de parâmetros, portanto, os requisitos computacionais são mínimos. (É isso mesmo: apenas 3 milhões de parâmetros; não 3 bilhões de parâmetros. O modelo consiste em uma ativação SDM sobre o gemini-embedding-2 e a saída de classificação dos dois modelos de linguagem da API.)

Instalação

Consulte INSTALL.md.

[!TIP] O servidor MCP Reexpress é simples de configurar em comparação com outros servidores MCP, mas presumimos alguma familiaridade com LLMs, MCP e ferramentas de linha de comando. Nosso público-alvo são desenvolvedores e cientistas de dados. Adicione apenas outros servidores MCP de fontes confiáveis e tenha em mente que outras ferramentas MCP podem alterar o comportamento do nosso servidor MCP de maneiras inesperadas.

Opções de Configuração

Consulte CONFIG.md.

Como Usar

Consulte documentation/HOW_TO_USE.md.

Gerando HTML estático com a saída da chamada da ferramenta

Consulte documentation/OUTPUT_HTML.md.

Diretrizes

Consulte documentation/GUIDELINES.md.

Perguntas Frequentes (FAQ)

Consulte documentation/FAQ.md.

Dados de Treinamento e Calibração

Consulte documentation/DATA.md.

Avaliação sobre o OpenVerification1

Consulte documentation/EVAL.md.

Artigo de Demonstração do Sistema

Uma cópia do nosso artigo de demonstração do sistema "Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following", que se concentra particularmente na versão 2.1.0 do Servidor MCP Reexpress, está incluída aqui. Os scripts de suporte para replicar a análise estão incluídos aqui.

O cartão de modelo para a versão 2.4.0, que destaca as mudanças desde o artigo de demonstração do sistema, está disponível aqui.

CAIS 2026 system demonstration poster.

Citação

Se você achar este software útil, considere citar os seguintes artigos revisados por pares:

@misc{Schmaltz-2025-SimilarityDistanceMagnitudeActivations,
      title={Similarity-Distance-Magnitude Activations}, 
      author={Allen Schmaltz},
      year={2025},
      eprint={2509.12760},
      archivePrefix={arXiv},
      primaryClass={cs.LG},
      url={https://arxiv.org/abs/2509.12760},
      note={To appear in \emph{Findings of the Association for Computational Linguistics: ACL 2026}, San Diego, CA, USA.},
}
@inproceedings{Schmaltz-2026-ReexpressMCPServer,
author = {Schmaltz, Allen},
title = {Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following},
year = {2026},
isbn = {9798400724152},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
url = {https://doi.org/10.1145/3786335.3813214},
doi = {10.1145/3786335.3813214},
abstract = {In this system demonstration paper, we introduce an open-source implementation for training and testing Similarity-Distance-Magnitude (SDM) estimators for the task of binary classification of instruction-following of closed-weight language models (LMs). This SDM estimator provides an approximately conditional estimate of the predictive uncertainty over instruction-following, conditional on multiple closed-weight LMs and the representation space of an open-weight model. While it would be more robust to use as input to the SDM estimator the hidden-states of the underlying models, this indirect, compositional proxy is more reliable than verbalized uncertainty and adds a means of auditing the predictions against data with known labels. We release the code as an MCP Server to simplify adding interpretability-by-exemplar and locally updatable, uncertainty-aware instruction-following to agent-based pipelines. We further release OpenVerification1, a balanced set of over two million examples of instruction-following and associated rationales from recent closed-weight LMs, for bootstrapping domain-specific estimators. Finally, we discuss limitations of estimating the predictive uncertainty without access to the hidden-states of the tool-calling LM and provide practical guidance for applications.},
booktitle = {Proceedings of the ACM Conference on AI and Agentic Systems},
pages = {1259–1269},
numpages = {11},
keywords = {Approximately conditional calibration, Interpretability-by-exemplar, Classification of instruction-following, Model ensembles},
location = {
},
series = {CAIS '26}
}

Footnotes

  1. The formato de saída mudou desde a v1.0.0 usada no vídeo. Consulte changelog.md.