Reexpress MCP Server

oficial

Habilita la verificación estadística de Similitud-Distancia-Magnitud para tus flujos de trabajo de búsqueda, software y ciencia de datos.

GitHub

Documentación

Servidor Model-Context-Protocol (MCP) de Reexpress

Para LLMs con llamada a herramientas (p. ej., Claude Opus 4.7) y clientes MCP ejecutándose en macOS (Tahoe 26 o posterior en Apple silicon) o Linux

Resumen en video¹: Aquí

Screenshot image of the rendered HTML output from the Reexpress tool.

El Servidor MCP de Reexpress es una solución inmediata para agregar verificación estadística de última generación a tus flujos complejos de LLM, así como a tu uso diario de LLMs para búsqueda y QA en entornos de desarrollo de software y ciencia de datos. Es la primera segunda opinión de IA confiable y estadísticamente robusta para tus flujos de trabajo de IA.

Simplemente instala el servidor MCP y luego añade el prompt de Reexpress al final de tu texto de chat. El LLM con llamada a herramientas (p. ej., el modelo de Anthropic Claude Opus 4.7) verificará entonces su respuesta con el estimador de Similitud-Distancia-Magnitud (SDM) preentrenado de Reexpress, que combina gpt-5.5-2026-04-23, gemini-3.1-pro-preview y gemini-embedding-2, junto con la salida del LLM con llamada a herramientas, y calcula una estimación robusta de la incertidumbre predictiva contra una base de datos de ejemplos de entrenamiento y calibración del conjunto de datos OpenVerification1. Exclusivo del método Reexpress, puedes adaptar fácilmente el modelo a tus tareas: Simplemente llama a las herramientas ReexpressAddTrue o ReexpressAddFalse después de que una verificación haya finalizado, y luego las futuras llamadas a la herramienta Reexpress tomarán dinámicamente en cuenta tus actualizaciones al calcular la probabilidad de verificación. También incluimos los scripts de entrenamiento para el modelo, de modo que puedas ejecutar un reentrenamiento completo cuando se necesiten cambios más sustanciales, o si deseas usar LLMs subyacentes alternativos.

[!NOTE] Además de proporcionarte a ti (el usuario) una estimación fundamentada de la confianza en la salida dadas tus instrucciones, el propio LLM con llamada a herramientas puede usar la salida de verificación para refinar progresivamente su respuesta, determinar si necesita recursos o herramientas externas adicionales, o si ha llegado a un punto muerto y necesita pedirte más aclaraciones o información. Eso es lo que llamamos razonamiento con verificación SDM --- una capacidad completamente nueva en el conjunto de herramientas de IA que creemos que abrirá una gama mucho más amplia de casos de uso para LLMs y agentes de LLM, tanto para individuos como para empresas.

Los datos solo se envían a través de llamadas API estándar de LLM a Azure/OpenAI y Google, con las llamadas a gemini-3.1-pro-preview teniendo acceso estándar de búsqueda web a través de la API; todo el procesamiento para el estimador SDM se realiza localmente en tu computadora. Reexpress MCP tiene un sistema de acceso a archivos simple y conservador, pero efectivo: Tú controlas qué archivos adicionales (si los hay) se envían a las APIs de LLM especificando explícitamente los archivos a través de las herramientas de acceso a archivos ReexpressDirectorySet() y ReexpressFileSet().

Novedades en la versión 2.4.0

La tarjeta del modelo está disponible aquí.

La versión 2.4.0 utiliza gpt-5.5-2026-04-23 y gemini-3.1-pro-preview como modelos generativos. Al igual que con 2.3.0.preview, gemini-embedding-2 reemplaza al modelo local granite-3.3-8b-instruct como modelo de representación de acuerdo. Esto simplifica enormemente la ejecución del Servidor, ya que ya no necesitas ejecutar localmente un modelo de múltiples miles de millones de parámetros. Además, también hemos ampliado el conjunto de datos OpenVerification1 con nuevos ejemplos. Consulta la tarjeta del modelo para más detalles.

Notas adicionales en changelog.md.

Requisitos del Sistema

El servidor MCP se ejecuta en Linux y macOS. El requisito principal es que la máquina que ejecuta el servidor MCP necesita poder ejecutar localmente un pequeño modelo PyTorch de 3 millones de parámetros, por lo que los requisitos de cómputo son mínimos. (Tal como está escrito: Solo 3 millones de parámetros; no 3 mil millones de parámetros. El modelo consiste en una activación SDM sobre gemini-embedding-2 y la salida de clasificación de los dos modelos de lenguaje de la API.)

Instalación

Consulta INSTALL.md.

[!TIP] El servidor MCP de Reexpress es sencillo de configurar en comparación con otros servidores MCP, pero asumimos cierta familiaridad con LLMs, MCP y herramientas de línea de comandos. Nuestro público objetivo son desarrolladores y científicos de datos. Solo añade otros servidores MCP de fuentes en las que confíes, y ten en cuenta que otras herramientas MCP podrían alterar el comportamiento de nuestro servidor MCP de maneras inesperadas.

Opciones de configuración

Consulta CONFIG.md.

Cómo usar

Consulta documentation/HOW_TO_USE.md.

Generando HTML estático con la salida de la llamada a herramienta

Consulta documentation/OUTPUT_HTML.md.

Directrices

Consulta documentation/GUIDELINES.md.

Preguntas frecuentes

Consulta documentation/FAQ.md.

Datos de entrenamiento y calibración

Consulta documentation/DATA.md.

Evaluación sobre OpenVerification1

Consulta documentation/EVAL.md.

Artículo de demostración del sistema

Se incluye una copia de nuestro artículo de demostración del sistema "Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following", que se centra en particular en la versión 2.1.0 del Servidor MCP de Reexpress, aquí. Los scripts de soporte para replicar el análisis se incluyen aquí.

La tarjeta del modelo para la versión 2.4.0, que destaca los cambios desde el artículo de demostración del sistema, está disponible aquí.

CAIS 2026 system demonstration poster.

Cita

Si encuentras útil este software, considera citar los siguientes artículos revisados por pares:

@misc{Schmaltz-2025-SimilarityDistanceMagnitudeActivations,
      title={Similarity-Distance-Magnitude Activations}, 
      author={Allen Schmaltz},
      year={2025},
      eprint={2509.12760},
      archivePrefix={arXiv},
      primaryClass={cs.LG},
      url={https://arxiv.org/abs/2509.12760},
      note={To appear in \emph{Findings of the Association for Computational Linguistics: ACL 2026}, San Diego, CA, USA.},
}

@inproceedings{Schmaltz-2026-ReexpressMCPServer,
author = {Schmaltz, Allen},
title = {Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following},
year = {2026},
isbn = {9798400724152},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
url = {https://doi.org/10.1145/3786335.3813214},
doi = {10.1145/3786335.3813214},
abstract = {In this system demonstration paper, we introduce an open-source implementation for training and testing Similarity-Distance-Magnitude (SDM) estimators for the task of binary classification of instruction-following of closed-weight language models (LMs). This SDM estimator provides an approximately conditional estimate of the predictive uncertainty over instruction-following, conditional on multiple closed-weight LMs and the representation space of an open-weight model. While it would be more robust to use as input to the SDM estimator the hidden-states of the underlying models, this indirect, compositional proxy is more reliable than verbalized uncertainty and adds a means of auditing the predictions against data with known labels. We release the code as an MCP Server to simplify adding interpretability-by-exemplar and locally updatable, uncertainty-aware instruction-following to agent-based pipelines. We further release OpenVerification1, a balanced set of over two million examples of instruction-following and associated rationales from recent closed-weight LMs, for bootstrapping domain-specific estimators. Finally, we discuss limitations of estimating the predictive uncertainty without access to the hidden-states of the tool-calling LM and provide practical guidance for applications.},
booktitle = {Proceedings of the ACM Conference on AI and Agentic Systems},
pages = {1259–1269},
numpages = {11},
keywords = {Approximately conditional calibration, Interpretability-by-exemplar, Classification of instruction-following, Model ensembles},
location = {
},
series = {CAIS '26}
}

The el formato de salida ha cambiado desde la v1.0.0 utilizada en el video. Consulta changelog.md. ↩