Reexpress MCP Server

resmi

Aktifkan verifikasi statistik Similarity-Distance-Magnitude untuk alur kerja pencarian, perangkat lunak, dan ilmu data Anda.

GitHub

Dokumentasi

Server Model-Context-Protocol (MCP) Reexpress

Untuk LLM pemanggil alat (mis., Claude Opus 4.7) dan klien MCP yang berjalan di macOS (Tahoe 26 atau lebih baru pada Apple silicon) atau Linux

Ikhtisar video¹: Di sini

Screenshot image of the rendered HTML output from the Reexpress tool.

Server MCP Reexpress adalah solusi siap pakai untuk menambahkan verifikasi statistik mutakhir ke pipeline LLM kompleks Anda, serta penggunaan LLM sehari-hari untuk pencarian dan QA dalam pengaturan pengembangan perangkat lunak dan ilmu data. Ini adalah opini kedua AI pertama yang andal dan kokoh secara statistik untuk alur kerja AI Anda.

Cukup instal server MCP lalu tambahkan prompt Reexpress di akhir teks obrolan Anda. LLM pemanggil alat (mis., model LLM Anthropic Claude Opus 4.7) kemudian akan memeriksa responsnya dengan estimator Similarity-Distance-Magnitude (SDM) Reexpress terlatih yang disediakan, yang menggabungkan gpt-5.5-2026-04-23, gemini-3.1-pro-preview, dan gemini-embedding-2, bersama dengan output dari LLM pemanggil alat, dan menghitung estimasi kuat dari ketidakpastian prediktif terhadap basis data contoh pelatihan dan kalibrasi dari dataset OpenVerification1. Unik untuk metode Reexpress, Anda dapat dengan mudah menyesuaikan model dengan tugas Anda: Cukup panggil alat ReexpressAddTrue atau ReexpressAddFalse setelah verifikasi selesai, dan kemudian panggilan berikutnya ke alat Reexpress akan secara dinamis mempertimbangkan pembaruan Anda saat menghitung probabilitas verifikasi. Kami juga menyertakan skrip pelatihan untuk model tersebut, sehingga Anda dapat menjalankan pelatihan ulang penuh ketika diperlukan perubahan yang lebih substansial, atau Anda ingin menggunakan LLM dasar alternatif.

[!NOTE] Selain memberi Anda (pengguna) estimasi keyakinan yang berprinsip pada output berdasarkan instruksi Anda, LLM pemanggil alat itu sendiri dapat menggunakan output verifikasi untuk secara progresif menyempurnakan jawabannya, menentukan apakah ia memerlukan sumber daya atau alat luar tambahan, atau telah mencapai kebuntuan dan perlu meminta klarifikasi atau informasi lebih lanjut dari Anda. Itulah yang kami sebut penalaran dengan verifikasi SDM --- kemampuan yang sepenuhnya baru dalam perangkat AI yang kami yakini akan membuka lebih banyak kasus penggunaan untuk LLM dan agen LLM, baik untuk individu maupun perusahaan.

Data hanya dikirim melalui panggilan API LLM standar ke Azure/OpenAI dan Google, dengan panggilan gemini-3.1-pro-preview diberikan akses pencarian web standar melalui API; semua pemrosesan untuk estimator SDM dilakukan secara lokal di komputer Anda. Reexpress MCP memiliki sistem akses file yang sederhana dan konservatif, namun efektif: Anda mengontrol file tambahan mana (jika ada) yang dikirim ke API LLM dengan secara eksplisit menentukan file melalui alat akses file ReexpressDirectorySet() dan ReexpressFileSet().

Yang baru di versi 2.4.0

Kartu model tersedia di sini.

Versi 2.4.0 menggunakan gpt-5.5-2026-04-23 dan gemini-3.1-pro-preview sebagai model generatif. Seperti pada 2.3.0.preview, gemini-embedding-2 menggantikan model granite-3.3-8b-instruct lokal sebagai model representasi kesepakatan. Ini sangat menyederhanakan menjalankan Server, karena Anda tidak perlu lagi menjalankan model multi-miliar parameter secara lokal. Selain itu, kami juga telah memperluas dataset OpenVerification1 dengan contoh-contoh baru. Lihat kartu model untuk detailnya.

Catatan tambahan di changelog.md.

Persyaratan Sistem

Server MCP berjalan di Linux dan macOS. Persyaratan utamanya adalah mesin yang menjalankan server MCP harus mampu menjalankan model PyTorch kecil dengan 3 juta parameter secara lokal, sehingga kebutuhan komputasinya minimal. (Itu seperti yang tertulis: Hanya 3 juta parameter; bukan 3 miliar parameter. Model terdiri dari aktivasi SDM atas gemini-embedding-2 dan output klasifikasi dari dua model bahasa API.)

Instalasi

Lihat INSTALL.md.

[!TIP] Server MCP Reexpress mudah diatur dibandingkan dengan server MCP lainnya, tetapi kami mengasumsikan sedikit keakraban dengan LLM, MCP, dan alat baris perintah. Audiens target kami adalah pengembang dan ilmuwan data. Hanya tambahkan server MCP lain dari sumber yang Anda percayai, dan ingatlah bahwa alat MCP lain dapat mengubah perilaku server MCP kami dengan cara yang tidak terduga.

Opsi konfigurasi

Lihat CONFIG.md.

Cara Menggunakan

Lihat documentation/HOW_TO_USE.md.

Menghasilkan HTML statis dengan output dari panggilan alat

Lihat documentation/OUTPUT_HTML.md.

Panduan

Lihat documentation/GUIDELINES.md.

FAQ

Lihat documentation/FAQ.md.

Data Pelatihan dan Kalibrasi

Lihat documentation/DATA.md.

Evaluasi atas OpenVerification1

Lihat documentation/EVAL.md.

Makalah Demonstrasi Sistem

Salinan makalah demonstrasi sistem kami "Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following", yang secara khusus berfokus pada versi 2.1.0 dari Server MCP Reexpress, disertakan di sini. Skrip pendukung untuk mereplikasi analisis disertakan di sini.

Kartu model untuk versi 2.4.0, yang menyoroti perubahan sejak makalah demonstrasi sistem, tersedia di sini.

CAIS 2026 system demonstration poster.

Sitasi

Jika Anda merasa perangkat lunak ini berguna, pertimbangkan untuk menyitasi makalah tinjauan sejawat berikut:

@misc{Schmaltz-2025-SimilarityDistanceMagnitudeActivations,
      title={Similarity-Distance-Magnitude Activations}, 
      author={Allen Schmaltz},
      year={2025},
      eprint={2509.12760},
      archivePrefix={arXiv},
      primaryClass={cs.LG},
      url={https://arxiv.org/abs/2509.12760},
      note={To appear in \emph{Findings of the Association for Computational Linguistics: ACL 2026}, San Diego, CA, USA.},
}

@inproceedings{Schmaltz-2026-ReexpressMCPServer,
author = {Schmaltz, Allen},
title = {Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following},
year = {2026},
isbn = {9798400724152},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
url = {https://doi.org/10.1145/3786335.3813214},
doi = {10.1145/3786335.3813214},
abstract = {In this system demonstration paper, we introduce an open-source implementation for training and testing Similarity-Distance-Magnitude (SDM) estimators for the task of binary classification of instruction-following of closed-weight language models (LMs). This SDM estimator provides an approximately conditional estimate of the predictive uncertainty over instruction-following, conditional on multiple closed-weight LMs and the representation space of an open-weight model. While it would be more robust to use as input to the SDM estimator the hidden-states of the underlying models, this indirect, compositional proxy is more reliable than verbalized uncertainty and adds a means of auditing the predictions against data with known labels. We release the code as an MCP Server to simplify adding interpretability-by-exemplar and locally updatable, uncertainty-aware instruction-following to agent-based pipelines. We further release OpenVerification1, a balanced set of over two million examples of instruction-following and associated rationales from recent closed-weight LMs, for bootstrapping domain-specific estimators. Finally, we discuss limitations of estimating the predictive uncertainty without access to the hidden-states of the tool-calling LM and provide practical guidance for applications.},
booktitle = {Proceedings of the ACM Conference on AI and Agentic Systems},
pages = {1259–1269},
numpages = {11},
keywords = {Approximately conditional calibration, Interpretability-by-exemplar, Classification of instruction-following, Model ensembles},
location = {
},
series = {CAIS '26}
}

The format output telah berubah sejak v1.0.0 yang digunakan dalam video. Lihat changelog.md. ↩