Reexpress MCP Server

ทางการ

เปิดใช้งานการตรวจสอบทางสถิติแบบ Similarity-Distance-Magnitude สำหรับการค้นหา ซอฟต์แวร์ และเวิร์กโฟลว์วิทยาศาสตร์ข้อมูลของคุณ

GitHub

เอกสาร

Reexpress Model-Context-Protocol (MCP) Server

สำหรับ LLM ที่เรียกใช้เครื่องมือ (เช่น Claude Opus 4.7) และไคลเอนต์ MCP ที่ทำงานบน macOS (Tahoe 26 หรือใหม่กว่าบน Apple silicon) หรือ Linux

ภาพรวมวิดีโอ¹: ที่นี่

Screenshot image of the rendered HTML output from the Reexpress tool.

Reexpress MCP Server เป็นโซลูชันสำเร็จรูปที่เพิ่มการตรวจสอบทางสถิติที่ล้ำสมัยให้กับไปป์ไลน์ LLM ที่ซับซ้อนของคุณ รวมถึงการใช้งาน LLM ในชีวิตประจำวันสำหรับการค้นหาและการตอบคำถามในสภาพแวดล้อมการพัฒนาซอฟต์แวร์และวิทยาศาสตร์ข้อมูล นี่เป็นความเห็นที่สองจาก AI ที่เชื่อถือได้และมีความแข็งแกร่งทางสถิติเป็นครั้งแรกสำหรับเวิร์กโฟลว์ AI ของคุณ

เพียงติดตั้งเซิร์ฟเวอร์ MCP แล้วเพิ่มพรอมต์ Reexpress ต่อท้ายข้อความแชทของคุณ LLM ที่เรียกใช้เครื่องมือ (เช่น โมเดล LLM Claude Opus 4.7 ของ Anthropic) จะตรวจสอบการตอบสนองด้วย ตัวประมาณค่า Similarity-Distance-Magnitude (SDM) ของ Reexpress ที่ผ่านการฝึกอบรมมาแล้ว ซึ่งรวมเอา gpt-5.5-2026-04-23, gemini-3.1-pro-preview และ gemini-embedding-2 เข้าด้วยกัน พร้อมกับผลลัพธ์จาก LLM ที่เรียกใช้เครื่องมือ และคำนวณค่าประมาณที่แข็งแกร่งของความไม่แน่นอนในการทำนายเทียบกับฐานข้อมูลตัวอย่างการฝึกอบรมและการสอบเทียบจากชุดข้อมูล OpenVerification1 จุดเด่นของวิธี Reexpress คือคุณสามารถปรับโมเดลให้เข้ากับงานของคุณได้อย่างง่ายดาย: เพียงเรียกใช้เครื่องมือ ReexpressAddTrue หรือ ReexpressAddFalse หลังจากการตรวจสอบเสร็จสิ้น จากนั้นการเรียกใช้เครื่องมือ Reexpress ในอนาคตจะนำการอัปเดตของคุณมาพิจารณาแบบไดนามิกเมื่อคำนวณความน่าจะเป็นในการตรวจสอบ เรายังรวมสคริปต์การฝึกอบรมสำหรับโมเดลไว้ด้วย เพื่อให้คุณสามารถทำการฝึกอบรมใหม่ทั้งหมดเมื่อต้องการการเปลี่ยนแปลงที่สำคัญยิ่งขึ้น หรือคุณต้องการใช้ LLM พื้นฐานทางเลือกอื่น

[!NOTE] นอกเหนือจากการให้ค่าประมาณความเชื่อมั่นที่มีหลักการในผลลัพธ์ตามคำแนะนำของคุณแก่คุณ (ผู้ใช้) แล้ว LLM ที่เรียกใช้เครื่องมือเองยังสามารถใช้ผลลัพธ์การตรวจสอบเพื่อปรับแต่งคำตอบอย่างต่อเนื่อง กำหนดว่าต้องการทรัพยากรหรือเครื่องมือภายนอกเพิ่มเติมหรือไม่ หรือถึงทางตันและจำเป็นต้องขอคำชี้แจงหรือข้อมูลเพิ่มเติมจากคุณ นั่นคือสิ่งที่เราเรียกว่า การให้เหตุผลด้วยการตรวจสอบ SDM --- ความสามารถใหม่ทั้งหมดในชุดเครื่องมือ AI ที่เราคิดว่าจะเปิดกรณีการใช้งานที่กว้างขึ้นมากสำหรับ LLM และเอเจนต์ LLM ทั้งสำหรับบุคคลและองค์กร

ข้อมูลจะถูกส่งผ่านการเรียก API LLM มาตรฐานไปยัง Azure/OpenAI และ Google เท่านั้น โดยการเรียก gemini-3.1-pro-preview จะได้รับการเข้าถึงการค้นหาเว็บมาตรฐานผ่าน API; การประมวลผลทั้งหมดสำหรับตัวประมาณค่า SDM จะทำในเครื่องคอมพิวเตอร์ของคุณ Reexpress MCP มีระบบการเข้าถึงไฟล์ที่เรียบง่าย อนุรักษ์นิยม แต่มีประสิทธิภาพ: คุณควบคุมได้ว่าไฟล์เพิ่มเติมใด (ถ้ามี) ที่จะถูกส่งไปยัง API LLM โดยการระบุไฟล์อย่างชัดเจนผ่านเครื่องมือการเข้าถึงไฟล์ ReexpressDirectorySet() และ ReexpressFileSet()

มีอะไรใหม่ในเวอร์ชัน 2.4.0

การ์ดโมเดลมีอยู่ ที่นี่

เวอร์ชัน 2.4.0 ใช้ gpt-5.5-2026-04-23 และ gemini-3.1-pro-preview เป็นโมเดลเชิงกำเนิด เช่นเดียวกับ 2.3.0.preview gemini-embedding-2 แทนที่โมเดล granite-3.3-8b-instruct ในเครื่องเป็นโมเดลการแสดงข้อตกลง สิ่งนี้ทำให้การรันเซิร์ฟเวอร์ง่ายขึ้นอย่างมาก เนื่องจากคุณไม่จำเป็นต้องรันโมเดลพารามิเตอร์หลายพันล้านตัวในเครื่องอีกต่อไป นอกจากนี้ เรายังได้ขยายชุดข้อมูล OpenVerification1 ด้วยตัวอย่างใหม่ ดู การ์ดโมเดล สำหรับรายละเอียด

หมายเหตุเพิ่มเติมใน changelog.md

ความต้องการของระบบ

เซิร์ฟเวอร์ MCP ทำงานบน Linux และ macOS ข้อกำหนดหลักคือเครื่องที่รันเซิร์ฟเวอร์ MCP ต้องสามารถรันโมเดล PyTorch ขนาดเล็ก 3 ล้านพารามิเตอร์ในเครื่องได้ ดังนั้นความต้องการในการคำนวณจึงน้อยมาก (ตามที่เขียนไว้: เพียง 3 ล้าน พารามิเตอร์; ไม่ใช่ 3 พันล้าน พารามิเตอร์ โมเดลประกอบด้วยการกระตุ้น SDM บน gemini-embedding-2 และผลลัพธ์การจำแนกประเภทของโมเดลภาษา API สองตัว)

การติดตั้ง

ดู INSTALL.md

[!TIP] เซิร์ฟเวอร์ Reexpress MCP ติดตั้งได้ง่ายเมื่อเทียบกับเซิร์ฟเวอร์ MCP อื่นๆ แต่เราถือว่ามีความคุ้นเคยกับ LLM, MCP และเครื่องมือบรรทัดคำสั่งอยู่บ้าง กลุ่มเป้าหมายของเราคือนักพัฒนาและนักวิทยาศาสตร์ข้อมูล เพิ่มเซิร์ฟเวอร์ MCP อื่นๆ จากแหล่งที่คุณไว้วางใจเท่านั้น และโปรดทราบว่าเครื่องมือ MCP อื่นๆ อาจเปลี่ยนแปลงพฤติกรรมของเซิร์ฟเวอร์ MCP ของเราในลักษณะที่ไม่คาดคิด

ตัวเลือกการกำหนดค่า

ดู CONFIG.md

วิธีใช้งาน

ดู documentation/HOW_TO_USE.md

การสร้าง HTML แบบคงที่ด้วยผลลัพธ์จากการเรียกใช้เครื่องมือ

ดู documentation/OUTPUT_HTML.md

แนวทางปฏิบัติ

ดู documentation/GUIDELINES.md

คำถามที่พบบ่อย

ดู documentation/FAQ.md

ข้อมูลการฝึกอบรมและการสอบเทียบ

ดู documentation/DATA.md

การประเมินผลบน OpenVerification1

ดู documentation/EVAL.md

บทความสาธิตระบบ

สำเนาบทความสาธิตระบบของเรา "Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following" ซึ่งเน้นเฉพาะเวอร์ชัน 2.1.0 ของ Reexpress MCP Server รวมอยู่ ที่นี่ สคริปต์สนับสนุนเพื่อทำซ้ำการวิเคราะห์รวมอยู่ ที่นี่

การ์ดโมเดลสำหรับเวอร์ชัน 2.4.0 ซึ่งเน้นการเปลี่ยนแปลงตั้งแต่บทความสาธิตระบบ มีอยู่ ที่นี่

CAIS 2026 system demonstration poster.

การอ้างอิง

หากคุณพบว่าซอฟต์แวร์นี้มีประโยชน์ โปรดพิจารณาอ้างอิงบทความที่ผ่านการตรวจสอบโดยผู้เชี่ยวชาญต่อไปนี้:

@misc{Schmaltz-2025-SimilarityDistanceMagnitudeActivations,
      title={Similarity-Distance-Magnitude Activations}, 
      author={Allen Schmaltz},
      year={2025},
      eprint={2509.12760},
      archivePrefix={arXiv},
      primaryClass={cs.LG},
      url={https://arxiv.org/abs/2509.12760},
      note={To appear in \emph{Findings of the Association for Computational Linguistics: ACL 2026}, San Diego, CA, USA.},
}

@inproceedings{Schmaltz-2026-ReexpressMCPServer,
author = {Schmaltz, Allen},
title = {Introspectable, Updatable, and Uncertainty-aware Classification of Language Model Instruction-following},
year = {2026},
isbn = {9798400724152},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
url = {https://doi.org/10.1145/3786335.3813214},
doi = {10.1145/3786335.3813214},
abstract = {In this system demonstration paper, we introduce an open-source implementation for training and testing Similarity-Distance-Magnitude (SDM) estimators for the task of binary classification of instruction-following of closed-weight language models (LMs). This SDM estimator provides an approximately conditional estimate of the predictive uncertainty over instruction-following, conditional on multiple closed-weight LMs and the representation space of an open-weight model. While it would be more robust to use as input to the SDM estimator the hidden-states of the underlying models, this indirect, compositional proxy is more reliable than verbalized uncertainty and adds a means of auditing the predictions against data with known labels. We release the code as an MCP Server to simplify adding interpretability-by-exemplar and locally updatable, uncertainty-aware instruction-following to agent-based pipelines. We further release OpenVerification1, a balanced set of over two million examples of instruction-following and associated rationales from recent closed-weight LMs, for bootstrapping domain-specific estimators. Finally, we discuss limitations of estimating the predictive uncertainty without access to the hidden-states of the tool-calling LM and provide practical guidance for applications.},
booktitle = {Proceedings of the ACM Conference on AI and Agentic Systems},
pages = {1259–1269},
numpages = {11},
keywords = {Approximately conditional calibration, Interpretability-by-exemplar, Classification of instruction-following, Model ensembles},
location = {
},
series = {CAIS '26}
}

The รูปแบบผลลัพธ์มีการเปลี่ยนแปลงตั้งแต่ v1.0.0 ที่ใช้ในวิดีโอ ดู changelog.md ↩