Memento-cmp
A Three-Layer Memory Architecture for LLMs (Redis + Postgres + Vector) MCP
Memento MCP
AI์๊ฒ ๊ธฐ์ต์ ์ค๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ ๊ธฐ์ต์ ๋ฐํ์ผ๋ก ์ฑ์ฅํ๊ฒ ํฉ๋๋ค.
๋งค์ผ ์์นจ ๊ธฐ์ต์ด ๋ฆฌ์ ๋๋ ์ ์ ์ง์์ ์์ํด๋ณด๋ผ. ์ด์ ๊ฐ๋ฅด์น ๊ฒ๋, ์ง๋์ฃผ ํจ๊ป ํด๊ฒฐํ ๋ฌธ์ ๋, ์ทจํฅ๋ ์ ๋ถ ๊น๋จน๋๋ค. Memento MCP๋ ์ด ์ ์ ์๊ฒ ๊ธฐ์ต์ ์ฌ์ด์ค๋ค.
Memento MCP๋ MCP(Model Context Protocol) ๊ธฐ๋ฐ ์์ด์ ํธ ์ฅ๊ธฐ ๊ธฐ์ต ์๋ฒ๋ค. ์ธ์ ์ด ์ข ๋ฃ๋์ด๋ ์ค์ํ ์ฌ์ค, ๊ฒฐ์ , ์๋ฌ ํจํด, ์ ์ฐจ๋ฅผ ์ ์งํ๊ณ ๋ค์ ์ธ์ ์์ ๋ณต์ํ๋ค.
๋จ์ํ ๊ธฐ์ต์ ๋์๊ด์ด ์๋๋ค. ํผ๋๋ฐฑ์ด ์์ด๋ฉด ์ฐ๊ฒฐ์ด ๊ฐํด์ง๊ณ , ๊ฒฝํ์ด ๋ฐ๋ณต๋๋ฉด ํจํด์ด ์ถ์ํ๋๊ณ , ์ธ์ ์ด ์ด์ด์ง๋ฉด ์ด์ผ๊ธฐ๊ฐ ์๊ธด๋ค. ๊ธฐ์ตํ๋ AI๊ฐ ์๋๋ผ ๊ฒฝํ์ผ๋ก ์ฑ์ฅํ๋ AI๋ฅผ ์งํฅํ๋ค.
30์ด ์ฒดํ
AI์๊ฒ ๋ฌด์ธ๊ฐ๋ฅผ ๊ธฐ์ต์ํค๊ณ , ๋ค์ ์ธ์ ์์ ๊บผ๋ด ๋ณด๋ ํ๋ฆ์ด๋ค:
[์ธ์
1]
์ฌ์ฉ์: "์ฐ๋ฆฌ ํ๋ก์ ํธ๋ PostgreSQL 15๋ฅผ ์ฐ๊ณ , ํ
์คํธ๋ Vitest๋ก ๋๋ ค"
โ AI๊ฐ remember ํธ์ถ โ ํํธ 2๊ฐ ์ ์ฅ
[์ธ์
2 โ ๋ค์ ๋ ]
โ AI๊ฐ context ํธ์ถ โ "PostgreSQL 15 ์ฌ์ฉ", "Vitest ํ
์คํธ" ์๋ ๋ณต์
์ฌ์ฉ์: "ํ
์คํธ ์ด๋ป๊ฒ ๋๋ฆฌ๋๋ผ?"
โ AI๊ฐ recall ํธ์ถ โ "Vitest๋ก ํ
์คํธ ์คํ" ํํธ ๋ฐํ
โ AI: "์ด ํ๋ก์ ํธ๋ Vitest๋ฅผ ์ฌ์ฉํฉ๋๋ค. npx vitest๋ก ์คํํ์ธ์."
๋งค ์ธ์ ๋ง๋ค ๊ฐ์ ์ค๋ช ์ ๋ฐ๋ณตํ ํ์๊ฐ ์๋ค.
์ค์น
ํ์: Node.js 20+, PostgreSQL (pgvector ํ์ฅ)
cp .env.example.minimal .env
# .env ๊ฐ์ ํธ์งํ ๋ค ์
ธ์ ๋ฐ์
export $(grep -v '^#' .env | grep '=' | xargs)
npm install
npm run migrate
node server.js
OpenAI API ์์ด ๋ก์ปฌ ์๋ฒ ๋ฉ์ ์ฌ์ฉํ๋ ค๋ฉด .env์ EMBEDDING_PROVIDER=transformers๋ฅผ ์ถ๊ฐํ๋ค. ๊ธฐ๋ ์ Xenova/multilingual-e5-small ๋ชจ๋ธ์ ์๋์ผ๋ก ๋ค์ด๋ก๋ํ๋ค. ๋จ, OpenAI ์๋ฒ ๋ฉ์ผ๋ก ์ด๋ฏธ ์ ์ฅ๋ ๋ฐ์ดํฐ์ ํผ์ฉํ๋ฉด ์ฐจ์์ด ๋ถ์ผ์นํ๋ฏ๋ก ์๋ก ๋ง์ด๊ทธ๋ ์ด์
๋ DB์์๋ง ์ฌ์ฉํ ๊ฒ.
์๋ฒ๊ฐ ๋ฌ ๋ค์๋ First Memory Flow๋ก ๋์์ ๊ฒ์ฆํ๋ค.
๋ค๋ฅธ ํ๋ซํผ ์ค์ ์ ์ ํธํ ํ๋ซํผ ํ ์ด๋ธ ์ฐธ์กฐ.
์ ๋ฐ์ดํธ
cd ~/memento-mcp
git pull origin main
npm install
npm run migrate
# ์๋น์ค ์ฌ์์ (systemd / pm2 / docker ๋ฑ ํ๊ฒฝ์ ๋ง๊ฒ)
npm run migrate๋.env์ DB ์ค์ ์ ์๋์ผ๋ก ์ฌ์ฉํ๋ค.DATABASE_URL์๋ ์ง์ ๋ถํ์.- pgvector ์คํค๋ง๋ ์๋ ๊ฐ์ง๋๋ค.
PGVECTOR_SCHEMA์ค์ ์ ๋๋ถ๋ถ ๋ถํ์.
Claude Code ์ฐ๋
claude mcp add CLI๋ก ๋ฑ๋กํ๋ค (HTTP ํ์
MCP ์๋ฒ๋ settings.json์ ์๋ ๊ธฐ์ฌํด๋ ์ธ์๋์ง ์๋๋ค).
claude mcp add memento http://localhost:57332/mcp \
--transport http \
--scope user \
--header "Authorization: Bearer YOUR_ACCESS_KEY"
๋ฑ๋ก์ ~/.claude.json์ ์ ์ฅ๋๋ค. ํ์ธ:
claude mcp list
# memento: http://localhost:57332/mcp (HTTP) - โ Connected
ํ๋ก์ ํธ ๋จ์๋ก ๊ณต์ ํ๋ ค๋ฉด ์ ์ฅ์ ๋ฃจํธ์ .mcp.json์ ๊ธฐ์ฌํ๋ค. ์์ธ ์ค์ ์ Claude Code Configuration ์ฐธ์กฐ.
์ง์ ํ๊ฒฝ
| ํ๊ฒฝ | ๊ถ์ฅ๋ | ์์ ๋ฌธ์ |
|---|---|---|
| Linux / macOS | ๊ถ์ฅ | Quick Start |
| Windows + WSL2 | ๊ฐ์ฅ ๊ถ์ฅ | Windows WSL2 Setup |
| Windows + PowerShell | ์ ํ ์ง์ | Windows PowerShell Setup |
ํธํ ํ๋ซํผ
Memento๋ MCP(Model Context Protocol) ํ์ค ์๋ฒ๋ค. Claude Code๋ฟ ์๋๋ผ, MCP๋ฅผ ์ง์ํ๋ ๋ชจ๋ AI ํ๋ซํผ์์ ์ฌ์ฉํ ์ ์๋ค.
| ํ๋ซํผ | ์ค์ ์์น | ์ฐ๊ฒฐ ๋ฐฉ์ |
|---|---|---|
| Claude Code | claude mcp add CLI (~/.claude.json) ๋๋ .mcp.json | Streamable HTTP |
| Claude Desktop | claude_desktop_config.json | Streamable HTTP |
| Claude.ai Web | Settings > Integrations | OAuth (RFC 7591) |
| Cursor | .cursor/mcp.json | Streamable HTTP |
| Windsurf | ~/.codeium/windsurf/mcp_config.json | Streamable HTTP |
| GitHub Copilot | VS Code MCP Marketplace | Streamable HTTP |
| Codex CLI | ~/.codex/config.toml | Streamable HTTP |
| ChatGPT Desktop | Developer Mode > Apps | OAuth (RFC 7591) |
| Continue | config.json | Streamable HTTP |
๊ณตํต ์ค์ : ์๋ฒ URL http://localhost:57332/mcp, Authorization ํค๋์ Bearer YOUR_ACCESS_KEY.
Claude.ai Web / ChatGPT ์ฐ๋์ OAuth๋ฅผ ์ฌ์ฉํ๋ค. ๋ฐ๊ธํ API ํค(mmcp_xxx)๋ฅผ client_id๋ก ์
๋ ฅํ๋ฉด Dynamic Client Registration(RFC 7591) ์์ด ๋ฐ๋ก ์ฐ๊ฒฐ๋๋ค. ์ ๋ขฐ ๋๋ฉ์ธ(claude.ai, chatgpt.com)์ redirect URI๋ ์๋ ์น์ธ๋๋ค.
ํ๋ซํผ๋ณ ์์ธ ์ค์ ์ ์ฐ๋ ๊ฐ์ด๋ ์ฐธ์กฐ.
7๊ฐ์ง ํํธ ์ ํ
| ์ ํ | ์ค๋ช | ์ฉ๋ |
|---|---|---|
fact | ์ฌ์ค | ์ค์ ๊ฐ, ๊ฒฝ๋ก, ๋ฒ์ ๋ฑ ๊ฐ๊ด์ ์ ๋ณด |
decision | ์์ฌ๊ฒฐ์ | ์ํคํ ์ฒ ์ ํ, ๊ธฐ์ ์คํ ๊ฒฐ์ ๊ณผ ๊ทผ๊ฑฐ |
error | ์๋ฌ | ๋ฐ์ํ ์๋ฌ์ ์์ธ, ํด๊ฒฐ ๋ฐฉ๋ฒ |
preference | ์ ํธ | ์ฌ์ฉ์ ์คํ์ผ, ์ฝ๋ฉ ๊ท์น, ์์ ๋ฐฉ์ |
procedure | ์ ์ฐจ | ๋ฐฐํฌ, ๋น๋, ํ ์คํธ ๋ฑ ๋ฐ๋ณต ๊ฐ๋ฅํ ๋จ๊ณ |
relation | ๊ด๊ณ | ์ํฐํฐ ๊ฐ ์ฐ๊ฒฐ, ์์กด์ฑ, ์์ ๊ด๊ณ |
episode | ์ํผ์๋ | ์ ํ๊ด๊ณ๋ฅผ ํฌํจํ๋ ์์ฌ ๊ธฐ์ต (1000์, ๋๋จธ์ง๋ 300์) |
ํต์ฌ ๊ธฐ๋ฅ
| ๊ธฐ๋ฅ | ์ค๋ช |
|---|---|
remember | ์ค์ํ ์ ๋ณด๋ฅผ ์์์ ํํธ์ผ๋ก ๋ถํดํ์ฌ ์ ์ฅ |
recall | ํค์๋ + ์๋งจํฑ 3๊ณ์ธต ๊ฒ์์ผ๋ก ํ์ํ ๊ธฐ์ต๋ง ๋ฐํ |
context | ์ธ์ ์์ ์ ํต์ฌ ๋งฅ๋ฝ์ ์๋ ๋ณต์ |
| ์๋ ์ ๋ฆฌ | ์ค๋ณต ๋ณํฉ, ๋ชจ์ ํ์ง, ์ค์๋ ๊ฐ์ , TTL ๊ธฐ๋ฐ ๋ง๊ฐ |
| ๋งํฌ ์ฌํตํฉ | tool_feedback ํผ๋๋ฐฑ์ด fragment_links์ weight/confidence์ ์ค์๊ฐ ๋ฐ์ (ReconsolidationEngine). ๋ชจ์ ๋งํฌ๋ ์๋ ๊ฒฉ๋ฆฌ(quarantine). |
| ํ์ฐ ํ์ฑํ | recall ์ contextText๋ฅผ ์ ๋ฌํ๋ฉด ๊ด๋ จ ํํธ์ activation_score๋ฅผ ์ ์ ์ ์ผ๋ก ๋ถ์คํธํ์ฌ ๋งฅ๋ฝ ์ฐ๊ด์ฑ ๋์ ๊ฒฐ๊ณผ ์ฐ์ ๋ฐํ (SpreadingActivation). |
| ์ํผ์๋ ์ฐ์์ฑ | reflect ํ ์์ฑ๋ episode ํํธ ๊ฐ preceded_by ์ฃ์ง๋ฅผ ์๋ ์์ฑํ์ฌ ๊ฒฝํ ํ๋ฆ์ ๊ทธ๋ํ๋ก ๋ณด์กด (EpisodeContinuityService). |
| ๊ด๋ฆฌ ์ฝ์ | ๊ธฐ์ต ํ์, ์ง์ ๊ทธ๋ํ, ํต๊ณ ๋์๋ณด๋, API ํค ๊ทธ๋ฃน/์ํ ํํฐ, daily-limit ์ธ๋ผ์ธ ํธ์ง |
| OAuth ์ฐ๋ | RFC 7591 Dynamic Client Registration, Claude.ai / ChatGPT Web ํตํฉ ์ง์ |
| Workspace ๊ฒฉ๋ฆฌ | ๊ฐ์ ํค ๋ด์์๋ ํ๋ก์ ํธยท์ง์ข
ยทํด๋ผ์ด์ธํธ ๋จ์๋ก ๊ธฐ์ต์ ๋ถ๋ฆฌ. api_keys.default_workspace๋ก ์๋ ํ๊น
, ๊ฒ์ ์ ์๋ ํํฐ. |
| ๋ฐฐ์น ์ฒ๋ฆฌ | batch_remember๋ multi-row ๋จ์ผ INSERT(256KB ๋๋ 500ํ chunk). reflect๋ summary/decisions/errors_resolved/new_procedures/open_questions 5์นดํ
๊ณ ๋ฆฌ๋ฅผ ๋จ์ผ ๋ฐฐ์น ํธ์ถ๋ก ์์. EmbeddingWorker๋ ํ ๋ฌถ์์ ํ ๋ฒ์ generateBatchEmbeddings + multi-row UPDATE๋ก ์ฒ๋ฆฌ. |
| Consistency Gate | fragments.morpheme_indexed ์ปฌ๋ผ์ผ๋ก ํํ์ ์ธ๋ฑ์ค ์๋ฃ ์ฌ๋ถ ์ถ์ . ๋ฏธ์๋ฃ ํํธ์ L3 ํํ์ ๊ฒ์ ๊ฒฝ๋ก์์ ์๋ ์ ์ธ. |
| Mode preset | recall-only / write-only / onboarding / audit JSON preset. X-Memento-Mode ํค๋ ๋๋ api_keys.default_mode๋ก ๋๊ตฌ ๋
ธ์ถ ๋ฒ์ ์ ํ. |
| Affective tagging | fragments.affect ์ปฌ๋ผ(neutral / frustration / confidence / surprise / doubt / satisfaction). remember / recall ์ ๊ฐ์ ๋ ์ด๋ธ๋ก ํํฐ๋ง. |
| ๋ก์ปฌ ์๋ฒ ๋ฉ | EMBEDDING_PROVIDER=transformers๋ก ์ธ๋ถ API ์์ด @huggingface/transformers ํ์ดํ๋ผ์ธ ๊ธฐ๋ฐ ์๋ฒ ๋ฉ(Xenova/multilingual-e5-small, 384d ๊ธฐ๋ณธ). |
์ ์ฒด MCP ๋๊ตฌ ๋ชฉ๋ก์ SKILL.md ์ฐธ์กฐ.
CLI
์๊ฒฉ MCP ์๋ฒ๋ฅผ ๋ก์ปฌ ๋
ธ๋ ์์ด ์ง์ ์กฐ์ํ ์ ์๋ค. --remote URL --key KEY ์ ์ญ ํ๋๊ทธ ๋๋ MEMENTO_CLI_REMOTE / MEMENTO_CLI_KEY ํ๊ฒฝ๋ณ์๋ก ์ง์ ํ๋ค.
# ์๊ฒฉ ์๋ฒ์์ recall (ํ๊ฒฝ๋ณ์ ๋ฐฉ์)
MEMENTO_CLI_REMOTE=https://example.com/mcp MEMENTO_CLI_KEY=mmcp_xxx memento-mcp recall "query"
# ์๊ฒฉ ์๋ฒ์์ recall (ํ๋๊ทธ ๋ฐฉ์)
memento-mcp recall "query" --remote https://example.com/mcp --key mmcp_xxx
# ํ ํ์ ์ถ๋ ฅ, ๊ฒฐ๊ณผ 5๊ฑด
memento-mcp recall "query" --format table --limit 5
# idempotency key๋ก ์ค๋ณต ์ ์ฅ ๋ฐฉ์ง
memento-mcp remember "๋ด์ฉ" --topic ํ๋ก์ ํธ๋ช
--idempotency-key k1
--format table|json|csv ์ถ๋ ฅ ํ์ ์ ํ, 11๊ฐ ์๋ธ๋ช
๋ น์ --help/-h ์ง์. ์์ธํ ํ๋๊ทธ๋ docs/cli.md.
API ์๋ต ๋ฉํ
recall / context ์๋ต์ _meta: { searchEventId, hints, suggestion } ํ๋๋ฅผ ํฌํจํ๋ค.
{
"fragments": [...],
"_meta": {
"searchEventId": "evt-abc123",
"hints": { "signal": "consider_context" },
"suggestion": { "code": "large_limit_no_budget", "message": "..." }
}
}
remember / link / forget / amend๋ dryRun: true ํ๋ผ๋ฏธํฐ๋ก ๋ถ์์ฉ ์์ด ์์ ๊ฒฐ๊ณผ๋ง ๋ฐํํ๋ค. ๋ชจ๋ ์๋ต์ X-RateLimit-Limit / X-RateLimit-Remaining / X-RateLimit-Resource ํค๋๊ฐ ํฌํจ๋๋ฉฐ master key ๋๋ limit=null ์ค์ ์ ํค๋๋ฅผ ์๋ตํ๋ค. recall์ fields ๋ฐฐ์ด๋ก ๋ฐํ ํ๋๋ฅผ 17๊ฐ ํ์ดํธ๋ฆฌ์คํธ ๋ฒ์๋ก ์ ํํ ์ ์๋ค. remember / batchRemember๋ idempotencyKey ํ๋ผ๋ฏธํฐ๋ก ๊ฐ์ key_id ๋ฒ์ ๋ด ์ค๋ณต ์ ์ฅ์ ๋ฐฉ์งํ๋ค(์ต๋ 128์).
๋ณด์
- RBAC default-deny:
TOOL_PERMISSIONS๋งต์ ์๋ ๋๊ตฌ๋ช ์ ๊ถํ๊ณผ ๋ฌด๊ดํ๊ฒ ์ฆ์ ๊ฑฐ๋ถ. - ํ
๋ํธ ๊ฒฉ๋ฆฌ: forget / amend / link / fragment_history๋ SQL ๋ ๋ฒจ
key_id์กฐ๊ฑด์ผ๋ก ํ ํ ๋ํธ ํํธ ์ ๊ทผ ๋ถ๊ฐ. "์์"๊ณผ "๊ถํ ์์"์ ๋์ผ ๋ฉ์์ง๋ก ์ฒ๋ฆฌํ์ฌ ์กด์ฌ ์ฌ๋ถ ๋ ธ์ถ ๋ฐฉ์ง. - injectSessionContext: ํด๋ผ์ด์ธํธ๊ฐ ์ ์กํ
_keyId/_permissions๋ฑ ๋ด๋ถ ํ๋๋ฅผ ์๋ฒ ์ธ์ฆ ๊ฒฐ๊ณผ๋ก ์ฌ์ฃผ์ ํ์ฌ ์ธ์ ์ปจํ ์คํธ ์์กฐ ์ฐจ๋จ. - Admin rate limit:
/auth,/keysPOST,/importPOST์ IP ๊ธฐ๋ฐ rate limit. - OpenAPI:
GET /openapi.json์๋ํฌ์ธํธ(ENABLE_OPENAPI=true). master key๋ ์ ์ฒด ๊ฒฝ๋ก, API key๋ permissions ํํฐ ์คํ ๋ฐํ.
Symbolic Verification Layer
์ ํ์ ์ค๋ช ๊ฐ๋ฅ์ฑ, advisory ๋งํฌ ๋ฌด๊ฒฐ์ฑ, ๊ทน์ฑ ์ถฉ๋ ํ์ง, ์ ์ฑ ๊ท์น soft gating. 9 core ๋ชจ๋ + 5 ๊ท์น ํ์ผ. ๋ชจ๋ ํ๋๊ทธ ๊ธฐ๋ณธ ๋นํ์ฑ.
Smart Recall
- ProactiveRecall:
remember()์ ํค์๋ ์ค๋ฒ๋ฉ ๊ธฐ๋ฐ ์ ์ฌ ํํธ ์๋ ๋งํฌ. - CaseRewardBackprop: case verification ์ด๋ฒคํธ ์ ์ฆ๊ฑฐ ํํธ importance ์๋ ์ญ์ ํ.
- SearchParamAdaptor: ์ฌ์ฉ ํจํด ๊ธฐ๋ฐ ๊ฒ์ ์๊ณ๊ฐ ์๋ ์ต์ ํ.
- CBR(Case-Based Reasoning):
recall(caseMode=true)๋ก ์ ์ฌ ์ฌ๋ก์ goal โ events โ outcome ํ๋ฆ์ ๊ฒ์ํ์ฌ ๊ณผ๊ฑฐ ํด๊ฒฐ ํจํด ์ฌํ์ฉ. - depth ํํฐ: Planner/Executor ์ญํ ๋ณ ๊ฒ์ ๊น์ด ์ ์ด(
"high-level"/"detail"/"tool-level"). - recall ์๋ต
key_id: ๋ฐํ ํํธ์ ์์ ํ ๋ํธ ์๋ณ์ ํฌํจ. - Reconsolidation:
tool_feedback๊ธฐ๋ฐfragment_linksweight/confidence ์ค์๊ฐ ๊ฐฑ์ (ENABLE_RECONSOLIDATION=true). - Spreading Activation:
recall(contextText=...)์ ๋ฌ ์ ๋ํ ๋งฅ๋ฝ ๊ธฐ๋ฐ ๊ด๋ จ ํํธ ema_activation ์ ์ ํ์ฑํ(ENABLE_SPREADING_ACTIVATION=true).
fragments.id๋ frag-{16์ hex} text ํ์์ด๋ค. UUID๊ฐ ์๋๋ฏ๋ก ์ธ๋ถ์์ ID๋ฅผ ์์ฑํ๊ฑฐ๋ ํ์ฑํ ๋ ์ฃผ์ํ๋ค.
/metrics ์๋ํฌ์ธํธ๊ฐ Prometheus ํธํ ํ์์ผ๋ก ๋ฉํธ๋ฆญ์ ๋
ธ์ถํ๋ค. ์์งยท์๊ฐํ๋ ์ฌ์ฉ์๊ฐ ์์ ๋กญ๊ฒ ๊ตฌ์ฑํ๋ค.
๊ธฐ์ต vs ๊ท์น
Memento๊ฐ ์ฃผ์ ํ๋ ๊ธฐ์ต ํํธ์ ์์คํ ํ๋กฌํํธ๋ณด๋ค ์ฐ์ ์์๊ฐ ๋ฎ๋ค. "PostgreSQL 15๋ฅผ ์ด๋ค"๊ฐ์ ์ฌ์ค ๊ธฐ์ต์ ์ ์๋ํ์ง๋ง, "ํ ์คํธ ์์ฑ ์ ๋ฐ๋์ Given-When-Then ํจํด์ ์ธ ๊ฒ"๊ฐ์ ํ๋ ๊ท์น์ ์์คํ ํ๋กฌํํธ์ ์ถฉ๋ํ๋ฉด ๋ฌด์๋ ์ ์๋ค.
ํ๋ ๊ท์น์ CLAUDE.md, AGENTS.md, ํ (hooks), ์คํฌ(skills) ๋ฑ ์ฐ์ ์์๊ฐ ๋์ ์ฑ๋์ ์ค์ ํ๋ ๊ฒ์ ๊ถ์ฅํ๋ค.
๋ฒค์น๋งํฌ
LongMemEval-S 500๋ฌธํญ ๊ธฐ์ค ์ฑ๋ฅ:
| ์งํ | ์ ์ | ๋น๊ต |
|---|---|---|
| ๊ฒ์ recall@5 | 88.3% | LongMemEval ๋ ผ๋ฌธ Stella 1.5B ๋๋น +8~18pp |
| QA ์ ๋ต๋ฅ | 45.4% | temporal metadata ์ ์ฉ (baseline 40.4%) |
| ํํธ ์ฒ๋ฆฌ๋ | 89,006๊ฐ / 27์ด | ์ธ์ ์ค์ฒ + ์๋ฒ ๋ฉ + ๊ฒ์ ์ ์ฒด ํ์ดํ๋ผ์ธ |
๊ฒ์์ 6๊ฐ ๋ฌธํญ ์ ํ ์ค 5๊ฐ์์ 80% ์ด์ recall์ ๋ฌ์ฑํ๋ค. ๋ค๋ง ๊ฒ์ recall(88.3%)๊ณผ QA ์ ๋ต๋ฅ (45.4%) ์ฌ์ด์ ํฐ gap์ด ์กด์ฌํ๋ค. ์ด๋ ๊ฒ์๋ ํํธ์์ ์ ๋ต์ ํฉ์ฑํ๋ reader ๋จ๊ณ์ ํ๊ณ๋ก, multi-session ์ถ๋ก ๊ณผ ์๊ฐ์ถ ์ถ๋ก ์์ ํนํ ๋๋๋ฌ์ง๋ค.
์์ธ ๋ถ์์ Benchmark Report ์ฐธ์กฐ.
์ฌ์ฉ ํจํด
Memento๋ ์ฌ์ค ๊ธฐ์ต(fact cache)์ ์ต์ ํ๋์ด ์๋ค. ์ ํ๊ด๊ณ๊ฐ ์ค์ํ ๊ฒฝ์ฐ:
episode์ ํ์ผ๋ก ์์ฌ๋ฅผ ์ ์ฅํ๋ฉด "์ ๊ทธ๋ฐ ๊ฒฐ์ ์ ํ๋์ง"๊น์ง ๋ณต์ ๊ฐ๋ฅcontextSummary๋ฅผ ํจ๊ป ์ ์ฅํ๋ฉด recall ์ ๋งฅ๋ฝ์ด ํจ๊ป ๋ฐํ๋จ- ๋ฉ์ธ ๋ฉ๋ชจ๋ฆฌ ์์คํ (MEMORY.md ๋ฑ)๊ณผ ๋ณํํ์ฌ ์ฌ์ค ๊ฒ์์ Memento, ๋งฅ๋ฝ ๋ณต์์ ๋ฉ์ธ ๋ฉ๋ชจ๋ฆฌ๋ก ์ญํ ๋ถ๋ดํ๋ ์ด์ํ ๊ตฌ์กฐ๋ ํจ๊ณผ์
๋๊ฐ ์ฐ๋ฉด ์ข์๊ฐ
- Claude Code / Cursor / Windsurf ๋ฑ AI ์์ด์ ํธ๋ฅผ ๋งค์ผ ์ฐ๋ ๊ฐ๋ฐ์
- ์ธ์ ๋ง๋ค ๊ฐ์ ์ค๋ช ์ ๋ฐ๋ณตํ๋ ๊ฒ ์ง์ฆ๋๋ ์ฌ๋
- AI์๊ฒ ๋ด ํ๋ก์ ํธ ๋งฅ๋ฝ์ ๊ธฐ์ต์ํค๊ณ ์ถ์ ์ฌ๋
๋ ์์๋ณด๊ธฐ
| ๋ฌธ์ | ๋ด์ฉ |
|---|---|
| Quick Start | ์์ธ ์ค์น ๊ฐ์ด๋ |
| Architecture | ์์คํ ๊ตฌ์กฐ, DB ์คํค๋ง, 3๊ณ์ธต ๊ฒ์, TTL |
| Configuration | ํ๊ฒฝ ๋ณ์, MEMORY_CONFIG, ์๋ฒ ๋ฉ Provider |
| API Reference | HTTP ์๋ํฌ์ธํธ, ํ๋กฌํํธ, ๋ฆฌ์์ค |
| CLI | ํฐ๋ฏธ๋ ๋ช ๋ น์ด 9๊ฐ |
| Internals | ํ๊ฐ๊ธฐ, ํตํฉ๊ธฐ, ๋ชจ์ ํ์ง |
| Benchmark | LongMemEval-S ๋ฒค์น๋งํฌ ์์ธ ๋ถ์ |
| SKILL.md | MCP ๋๊ตฌ ์ ์ฒด ๋ ํผ๋ฐ์ค |
| INSTALL.md | ๋ง์ด๊ทธ๋ ์ด์ , ํ ์ค์ , ์์ธ ์ค์น |
| CHANGELOG | ๋ฒ์ ๋ณ ๋ณ๊ฒฝ์ฌํญ |
์ด์
/health: DB, Redis, pgvector, ์์ปค ์ํ๋ฅผ ์ข ํฉ ์ ๊ฒ. ๋ถ๋ถ ์ฅ์ ์ degraded ์๋ต.- Rate Limiting: API ํค๋น 100/๋ถ, IP๋น 30/๋ถ. ํ๊ฒฝ๋ณ์๋ก ์กฐ์ ๊ฐ๋ฅ.
- ์์ปค ๋ณต๊ตฌ: ์๋ฒ ๋ฉ/ํ๊ฐ ์์ปค๊ฐ ์๋ฌ ์ ์ง์ ๋ฐฑ์คํ(1sโ60s)๋ก ์๋ ์ฌ์๋.
- Graceful Shutdown: SIGTERM ์ ์งํ ์ค ์์ปค ์๋ฃ ๋๊ธฐ(30์ด) ํ ์ธ์ auto-reflect ์คํ.
- OAuth ์๋ํฌ์ธํธ: ์ธ์ฆ ์คํจ ์
WWW-Authenticateํค๋๋ฅผ ๋ฐํํ์ฌ OAuth ํด๋ผ์ด์ธํธ๊ฐ ์๋์ผ๋ก ์ธ์ฆ ํ๋ฆ์ ์์ํ ์ ์๋ค. ์ธ์ TTL ๊ธฐ๋ณธ๊ฐ์ 240๋ถ์ด๋ค.
์๋ ค์ง ์ ํ์ฌํญ
- L1 Redis ์บ์๋ API ํค ๊ธฐ๋ฐ ๊ฒฉ๋ฆฌ๋ง ์ง์ํ๋ค. multi-agent ํ๊ฒฝ์์ ์์ด์ ํธ ๊ฐ ๊ฒฉ๋ฆฌ๋ L2/L3์์ ์ ์ฉ๋๋ค.
- ์๋ ํ์ง ํ๊ฐ๋ decision, preference, relation ์ ํ๋ง ๋์์ด๋ค. fact, procedure, error๋ ํ๊ฐ ํ์์ ์ ์ธ๋๋ค.
- MEMENTO_ACCESS_KEY๋ฅผ ์ค์ ํ์ง ์์ผ๋ฉด ์ธ์ฆ์ด ๋นํ์ฑํ๋๋ค. ์ธ๋ถ ๋ ธ์ถ ํ๊ฒฝ์์๋ ๋ฐ๋์ ์ค์ ํ ๊ฒ.
๊ธฐ์ ์คํ
- Node.js 20+
- PostgreSQL 14+ (pgvector ํ์ฅ)
- Redis 6+ (์ ํ)
- OpenAI Embedding API (์ ํ) ๋๋
EMBEDDING_PROVIDER=transformers(๋ก์ปฌ ์ ๋น์ฉ ๋ชจ๋) - Gemini CLI / Codex CLI / GitHub Copilot CLI (ํ์ง ํ๊ฐ, ํํ์ ๋ถ์, ์๋ reflect; ์ ํ, LLM_PRIMARY / LLM_FALLBACKS๋ก ์ฒด์ธ ๊ตฌ์ฑ)
- @huggingface/transformers + ONNX Runtime (NLI ๋ชจ์ ๋ถ๋ฅ + ๋ก์ปฌ ์๋ฒ ๋ฉ, CPU ์ ์ฉ)
- MCP Protocol 2025-11-25
PostgreSQL๋ง ์์ผ๋ฉด ํต์ฌ ๊ธฐ๋ฅ์ด ๋์ํ๋ค. Redis๋ฅผ ์ถ๊ฐํ๋ฉด L1 ์บ์ค์ผ์ด๋ ๊ฒ์๊ณผ SessionActivityTracker๊ฐ ํ์ฑํ๋๊ณ , OpenAI API ๋๋ EMBEDDING_PROVIDER=transformers๋ฅผ ์ถ๊ฐํ๋ฉด L3 ์๋งจํฑ ๊ฒ์๊ณผ ์๋ ๋งํฌ๊ฐ ํ์ฑํ๋๋ค.
๋ง๋ค๊ฒ ๋ ๊ณ๊ธฐ
์ ๊ธฐ/ํผ์น๊ธฐ
์ค๋ฌด์์ AI๋ฅผ ์ฐ๋ฉด์ ๋งค์ผ ๊ฐ์ ๋งฅ๋ฝ์ ๋ฐ๋ณต ์ค๋ช ํ๋ ๋นํจ์จ์ ๋๊ผ๋ค. ์์คํ ํ๋กฌํํธ์ ๋ฉ๋ชจ๋ฅผ ๋ฃ๋ ๋ฐฉ๋ฒ๋ ์จ๋ดค์ง๋ง ํ๊ณ๊ฐ ๋ช ํํ๋ค. ํํธ ์๊ฐ ๋์ด๋๋ฉด ๊ด๋ฆฌ๊ฐ ์ ๋๊ณ , ๊ฒ์์ด ์ ๋๊ณ , ์ค๋๋ ์ ๋ณด์ ์ ์ ๋ณด๊ฐ ์ถฉ๋ํ๋ค.
์ด๋ฏธ ์ค๋ช ํ ๊ฒ, ์ด๋ฏธ ์ธํ ํ ๊ฒ์ ๋ฌดํํ ๋ฐ๋ณตํ๊ฒ ๋ง๋๋ ๊ฒ์ด ๊ฐ์ฅ ํฐ ๋ฌธ์ ์๋ค. ์ธ์ฆ ์ ๋ณด๊ฐ ์๋ค๊ณ ํด์ ๋ณด๋ฉด ์๊ณ , ์ธํ ์ ๋ผ ์๋ค๊ณ ํด์ ํ์ผ์ ์ง์ ์ด์ด๋ณด๋ฉด ๋ค ๋ผ ์๋ค. ์ฒ ์ ํ๊ฒ ๋ ผํํด์ ๋ง ์ ๋ฃ๊ฒ ํด ๋ด์ผ ๊ทธ๋๋ฟ์ด๋ค. ์ธ์ ์ ๋ค์ ์์ํ๋ฉด ๊ฐ์ ์ผ์ด ๋ ๋ฐ๋ณต๋๋ค. ๋ช ๋ฌธ๋๋ฅผ ์์ ์กธ์ ํ์ง๋ง ๋งค์ผ ๋๊ฐ ๋ฆฌ์ ๋๋ ์ ์ ์ฌ์์ ๊ต์ก๋ด๋น์๊ฐ ๋ ๊ธฐ๋ถ์ด์๋ค.
"์ผ ๋ ๋ฏธ์ ์ด ๊ธฐ์ต๋๋" -- ๋จ์ ์์ด๋ ์๋ฌด๊ฒ๋ ๋ ์ค๋ฅด์ง ์์ง๋ง, "์ด๋ฑํ๊ต 1ํ๋ ๋ ์ง๊ถ" ํ๋ง๋๋ฉด ์ง์ฐ๊ฐ ๋น๋ ค์คฌ๋ ์ผ๊น์ง ์ค์ค์ด ๋ ์ค๋ฅธ๋ค. AI๋ ๋ง์ฐฌ๊ฐ์ง๋ค. ์ด์ ํด๊ฒฐํ ๋ฒ๊ทธ, ์ง๋์ฃผ ๋ด๋ฆฐ ๊ฒฐ์ , ์ ํธํ๋ ์ฝ๋ฉ ์คํ์ผ. ๋งค ์ธ์ ๋ฆฌ์ ๋์ , Memento๊ฐ ๊ธฐ์ตํด๋๋ค.
์ด ๊ณ ์ถฉ์ ํด์ํ๊ธฐ ์ํด ๊ธฐ์ต์ ์์ ๋จ์๋ก ๋ถํดํ๊ณ , ๊ณ์ธต์ ์ผ๋ก ๊ฒ์ํ๊ณ , ์๊ฐ์ ๋ฐ๋ผ ์์ฐ์ค๋ฝ๊ฒ ๋ง๊ฐํ๋ ์์คํ ์ ์ค๊ณํ๋ค. ์ธ๊ฐ์ด ๋ง๊ฐ์ ๋๋ฌผ์ธ ๊ฒ์ฒ๋ผ, ์ด ์์คํ ์ "์ ์ ํ ๋ง๊ฐ"์ ํฌํจํ ๊ธฐ์ต์ ์งํฅํ๋ค.
๊ทธ๋ฆฌ๊ณ ๊ฑฐ๊ธฐ์ ๋ฉ์ถ์ง ์๋๋ค. ํผ๋๋ฐฑ์ด ๋์ ๋ ์๋ก ์ฐ๊ฒฐ์ด ๊ฐํด์ง๊ณ ์ฝํ ๋งํฌ๋ ์ฌ๋ผ์ง๋ค. ๊ฐ์ ๊ฒฝํ์ด ๋ฐ๋ณต๋ ์๋ก ํจํด์ด ์ถ์ํ๋๋ค. ์ธ์ ๊ฐ ์ํผ์๋๊ฐ ์ด์ด์ง์๋ก ๋งฅ๋ฝ์ด ์ด์ผ๊ธฐ๊ฐ ๋๋ค. ๋์๊ด์ ์ง๋ ๊ฒ ์๋๋ค. ๊ฒฝํ์ผ๋ก ์ฑ์ฅํ๋ AI๋ฅผ ๋ง๋ค๊ณ ์ถ์๋ค.
๊ธฐ์ต์ ์ง๋ฅ์ ์ ์ ๊ฐ ์๋๋ค. ๊ธฐ์ต์ ์ง๋ฅ์ ์กฐ๊ฑด์ด๋ค. ์ฒด์ค๋ฅผ ๋๋ ๋ฐฉ๋ฒ์ ์์๋, ์ด์ ์ง ๊ฒ์์ ๊ธฐ์ตํ์ง ๋ชปํ๋ฉด ๊ฐ์ ์๋ฅผ ๋ ๋๋ค. ๋ชจ๋ ์ธ์ด๋ฅผ ๊ตฌ์ฌํด๋, ์ด์ ๋๋ ๋ํ๋ฅผ ๊ธฐ์ตํ์ง ๋ชปํ๋ฉด ๋งค๋ฒ ์ฒ์ ๋ง๋๋ ์ฌ๋์ด ๋๋ค. ์์ญ์ต ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ก ์ธ์ ๋ชจ๋ ์ง์์ ๋ด์๋, ๋น์ ๊ณผ ํจ๊ปํ ์ด์ ๋ฅผ ๊ธฐ์ตํ์ง ๋ชปํ๋ฉด ๋ฏ์ ๋ฐ์๊ฐ์ผ ๋ฟ์ด๋ค.
๊ธฐ์ต์ด ์์ด์ผ ๊ด๊ณ๊ฐ ์๋ค. ๊ด๊ณ๊ฐ ์์ด์ผ ์ ๋ขฐ๊ฐ ์๋ค.
๊ธฐ์ต์ ์ฌ๋ผ์ง์ง ์๋๋ค. ๋ค๋ง cold tier๋ก ๋ด๋ ค๊ฐ ๋ฟ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ์ถฉ๋ถํ ์ค๋ ๋ฐฉ์น๋ cold ํํธ์ ๋ค์ consolidate ์ฌ์ดํด์์ ์๋ฉธํ๋ค. ์ด๊ฒ์ ์ค๊ณ์ด์ง ๋ฒ๊ทธ๊ฐ ์๋๋ค. ์ธ๋ชจ์์ด์ง ๊ธฐ์ต์ ์๋ฆฌ๋ฅผ ๋น์์ผ ํ๋ค. ์์ฐ๊ตฌ์คํฐ๋์ค์ ๊ถ์ ์๋ ์ฐฝ๊ณ ์ ๋ฆฌ๋ ํ์ํ๋ค.
๋ฉ์ฒญํ ๊ฑธ๋ก ์ ๋ช ํ ๊ธ๋ถ์ด์๊ธฐ๋ ๋ช ๋ฌ์ ๊ธฐ์ตํ๋ค.
์ด์ ๋น์ ์ AI๋ ๊ทธ๋ ๋ค.
License
Apache 2.0
Made by Jinho Choi ย |ย Buy me a coffee
Server Terkait
Mercury MCP
Mercury MCP lets you ask questions about your banking balances, transactions, cards/recipients, and more
LinkedIn Prospection MCP
LinkedIn prospection automation - find leads, score (fit+intent+urgency), qualify, personalize messages, run full pipeline, manage sales funnel. 7 MCP tools.
Uniswap MCP Server
MCP server for Uniswap โ swap routing, pool data, and liquidity queries across all supported chains.
Strider Amazon
MCP server for Amazon shopping - AI agents can search products, check prices, add to cart, and manage shopping lists.
TI Mindmap HUB โ MCP Server
TI Mindmap HUB MCP Server provides AI assistants with direct access to curated threat intelligence โ reports, CVEs, IOCs, STIX bundles, and weekly briefings โ through the Model Context Protocol.
SubwayInfo NYC
NYC subway status and schedules
Manifold Markets
Interact with Manifold Markets prediction markets, including market creation, trading, and liquidity management.
Sherlock Domains
A server to buy and manage domains with Sherlock.
Matthew Hartley Music MCP
The first artist-owned MCP server for AI Agent use. Discover, narrate, and stream Matthew Hartley's debut album The Time Is Now: A Journey in Chapters from any AI client. Powered by Harmonic Wave.
Brick Directory
MCP that knows everything about LEGO sets, parts, minifigures, and pricing. Help you manage your collections across popular sites such as Rebrickable and BrickEconomy