NOUZ MCP Server
Local-first MCP server that turns Obsidian and Markdown knowledge bases into an agent-readable graph
NOUZ — Семантический MCP-сервер для вашей базы знаний
Структура появляется из содержания.
Работает с Obsidian, Logseq и любыми директориями Markdown-файлов.
Зачем нужен Nouz
NOUZ выступает прослойкой между вашей базой заметок и AI-агентом. Он помогает превратить разрозненные Markdown-файлы в граф, с которым можно работать через MCP:
-
Автоматическая классификация (Семантика) Вы задаете "Ядра" — базовые домены вашей базы (например: Systems Analysis, Data & Science, Engineering). Когда вы добавляете новую заметку, NOUZ читает ее текст, сравнивает векторы и предлагает доменный знак или комбинацию доменов.
-
Поиск связей между заметками Сервер строит направленный граф (DAG) и предлагает связи, которые можно проверить перед записью:
- Семантические мосты: две заметки из разных доменов указывают на одну и ту же идею.
- Явные
tag-связи можно хранить вручную вparents_meta;suggest_metadataтакже предлагает read-onlytag_bridgesпо пересечению явных канонических YAML-тегов.
-
Отслеживание эволюции базы (Дрифт) NOUZ агрегирует данные снизу вверх. Если модуль начинался как один домен, а новые заметки постепенно уводят его в другой, сервер покажет расхождение (
core_drift).
В зависимости от ваших задач NOUZ работает в трех режимах: от простого графа (LUCA) до строгой 5-уровневой иерархии (SLOI).
Как это работает
- Вы описываете домены в
config.yaml— какую область покрывает каждый домен и по каким признакам текста его узнавать. - Сервер превращает описания в векторы-эталоны (локально, через LM Studio или Ollama).
- Каждая новая заметка проецируется на эти оси. Знак определяется содержанием, или вами.
- L4 получает доменный профиль из классификации текста, а L3/L2 собирают
core_mixиз дочерних узлов. Еслиsignмодуля расходится сcore_mix, сервер сообщает оcore_drift.
Семантические мосты находят связи между заметками из разных доменов, когда тексты близки по смыслу. Теги остаются явной пользовательской разметкой.
Быстрый старт
pip install nouz-mcp
OBSIDIAN_ROOT=/path/to/vault nouz-mcp
Без config.yaml сервер стартует в режиме LUCA — граф без семантики, работает сразу.
Чтобы включить семантический режим, создайте локальный конфиг из шаблона:
cp config.template.yaml config.yaml
В Windows PowerShell:
Copy-Item config.template.yaml config.yaml
Или из исходников:
git clone https://github.com/Semiotronika/NOUZ-MCP
cd NOUZ-MCP
pip install -r requirements.txt
cp config.template.yaml config.yaml
OBSIDIAN_ROOT=./vault python server.py
Подключение к Claude Desktop, Cursor, Opencode или любому MCP-клиенту:
{
"mcpServers": {
"nouz": {
"command": "nouz-mcp",
"env": {
"OBSIDIAN_ROOT": "/path/to/vault",
"NOUZ_CONFIG": "/absolute/path/to/config.yaml",
"EMBED_API_URL": "http://127.0.0.1:1234/v1"
}
}
}
}
Инструменты MCP
| Инструмент | Зачем |
|---|---|
suggest_metadata | Знак, уровень, мосты, drift-предупреждения |
write_file | Записать заметку с YAML-разметкой |
update_metadata | Обновить только YAML, не меняя текст заметки |
read_file | Прочитать заметку + метаданные |
calibrate_cores | Обновить векторы-эталоны ядер |
recalc_signs | Пересчитать знаки всех заметок |
recalc_core_mix | Пересчитать агрегацию снизу вверх |
index_all | Переиндексировать всю базу; с with_embeddings=true также обновляет file/chunk embeddings |
embed | Получить вектор для текста |
chunk_text | Разрезать Markdown-текст на стабильные retrieval-чанки |
chunk_file | Разрезать тело одной заметки на стабильные retrieval-чанки |
search_chunks | Искать по сохранённым chunk embeddings |
list_files | Список с фильтрами по уровню, знаку |
get_children | Пройти вниз по графу |
get_parents | Пройти вверх по графу |
suggest_parents | Найти родителей для сироты |
add_entity | Создать сущность в один шаг (авто sign/parents, теги только явно) |
process_orphans | Автозаполнение файлов без разметки |
Установите NOUZ_READ_ONLY=true, чтобы скрыть и заблокировать инструменты,
которые меняют базу (write_file, update_metadata, index_all, пересчёты,
обработку сирот и создание сущностей). Read-only инструменты вроде read_file,
suggest_metadata, embed, chunk_text, chunk_file и search_chunks останутся
доступны. В режиме NOUZ_READ_ONLY=true read-only инструменты по умолчанию не
обновляют SQLite-кэш, а startup пропускает DB init/index/calibration; если это
нужно, включите NOUZ_CACHE_WRITE=true.
chunk_text и chunk_file возвращают chunker_version, стабильный id,
координаты фактического текста чанка (start_char/end_char), координаты тела
без overlap (body_start_char/body_end_char) и hash-поля. index_all с
with_embeddings=true сохраняет эти чанки в SQLite-таблицу chunk_embeddings,
а search_chunks ранжирует их по cosine similarity к запросу.
parents_meta.link_type поддерживает ручные связи hierarchy, semantic,
temporary, tag, analogy и error. NOUZ не генерирует аналогии
автоматически. tag_bridges в suggest_metadata являются предложениями по
явным YAML-тегам и сами не записываются в файл.
YAML-теги считаются явной метаданной: NOUZ нормализует их к каноническому
slug-виду (agent-context, опционально area/topic) и отбрасывает очевидные
не-теги: hex-цвета, URL, числовые токены, пустые значения и none/null.
suggest_metadata возвращает tag_quality, чтобы агент видел, какие теги
приняты для будущих tag_bridges, а какие значения были отброшены.
Для автоматизации тегов suggest_metadata также возвращает read-only
tag_candidates: кандидаты из уже принятого YAML-словаря тегов в индексе и
явных inline #tag в тексте. Кандидаты не записываются в YAML автоматически;
если их принять через update_metadata, обычные tag_bridges начнут работать
по этим тегам. До записи возможные связи возвращаются отдельно как
candidate_tag_bridges. Для каждого кандидата NOUZ временно режет текущий
текст на чанки и возвращает evidence с chunk_id, заголовком, координатами и
коротким фрагментом. Это не требует заранее заполненной таблицы
chunk_embeddings.
Конфигурация
Минимальный config.yaml:
mode: prizma
etalons:
- sign: S
name: Systems Analysis
text: >
Methodology for analysing complex objects: feedback loops,
emergent properties, self-regulation, bifurcation points.
Cybernetics, synergetics, dissipative structures, catastrophe
theory, autopoiesis — tools for understanding how the whole
exceeds the sum of its parts. Not data and not code — a way
of thinking about how parts form a whole and why systems
behave non-linearly.
- sign: D
name: Data & Science
text: >
Physics and cosmology: from subatomic particles to the large-scale
structure of the Universe. Lagrangians, curvature tensors, scattering
cross-sections, quarks, bosons, fermions, plasma, vacuum fluctuations,
cosmic microwave background, cosmological constant, decoherence.
Pure science about the nature of matter, energy and spacetime.
- sign: E
name: Engineering
text: >
Software engineering, machine learning and infrastructure: writing
and debugging code, deployment, containerisation, neural networks,
inference, tokenisation, data serialisation, microservices, CI/CD,
automated testing, refactoring, Git, Docker, Kubernetes, APIs.
The practical discipline of building computational systems from
architecture to production.
thresholds:
sign_spread: 0.05
confident_spread: 60.0
pattern_second_sign_threshold: 30.0
semantic_bridge_threshold: 0.55
parent_link_threshold: 0.55
artifact_signs:
- sign: n
name: Note
text: Short note, observation, fragment.
- sign: c
name: Concept
text: Definition, concept, entity description.
- sign: r
name: Reference
text: External source, documentation, link, citation.
- sign: l
name: Log
text: Session log, chronology, dialogue record.
- sign: u
name: Update
text: Update, release note, changelog entry.
- sign: h
name: Hypothesis
text: Hypothesis, assumption, speculative idea.
- sign: s
name: Specification
text: Technical specification, instruction, requirements.
После настройки запустите calibrate_cores — сервер создаст эталонные векторы.
Проверьте попарные косинусы: mean-centered между разными доменами должен быть
заметно ниже сырого. Если все пары примерно одинаковые — усильте различия в текстах.
Отдельную проверку эталонов можно запустить из установленного пакета:
nouz-calc-etalons --config config.yaml.
etalons — это смысловые домены, которые сравниваются через эмбеддинги.
artifact_signs — тип материала для артефактов L5: заметка, концепт, ссылка, лог, обновление, гипотеза или спецификация. Это эвристическая метка, а не отдельный эталон для эмбеддингов. В публичной схеме домены обычно обозначаются заглавными буквами (S/D/E), а типы материала — строчными (n/c/r/l/u/h/s); их можно заменить в конфиге, если знаки короткие и не конфликтуют с доменами. При необходимости для любого типа можно добавить keywords: тогда сервер будет использовать ваши слова для эвристики вместо встроенного RU/EN набора.
Реальный пример расчёта
Вот фактические результаты для эталонов S/D/E с моделью text-embedding-granite-embedding-278m-multilingual:
=== Pairwise Cosine (raw) ===
S↔D: 0.5894 S↔E: 0.5862 D↔E: 0.6022
=== Pairwise Cosine (mean-centered) ===
S↔D: -0.5059 S↔E: -0.5117 D↔E: -0.4822
Отрицательные mean-centered значения здесь хороший результат: после вычитания среднего вектора домены хорошо расходятся. Самоклассификация: S→99.4%, D→97.5%, E→96.9%.
| Переменная | По умолчанию | Описание |
|---|---|---|
OBSIDIAN_ROOT | ./obsidian | Путь к хранилищу |
NOUZ_CONFIG | (пусто) | Абсолютный путь к config.yaml; если не задан, сервер ищет конфиг в текущей директории |
NOUZ_DATABASE_NAME | obsidian_kb.db | Имя файла SQLite-кэша внутри OBSIDIAN_ROOT; удобно для изолированных проверок, например obsidian_kb.public.db |
NOUZ_DATABASE_PATH | (пусто) | Полный путь к SQLite-кэшу; имеет приоритет над NOUZ_DATABASE_NAME |
EMBED_PROVIDER | openai | openai, lmstudio, ollama |
EMBED_API_URL | http://127.0.0.1:1234/v1 | Эндпоинт для эмбеддингов |
EMBED_API_KEY | (пусто) | API-ключ, если нужен |
EMBED_MODEL | (пусто) | Имя модели |
Приватность
| Компонент | Локально? |
|---|---|
| Эмбеддинги (LM Studio / Ollama) | ✅ Да |
| Ваши заметки | ✅ Да |
| Сервер NOUZ | ✅ Да |
| Контекст AI-агента (Claude, ChatGPT) | ❌ Уходит в облако |
Всё критичное остаётся на вашей машине.
Разработка
git clone https://github.com/Semiotronika/NOUZ-MCP
cd NOUZ-MCP
pip install -e .
python -m compileall -q nouz_mcp pytest_smoke.py scripts
python -m pytest -q
python test_server.py
Ссылки
- 🌐 semiotronika.ru
- 📦 PyPI
- 🗂️ Glama Registry
- 🐙 GitHub
MIT License © 2026 Semiotronika
Косинусы считаются. Синтаксис меняется. Семантика остаётся.
Related Servers
kintone
An MCP server for accessing and managing data on the kintone low-code platform.
MySQL Database Access
Provides read-only access to MySQL databases.
Bankless Onchain
Interact with blockchain data using the Bankless API.
Space Frontiers
Interfaces with the Space Frontiers API, enabling language models to interact with its data sources.
AWS RDS Management
Manage Amazon RDS and Aurora database clusters, including instances, backups, parameters, costs, and monitoring.
Elasticsearch/OpenSearch
An MCP Server for interacting with Elasticsearch and OpenSearch clusters.
Postgres MCP
A remote MCP server for Postgres, deployable on Cloudflare Workers without authentication.
PostgreSQL
Provides read-only access to PostgreSQL databases, enabling schema inspection and query execution.
emem.dev
real world, traceable spatial memory for fact verification about the world.
Neo4j Knowledge Graph Memory
A knowledge graph memory server using the Neo4j graph database to store and retrieve information from AI interactions.