Files

P0luz d2d4b89715 fix(search): keep resolved buckets reachable by keyword

Apply ×0.3 resolved penalty *after* fuzzy_threshold filter so
resolved buckets that genuinely match the query still surface
in search results (penalty only affects ranking order).
Update BEHAVIOR_SPEC.md scoring section to document new order.

2026-04-21 18:46:04 +08:00

33 KiB

Raw Blame History

Ombre Brain 用户全流程行为规格书

版本：基于 server.py / bucket_manager.py / decay_engine.py / dehydrator.py / embedding_engine.py / CLAUDE_PROMPT.md / config.example.yaml

一、系统角色说明

1.1 参与方总览

角色	实体	职责边界
用户	人类	发起对话，提供原始内容；可直接访问 Dashboard Web UI
Claude（模型端）	LLM（如 Claude 3.x）	理解语义、决策何时调用工具、用自然语言回应用户；不直接操作文件
OB 服务端	`server.py` + 各模块	接收 MCP 工具调用，执行持久化、搜索、衰减；对 Claude 不透明

1.2 Claude 端职责边界

必须做：每次新对话第一步无参调用 breath()；对话内容有记忆价值时主动调用 hold / grow
不做：不直接读写 .md 文件；不执行衰减计算；不操作 SQLite
决策权：Claude 决定是否存、存哪些、何时 resolve；OB 决定如何存（合并/新建）

1.3 OB 服务端内部模块职责

模块	核心职责
`server.py`	注册 MCP 工具（`breath/hold/grow/trace/pulse/dream`）；路由 Dashboard HTTP 请求；`_merge_or_create()` 合并逻辑中枢
`bucket_manager.py`	桶 CRUD；多维搜索（fuzzy + embedding 双通道）；`touch()` 激活刷新；`_time_ripple()` 时间波纹
`dehydrator.py`	`analyze()` 自动打标；`merge()` 内容融合；`digest()` 日记拆分；`dehydrate()` 内容压缩
`embedding_engine.py`	`generate_and_store()` 生成向量并存 SQLite；`search_similar()` 余弦相似度检索
`decay_engine.py`	`calculate_score()` 衰减分计算；`run_decay_cycle()` 周期扫描归档；后台定时循环
`utils.py`	配置加载；路径安全校验；ID 生成；token 估算

二、场景全流程

场景 1：新对话开始（冷启动，无历史记忆）

用户操作：打开新对话窗口，说第一句话

Claude 行为：在任何回复之前，先调用 breath()（无参）

OB 工具调用：

breath(query="", max_tokens=10000, domain="", valence=-1, arousal=-1, max_results=20, importance_min=-1)

系统内部发生什么：

decay_engine.ensure_started() — 懒加载启动后台衰减循环（若未运行）
进入"浮现模式"（not query or not query.strip()）
bucket_mgr.list_all(include_archive=False) — 遍历 permanent/ + dynamic/ + feel/ 目录，加载所有 .md 文件的 frontmatter + 正文
筛选钉选桶（pinned=True 或 protected=True）
筛选未解决桶（resolved=False，排除 permanent/feel/pinned）
冷启动检测：找 activation_count==0 && importance>=8 的桶，最多取 2 个插入排序最前（决策：create() 初始化应为 0，区分"创建"与"被主动召回"，见 B-04）
按 decay_engine.calculate_score(metadata) 降序排列剩余未解决桶
对 top-20 以外随机洗牌（top-1 固定，2~20 随机）
截断到 max_results 条
对每个桶调用 dehydrator.dehydrate(strip_wikilinks(content), clean_meta) 压缩摘要
按 max_tokens 预算截断输出

返回结果：

无记忆时："权重池平静，没有需要处理的记忆。"
有记忆时："=== 核心准则 ===\n📌 ...\n\n=== 浮现记忆 ===\n[权重:X.XX] [bucket_id:xxx] ..."

注意：浮现模式不调用 touch()，不重置衰减计时器

场景 2：新对话开始（有历史记忆，breath 自动浮现）

（与场景 1 相同流程，区别在于桶文件已存在）

Claude 行为（完整对话启动序列，来自 CLAUDE_PROMPT.md）：

1. breath()               — 浮现未解决记忆
2. dream()                — 消化最近记忆，有沉淀写 feel
3. breath(domain="feel")  — 读取之前的 feel
4. 开始和用户说话

breath(domain="feel") 内部流程：

检测到 domain.strip().lower() == "feel" → 进入 feel 专用通道
bucket_mgr.list_all() 过滤 type=="feel" 的桶
按 created 降序排列
按 max_tokens 截断，不压缩（直接展示原文）
返回："=== 你留下的 feel ===\n[时间] [bucket_id:xxx]\n内容..."

场景 3：用户说了一件事，Claude 决定存入记忆（hold）

用户操作：例如"我刚刚拿到了实习 offer，有点激动"

Claude 行为：判断值得记忆，调用：

hold(content="用户拿到实习 offer，情绪激动", importance=7)

OB 工具调用：hold(content, tags="", importance=7, pinned=False, feel=False, source_bucket="", valence=-1, arousal=-1)

系统内部发生什么：

decay_engine.ensure_started()
输入校验：content.strip() 非空
importance = max(1, min(10, 7)) = 7
extra_tags = []（未传 tags）
自动打标：dehydrator.analyze(content) → 调用 _api_analyze() → LLM 返回 JSON
- 返回示例：{"domain": ["成长", "求职"], "valence": 0.8, "arousal": 0.7, "tags": ["实习", "offer", "激动", ...], "suggested_name": "实习offer获得"}
- 失败时降级：{"domain": ["未分类"], "valence": 0.5, "arousal": 0.3, "tags": [], "suggested_name": ""}
合并 auto_tags + extra_tags 去重
合并检测：_merge_or_create(content, tags, importance=7, domain, valence, arousal, name)
- bucket_mgr.search(content, limit=1, domain_filter=domain) — 搜索最相似的桶
- 若最高分 > config["merge_threshold"]（默认 75）且该桶非 pinned/protected：
  - dehydrator.merge(old_content, new_content) → _api_merge() → LLM 融合
  - bucket_mgr.update(bucket_id, content=merged, tags=union, importance=max, domain=union, valence=avg, arousal=avg)
  - embedding_engine.generate_and_store(bucket_id, merged_content) 更新向量
  - 返回 (bucket_name, True)
- 否则：
  - bucket_mgr.create(content, tags, importance=7, domain, valence, arousal, name) → 写 .md 文件到 dynamic/<主题域>/ 目录
  - embedding_engine.generate_and_store(bucket_id, content) 生成并存储向量
  - 返回 (bucket_id, False)

返回结果：

新建："新建→实习offer获得成长,求职"
合并："合并→求职经历成长,求职"

bucket_mgr.create() 详情：

generate_bucket_id() → uuid4().hex[:12]
sanitize_name(name) → 正则清洗，最长 80 字符
写 YAML frontmatter + 正文到 safe_path(domain_dir, f"{name}_{id}.md")
frontmatter 字段：id, name, tags, domain, valence, arousal, importance, type, created, last_active, activation_count=0（决策：初始为 0，touch() 首次被召回后变为 1）

场景 4：用户说了一段长日记，Claude 整理存入（grow）

用户操作：发送一大段混合内容，如"今天去医院体检，结果还好；晚上和朋友吃饭聊了很多；最近有点焦虑..."

Claude 行为：

grow(content="今天去医院体检，结果还好；晚上和朋友吃饭聊了很多；最近有点焦虑...")

系统内部发生什么：

decay_engine.ensure_started()
内容长度检查：len(content.strip()) < 30 → 若短于 30 字符走快速路径（dehydrator.analyze() + _merge_or_create()，跳过 digest）
日记拆分（正常路径）：dehydrator.digest(content) → _api_digest() → LLM 调用 DIGEST_PROMPT
- LLM 返回 JSON 数组，每项含：name, content, domain, valence, arousal, tags, importance
- _parse_digest() 安全解析，校验 valence/arousal 范围
对每个 item 调用 _merge_or_create(item["content"], item["tags"], item["importance"], item["domain"], item["valence"], item["arousal"], item["name"])
- 每项独立走合并或新建逻辑（同场景 3）
- 单条失败不影响其他条（try/except 隔离）

返回结果：

3条|新2合1
📝体检结果
📌朋友聚餐
📎近期焦虑情绪

场景 5：用户想找某段记忆（breath 带 query 检索）

用户操作：例如"还记得我之前说过关于实习的事吗"

Claude 行为：

breath(query="实习", domain="成长", valence=0.7, arousal=0.5)

系统内部发生什么：

decay_engine.ensure_started()
检测到 query 非空，进入检索模式
解析 domain_filter = ["成长"]，q_valence=0.7，q_arousal=0.5
关键词检索：bucket_mgr.search(query, limit=20, domain_filter, q_valence, q_arousal)
- Layer 1：domain 预筛 → 仅保留 domain 包含"成长"的桶；若为空则回退全量
- Layer 1.5（embedding 已开启时）：embedding_engine.search_similar(query, top_k=50) → 用 embedding 候选集替换/缩小精排范围
- Layer 2：多维加权精排：
  - _calc_topic_score(): fuzz.partial_ratio(query, name)×3 + domain×2.5 + tags×2 + body×1，归一化 0~1
  - _calc_emotion_score(): 1 - √((v差²+a差²)/2)，0~1
  - _calc_time_score(): e^(-0.02×days_since_last_active)，0~1
  - importance_score: importance / 10
  - total = topic×4 + emotion×2 + time×1.5 + importance×1，归一化到 0~100
  - 过滤 score >= fuzzy_threshold（默认 50）
  - 通过阈值后，resolved 桶仅在排序时降权 ×0.3（不影响是否被检出）
  - 返回最多 limit 条
排除 pinned/protected 桶（它们在浮现模式展示）
向量补充通道（server.py 额外层）：embedding_engine.search_similar(query, top_k=20) → 相似度 > 0.5 的桶补充到结果集（标记 vector_match=True）
对每个结果：
- 记忆重构：若传了 q_valence，展示层 valence 做微调：shift = (q_valence - 0.5) × 0.2，最大 ±0.1
- dehydrator.dehydrate(strip_wikilinks(content), clean_meta) 压缩摘要
- bucket_mgr.touch(bucket_id) — 刷新 last_active + activation_count += 1 + 触发 _time_ripple()（对 48h 内创建的邻近桶 activation_count + 0.3，最多 5 个桶）
随机漂流：若检索结果 < 3 且 random.random() < 0.4，随机从 decay_score < 2.0 的旧桶里取 1~3 条，标注 [surface_type: random]

返回结果：

[bucket_id:abc123] [重要度:7] [主题:成长] 实习offer获得：...
[语义关联] [bucket_id:def456] 求职经历...
--- 忽然想起来 ---
[surface_type: random] 某段旧记忆...

场景 6：用户想查看所有记忆状态（pulse）

用户操作："帮我看看你现在都记得什么"

Claude 行为：

pulse(include_archive=False)

系统内部发生什么：

bucket_mgr.get_stats() — 遍历三个目录，统计文件数量和 KB 大小
bucket_mgr.list_all(include_archive=False) — 加载全部桶
对每个桶：decay_engine.calculate_score(metadata) 计算当前权重分
按类型/状态分配图标：📌钉选 / 📦permanent / 🫧feel / 🗄️archived / ✅resolved / 💭普通
拼接每桶摘要行：名称 bucket_id 主题情感坐标重要度权重标签

返回结果：

=== Ombre Brain 记忆系统 ===
固化记忆桶: 2 个
动态记忆桶: 15 个
归档记忆桶: 3 个
总存储大小: 48.3 KB
衰减引擎: 运行中

=== 记忆列表 ===
📌 [核心原则] bucket_id:abc123 主题:内心 情感:V0.8/A0.5 ...
💭 [实习offer获得] bucket_id:def456 主题:成长 情感:V0.8/A0.7 ...

场景 7：用户想修改/标记已解决/删除某条记忆（trace）

7a 标记已解决

Claude 行为：

trace(bucket_id="abc123", resolved=1)

系统内部：

resolved in (0, 1) → updates["resolved"] = True
bucket_mgr.update("abc123", resolved=True) → 读取 .md 文件，更新 frontmatter 中 resolved=True，写回，桶留在原 dynamic/ 目录，不移动
后续 breath() 浮现时：该桶 decay_engine.calculate_score() 乘以 resolved_factor=0.05（若同时 digested=True 则 ×0.02），自然降权，最终由 decay 引擎在得分 < threshold 时归档
bucket_mgr.search() 中该桶得分乘以 0.3 降权，但仍可被关键词激活

⚠️ 代码 Bug B-01：当前实现中 update(resolved=True) 会将桶立即移入 archive/，导致桶完全消失于所有搜索路径，与上述规格不符。需移除 bucket_manager.py update() 中 resolved → _move_bucket(archive_dir) 的自动归档逻辑。

返回："已修改记忆桶 abc123: resolved=True → 已沉底，只在关键词触发时重新浮现"

7b 修改元数据

trace(bucket_id="abc123", name="新名字", importance=8, tags="焦虑,成长")

系统内部：收集非默认值字段 → bucket_mgr.update() 批量更新 frontmatter

7c 删除

trace(bucket_id="abc123", delete=True)

系统内部：

bucket_mgr.delete("abc123") → _find_bucket_file() 定位文件 → os.remove(file_path)
embedding_engine.delete_embedding("abc123") → SQLite DELETE WHERE bucket_id=?
返回："已遗忘记忆桶: abc123"

场景 8：记忆长期未被激活，自动衰减归档（后台 decay）

触发方式：服务启动后，decay_engine.start() 创建后台 asyncio Task，每 check_interval_hours（默认 24h）执行一次 run_decay_cycle()

系统内部发生什么：

bucket_mgr.list_all(include_archive=False) — 获取所有活跃桶
跳过 type in ("permanent","feel") 或 pinned=True 或 protected=True 的桶
自动 resolve：若 importance <= 4 且距上次激活 > 30 天且 resolved=False → bucket_mgr.update(bucket_id, resolved=True)
对每桶调用 calculate_score(metadata)：

短期（days_since ≤ 3）：
```
time_weight = 1.0 + e^(-hours/36)  (t=0→×2.0, t=36h→×1.5)
emotion_weight = base(1.0) + arousal × arousal_boost(0.8)
combined = time_weight×0.7 + emotion_weight×0.3
base_score = importance × activation_count^0.3 × e^(-λ×days) × combined
```
长期（days_since > 3）：
```
combined = emotion_weight×0.7 + time_weight×0.3
```
修正因子：
- resolved=True → ×0.05
- resolved=True && digested=True → ×0.02
- arousal > 0.7 && resolved=False → ×1.5（高唤醒紧迫加成）
- pinned/protected/permanent → 返回 999.0（永不衰减）
- type=="feel" → 返回 50.0（固定）
score < threshold（默认 0.3）→ bucket_mgr.archive(bucket_id) → _move_bucket() 将文件从 dynamic/ 移动到 archive/ 目录，更新 frontmatter type="archived"

返回 stats：{"checked": N, "archived": N, "auto_resolved": N, "lowest_score": X}

场景 9：用户使用 dream 工具进行记忆沉淀

触发：Claude 在对话启动时，breath() 之后调用 dream()

OB 工具调用：dream()（无参数）

系统内部发生什么：

bucket_mgr.list_all() → 过滤非 permanent/feel/pinned/protected 桶
按 created 降序取前 10 条（最近新增的记忆）
对每条拼接：名称、resolved 状态、domain、V/A、创建时间、正文前 500 字符
连接提示（embedding 已开启 && 桶数 >= 2）：
- 取每个最近桶的 embedding（embedding_engine.get_embedding(bucket_id)）
- 两两计算 _cosine_similarity()，找相似度最高的对
- 若 best_sim > 0.5 → 输出提示："[名A] 和 [名B] 似乎有关联 (相似度:X.XX)"
feel 结晶提示（embedding 已开启 && feel 数 >= 3）：
- 对所有 feel 桶两两计算相似度
- 若某 feel 与 >= 2 个其他 feel 相似度 > 0.7 → 提示升级为 pinned 桶
返回标准 header 说明（引导 Claude 自省）+ 记忆列表 + 连接提示 + 结晶提示

Claude 后续行为（根据 CLAUDE_PROMPT 引导）：

trace(bucket_id, resolved=1) 放下可以放下的
hold(content="...", feel=True, source_bucket="xxx", valence=0.6) 写感受
无沉淀则不操作

场景 10：用户使用 feel 工具记录 Claude 的感受

触发：Claude 在 dream 后决定记录某段记忆带来的感受

OB 工具调用：

hold(content="她问起了警校的事，我感觉她在用问题保护自己，问是为了不去碰那个真实的恐惧。", feel=True, source_bucket="abc123", valence=0.45, arousal=0.4)

系统内部发生什么：

feel=True → 进入 feel 专用路径，跳过自动打标和合并检测
feel_valence = valence（Claude 自身视角的情绪，非事件情绪）
bucket_mgr.create(content, tags=[], importance=5, domain=[], valence=feel_valence, arousal=feel_arousal, bucket_type="feel") → 写入 feel/ 目录
embedding_engine.generate_and_store(bucket_id, content) — feel 桶同样有向量（供 dream 结晶检测使用）
若 source_bucket 非空：bucket_mgr.update(source_bucket, digested=True, model_valence=feel_valence) → 标记源记忆已消化
- 此后该源桶 calculate_score() 中 resolved_factor = 0.02（accelerated fade）

衰减特性：feel 桶 type=="feel" → calculate_score() 固定返回 50.0，永不归档 检索特性：不参与普通 breath() 浮现；只通过 breath(domain="feel") 读取

返回："🫧feel→<bucket_id>"

场景 11：用户带 importance_min 参数批量拉取重要记忆

Claude 行为：

breath(importance_min=8)

系统内部发生什么：

importance_min >= 1 → 进入批量拉取模式，完全跳过语义搜索
bucket_mgr.list_all(include_archive=False) 全量加载
过滤 importance >= 8 且 type != "feel" 的桶
按 importance 降序排列，截断到最多 20 条
对每条调用 dehydrator.dehydrate() 压缩，按 max_tokens（默认 10000）预算截断

[importance:10] [bucket_id:xxx] ...（核心原则）
---
[importance:9] [bucket_id:yyy] ...
---
[importance:8] [bucket_id:zzz] ...

场景 12：embedding 向量化检索场景（开启 embedding 时）

前提：config.yaml 中 embedding.enabled: true 且 OMBRE_API_KEY 已配置

embedding 介入的两个层次：

层次 A：BucketManager.search() 内的 Layer 1.5 预筛

调用点：bucket_mgr.search() → Layer 1.5
函数：embedding_engine.search_similar(query, top_k=50) → 生成查询 embedding → SQLite 全量余弦计算 → 返回 [(bucket_id, similarity)] 按相似度降序
作用：将精排候选集从所有桶缩小到向量最近邻的 50 个，加速后续多维精排

层次 B：server.py breath 的额外向量通道

调用点：breath() 检索模式中，keyword 搜索完成后
函数：embedding_engine.search_similar(query, top_k=20) → 相似度 > 0.5 的桶补充到结果集
标注：补充桶带 [语义关联] 前缀

向量存储路径：

新建桶后：embedding_engine.generate_and_store(bucket_id, content) → _generate_embedding(text[:2000]) → API 调用 → _store_embedding() → SQLite INSERT OR REPLACE
合并更新后：同上，用 merged content 重新生成
删除桶时：embedding_engine.delete_embedding(bucket_id) → DELETE FROM embeddings

SQLite 结构：

CREATE TABLE embeddings (
    bucket_id TEXT PRIMARY KEY,
    embedding TEXT NOT NULL,   -- JSON 序列化的 float 数组
    updated_at TEXT NOT NULL
)

相似度计算：_cosine_similarity(a, b) = dot(a,b) / (|a| × |b|)

三、边界与降级行为

场景	异常情况	降级行为
`breath()` 浮现	桶目录为空	返回 `"权重池平静，没有需要处理的记忆。"`
`breath()` 浮现	`list_all()` 异常	返回 `"记忆系统暂时无法访问。"`
`breath()` 检索	`bucket_mgr.search()` 异常	返回 `"检索过程出错，请稍后重试。"`
`breath()` 检索	embedding 不可用 / API 失败	`logger.warning()` 记录，跳过向量通道，仅用 keyword 检索
`breath()` 检索	结果 < 3 条	40% 概率从低权重旧桶随机浮现 1~3 条，标注 `[surface_type: random]`
`hold()` 自动打标	`dehydrator.analyze()` 失败	降级到默认值：`domain=["未分类"], valence=0.5, arousal=0.3, tags=[], name=""`
`hold()` 合并检测	`bucket_mgr.search()` 失败	`logger.warning()`，直接走新建路径
`hold()` 合并	`dehydrator.merge()` 失败	`logger.warning()`，跳过合并，直接新建
`hold()` embedding	API 失败	`try/except` 吞掉，embedding 缺失但不影响存储
`grow()` 日记拆分	`dehydrator.digest()` 失败	返回 `"日记整理失败: {e}"`
`grow()` 单条处理失败	单个 item 异常	`logger.warning()` + 标注 `⚠️条目名`，其他条目正常继续
`grow()` 内容 < 30 字	—	快速路径：`analyze()` + `_merge_or_create()`，跳过 `digest()`（节省 token）
`trace()`	`bucket_mgr.get()` 返回 None	返回 `"未找到记忆桶: {bucket_id}"`
`trace()`	未传任何可修改字段	返回 `"没有任何字段需要修改。"`
`pulse()`	`get_stats()` 失败	返回 `"获取系统状态失败: {e}"`
`dream()`	embedding 未开启	跳过连接提示和结晶提示，仅返回记忆列表
`dream()`	桶列表为空	返回 `"没有需要消化的新记忆。"`
`decay_cycle`	`list_all()` 失败	返回 `{"checked":0, "archived":0, ..., "error": str(e)}`，不终止后台循环
`decay_cycle`	单桶 `calculate_score()` 失败	`logger.warning()`，跳过该桶继续
所有 feel 操作	`source_bucket` 不存在	`logger.warning()` 记录，feel 桶本身仍成功创建
`dehydrator.dehydrate()` / `analyze()` / `merge()` / `digest()`	API 不可用（`api_available=False`）	直接向 MCP 调用端明确报错（`RuntimeError`），无本地降级。本地关键词提取质量不足以替代语义打标与合并，静默降级比报错更危险（可能产生错误分类记忆）。
`embedding_engine.search_similar()`	`enabled=False`	直接返回 `[]`，调用方 fallback 到 keyword 搜索

四、数据流图

4.1 一条记忆的完整生命周期

用户输入内容
     │
     ▼
Claude 决策: hold / grow / 自动
     │
     ├─[grow 长内容]──→ dehydrator.digest(content)
     │                    DIGEST_PROMPT → LLM API
     │                    返回 [{name,content,domain,...}]
     │                    ↓ 每条独立处理 ↓
     │
     └─[hold 单条]──→ dehydrator.analyze(content)
                          ANALYZE_PROMPT → LLM API
                          返回 {domain, valence, arousal, tags, suggested_name}
                          │
                          ▼
                    _merge_or_create()
                          │
                    bucket_mgr.search(content, limit=1, domain_filter)
                          │
                    ┌─────┴─────────────────────────┐
                    │ score > merge_threshold (75)?  │
                    │                                │
                   YES                               NO
                    │                                │
                    ▼                                ▼
           dehydrator.merge(              bucket_mgr.create(
             old_content, new)              content, tags,
             MERGE_PROMPT → LLM             importance, domain,
                    │                       valence, arousal,
                    ▼                       bucket_type="dynamic"
           bucket_mgr.update(...)         )
                    │                        │
                    └──────────┬─────────────┘
                               │
                               ▼
                    embedding_engine.generate_and_store(
                      bucket_id, content)
                      → _generate_embedding(text[:2000])
                      → API 调用 (gemini-embedding-001)
                      → _store_embedding() → SQLite
                               │
                               ▼
                    文件写入: {buckets_dir}/dynamic/{domain}/{name}_{id}.md
                    YAML frontmatter:
                      id, name, tags, domain, valence, arousal,
                      importance, type="dynamic", created, last_active,
                      activation_count=1
                               │
                               ▼
          ┌─────── 记忆桶存活期 ──────────────────────────────────────┐
          │                                                           │
          │  每次被 breath(query) 检索命中:                           │
          │    bucket_mgr.touch(bucket_id)                           │
          │      → last_active = now_iso()                           │
          │      → activation_count += 1                            │
          │      → _time_ripple(source_id, now, hours=48)           │
          │        对 48h 内邻近桶 activation_count += 0.3           │
          │                                                           │
          │  被 dream() 消化:                                        │
          │    hold(feel=True, source_bucket=id) →                  │
          │    bucket_mgr.update(id, digested=True)                 │
          │                                                           │
          │  被 trace(resolved=1) 标记:                              │
          │    resolved=True → decay score ×0.05 (或 ×0.02)        │
          │                                                           │
          └───────────────────────────────────────────────────────────┘
                               │
                               ▼
          decay_engine 后台循环 (每 check_interval_hours=24h)
            run_decay_cycle()
              → 列出所有动态桶
              → calculate_score(metadata)
                  importance × activation_count^0.3
                  × e^(-λ×days)
                  × combined_weight
                  × resolved_factor
                  × urgency_boost
              → score < threshold (0.3)?
                               │
                         ┌─────┴──────┐
                         │            │
                        YES           NO
                         │            │
                         ▼            ▼
              bucket_mgr.archive(id)  继续存活
                → _move_bucket()
                → 文件移动到 archive/
                → frontmatter type="archived"
                         │
                         ▼
             记忆桶归档（不再参与浮现/搜索）
             但文件仍存在，可通过 pulse(include_archive=True) 查看

4.2 feel 桶的特殊路径

hold(feel=True, source_bucket="xxx", valence=0.45)
         │
         ▼
  bucket_mgr.create(bucket_type="feel")
  写入 feel/ 目录
         │
         ├─→ embedding_engine.generate_and_store()（供 dream 结晶检测）
         │
         └─→ bucket_mgr.update(source_bucket, digested=True, model_valence=0.45)
                    源桶 resolved_factor → 0.02
                    加速衰减直到归档

feel 桶自身:
  - calculate_score() 返回固定 50.0
  - 不参与普通 breath 浮现
  - 不参与 dreaming 候选
  - 只通过 breath(domain="feel") 读取
  - 永不归档

五、代码与规格差异汇总（审查版）

本节由完整源码审查生成（2026-04-21），记录原待实现项最终状态、新发现 Bug 及参数决策。

5.1 原待实现项最终状态

编号	原描述	状态	结论
⚠️-1	`dehydrate()` 无本地降级 fallback	已确认为设计决策	API 不可用时直接向 MCP 调用端报错（RuntimeError），不降级，见三、降级行为表
⚠️-2	`run_decay_cycle()` auto_resolved 实现存疑	✅ 已确认实现	`decay_engine.py` 完整实现 imp≤4 + >30天 + 未解决 → `bucket_mgr.update(resolved=True)`
⚠️-3	`list_all()` 是否遍历 `feel/` 子目录	✅ 已确认实现	`list_all()` dirs 明确包含 `self.feel_dir`，递归遍历
⚠️-4	`_time_ripple()` 浮点增量被 `int()` 截断	❌ 已确认 Bug	见 B-03，决策见下
⚠️-5	Dashboard `/api/*` 路由认证覆盖	✅ 已确认覆盖	所有 `/api/buckets`、`/api/search`、`/api/network`、`/api/bucket/{id}`、`/api/breath-debug` 均调用 `_require_auth(request)`

5.2 新发现 Bug 及修复决策

编号	场景	严重度	问题描述	决策 & 修复方案
B-01	场景7a	高	`bucket_mgr.update(resolved=True)` 当前会将桶立即移入 `archive/`（type="archived"），规格预期"降权留存、关键词可激活"。resolved 桶实质上立即从所有搜索路径消失。	修复：移除 `bucket_manager.py` `update()` 中 `resolved → _move_bucket(archive_dir)` 的自动归档逻辑，仅更新 frontmatter `resolved=True`，由 decay 引擎自然衰减至 archive。
B-03	全局	高	`_time_ripple()` 对 `activation_count` 做浮点增量（+0.3），但 `calculate_score()` 中 `max(1, int(...))` 截断小数，增量丢失，时间涟漪对衰减分无实际效果。	修复：`decay_engine.py` `calculate_score()` 中改为 `activation_count = max(1.0, float(metadata.get("activation_count", 1)))`
B-04	场景1	中	`bucket_manager.create()` 初始化 `activation_count=1`，冷启动检测条件 `activation_count==0` 对所有正常创建的桶永不满足，高重要度新桶不被优先浮现。	决策：初始化改为 `activation_count=0`。语义上"创建"≠"被召回"，`touch()` 首次命中后变为 1，冷启动检测自然生效。规格已更新（见场景1步骤6 & 场景3 create 详情）。
B-05	场景5	中	`bucket_manager.py` `_calc_time_score()` 实现 `e^(-0.1×days)`，规格为 `e^(-0.02×days)`，衰减速度快 5 倍，30天后时间分 ≈ 0.05（规格预期 ≈ 0.55），旧记忆时间维度近乎失效。	决策：保留规格值 `0.02`。记忆系统中旧记忆应通过关键词仍可被唤醒，时间维度是辅助信号不是淘汰信号。修复：`_calc_time_score()` 改为 `return math.exp(-0.02 * days)`
B-06	场景5	中	`bucket_manager.py` `w_time` 默认值为 `2.5`，规格为 `1.5`，叠加 B-05 会导致时间维度严重偏重近期记忆。	决策：保留规格值 `1.5`。修复：`w_time = scoring.get("time_proximity", 1.5)`
B-07	场景5	中	`bucket_manager.py` `content_weight` 默认值为 `3.0`，规格为 `1.0`（body×1）。正文权重过高导致合并检测（`search(content, limit=1)`）误判——内容相似但主题不同的桶被错误合并。	决策：保留规格值 `1.0`。正文是辅助信号，主要靠 name/tags/domain 识别同话题桶。修复：`content_weight = scoring.get("content_weight", 1.0)`
B-08	场景8	低	`run_decay_cycle()` 内 auto_resolve 后继续使用旧 `meta` 变量计算 score，`resolved_factor=0.05` 需等下一 cycle 才生效。	修复：auto_resolve 成功后执行 `meta["resolved"] = True` 刷新本地 meta 变量。
B-09	场景3	低	`hold()` 非 feel 路径中，用户显式传入的 `valence`/`arousal` 被 `analyze()` 返回值完全覆盖。	修复：若用户显式传入（`0 <= valence <= 1`），优先使用用户值，`analyze()` 结果作为 fallback。
B-10	场景10	低	feel 桶以 `domain=[]` 创建，但 `bucket_manager.create()` 中 `domain or ["未分类"]` 兜底写入 `["未分类"]`，数据不干净。	修复：`create()` 中对 `bucket_type=="feel"` 单独处理，允许空 domain 直接写入。

5.3 已确认正常实现

breath() 浮现模式不调用 touch()，不重置衰减计时器
feel 桶 calculate_score() 返回固定 50.0，永不归档
breath(domain="feel") 独立通道，按 created 降序，不压缩展示原文
decay_engine.calculate_score() 短期（≤3天）/ 长期（>3天）权重分离公式
urgency_boost：arousal > 0.7 && !resolved → ×1.5
dream() 连接提示（best_sim > 0.5）+ 结晶提示（feel 相似度 > 0.7 × ≥2 个）
所有 /api/* Dashboard 路由均受 _require_auth 保护
trace(delete=True) 同步调用 embedding_engine.delete_embedding()
grow() 单条失败 try/except 隔离，标注 ⚠️条目名，其他条继续

本文档基于代码直接推导，每个步骤均可对照源文件函数名和行为验证。如代码更新，请同步修订此文档。

33 KiB Raw Blame History Unescape Escape

Ombre Brain 用户全流程行为规格书

一、系统角色说明

1.1 参与方总览

1.2 Claude 端职责边界

1.3 OB 服务端内部模块职责

二、场景全流程

场景 1：新对话开始（冷启动，无历史记忆）

场景 2：新对话开始（有历史记忆，breath 自动浮现）

场景 3：用户说了一件事，Claude 决定存入记忆（hold）

场景 4：用户说了一段长日记，Claude 整理存入（grow）

场景 5：用户想找某段记忆（breath 带 query 检索）

场景 6：用户想查看所有记忆状态（pulse）

场景 7：用户想修改/标记已解决/删除某条记忆（trace）

7a 标记已解决

7b 修改元数据

7c 删除

场景 8：记忆长期未被激活，自动衰减归档（后台 decay）

场景 9：用户使用 dream 工具进行记忆沉淀

场景 10：用户使用 feel 工具记录 Claude 的感受

场景 11：用户带 importance_min 参数批量拉取重要记忆

场景 12：embedding 向量化检索场景（开启 embedding 时）

层次 A：BucketManager.search() 内的 Layer 1.5 预筛

层次 B：server.py breath 的额外向量通道

三、边界与降级行为

四、数据流图

4.1 一条记忆的完整生命周期

4.2 feel 桶的特殊路径

五、代码与规格差异汇总（审查版）

5.1 原待实现项最终状态

5.2 新发现 Bug 及修复决策

5.3 已确认正常实现

33 KiB

Raw Blame History