知识库(Xq.KB)

进行中

2026年6月6日

手机采集 → AI 处理 → 语义检索 → 对话问答,打造不需要开电脑就能持续积累的个人知识库系统。

PythonDeepSeekFlask知识管理SyncthingCloudflare

stack

PythonFlaskDeepSeek APIsentence-transformersJina AISyncthingCloudflare Tunnel

背景

日常在手机上会产生大量碎片信息——刷到的观点、技术文章的片段、投资思考、复盘反思。以前要么记在备忘录里吃灰,要么过眼即忘。

想要的不是”记下来”,而是”想起来”:采集足够轻量,检索足够自然,让知识在需要的时候能自己冒出来。

所以做了这个知识库:手机存 → 云端处理 → 随时问。

核心决策

  • Markor + Syncthing 采集:手机上用 Markor 写 Markdown,Syncthing 自动同步到电脑,零操作成本
  • AI 三阶段分流:Move → Process → Commit 三段式事务模型,AI 自动判断 hard/soft/mixed 类型,路由到不同目录。mixed 内容做”细胞分裂”分别写入 technical 和 insight
  • 增量索引 + 语义检索:SHA256 对比只更新变更文件,用 bge-small-zh 本地嵌入做语义检索,不依赖外部 API
  • 双端展现:本地 Flask 服务 + Cloudflare Tunnel 穿透,手机浏览器直接访问。另有一个静态站部署在 Cloudflare Pages
  • 不设数据库:整站文件系统即数据库,JSON 文件做索引缓存。零运维、可 git 回溯

架构概览

手机采集(Markor)
  → Syncthing 同步
  → kb/inbox/
  → AI 引擎:分类 + 提纯 + URL 抓取 + 背景注入
  → core/insight(深度认知)│ manual/technical(技术知识)│ raw(原文冷备)
  → 增量索引 → 语义检索
  → Web 服务 + 聊天界面 + 静态站

引擎模块分四个管道串联:Bootstrap(启动自检)→ Engine(AI 处理分流)→ Index Guard(增量索引)→ Weekly Scan(摘要审计生成问题,驱动用户回答形成闭环)。

当前状态

v2.3 已上线运行。PC Agent 对话助手(浏览器内聊天界面 + 多轮上下文 + 知识库检索增强 + 演进发现)已完成。核心管线稳定运行中。

下一阶段方向:Wiki 层、面板统计、知识图谱可视化。