产品研发RAG_接手说明.md 3.12 KB

产品研发 RAG 接手说明

这份说明给“几个月后重新接手这个项目的 AI / 新同学”用。

1. 先看哪里

按顺序看:

  1. README.md
  2. docs/产品研发RAG_总体方案与实施手册.md
  3. docs/产品研发RAG_增量更新与Dify维护手册.md
  4. dist/dify_import/00_导入说明.md

2. 项目当前结论

  • 知识工程底座已经完成
  • Dify 落地采用 3 个知识库视图
  • 产品主知识库与后台实现补充知识库已验证可用
  • Dify 当前可用参数已经实测收敛

3. 当前 Dify 结构

产品主知识库

文件来源:

  • dist/dify_import/10_AUTH_主知识库.md
  • dist/dify_import/11_INCOME_主知识库.md
  • dist/dify_import/12_INQUIRY_主知识库.md
  • dist/dify_import/13_CLINIC_主知识库.md
  • dist/dify_import/14_PATIENT_主知识库.md
  • dist/dify_import/15_NOTIFICATION_主知识库.md
  • dist/dify_import/16_BACKSTAGE_主知识库.md
  • dist/dify_import/17_GENERAL_主知识库.md
  • dist/dify_import/09_AUTH_高优先参考_医师认证流程.md

版本与预评审知识库

文件来源:

  • dist/dify_import/02_版本变更总览.md
  • dist/dify_import/03_需求预评审执行指南.md

后台实现补充知识库

文件来源:

  • dist/backend_code/01_接口契约.md
  • dist/backend_code/02_枚举与状态.md
  • dist/backend_code/03_实现约束.md
  • dist/backend_code/05_业务实现主题.md

4. 当前已验证的 Dify 参数

  • 分段标识符:\n\n
  • 分段最大长度:1200
  • 分段重叠长度:100
  • 索引方式:高质量
  • 检索方式:混合检索
  • Top K:5
  • Embedding:text-embedding-v4
  • Q&A 分段:关闭

5. 新资料怎么接

新版本资料

执行:

bash scripts/rebuild_version_kb.sh <version> /Users/xwk/Downloads/studio-server2

新专项规则文档

  • 原始文件放 inputs/priority_refs/
  • 整理成 Markdown 也放 inputs/priority_refs/
  • 再跑:
python3 scripts/build_dify_import_pack.py

全量重刷

bash scripts/rebuild_all_kb.sh /Users/xwk/Downloads/studio-server2

5.1 别漏掉飞书同步

每次版本更新后,除了重建本地产物和更新 Dify,还要同步飞书文档。

至少同步:

  • docs/产品研发RAG_总体方案与实施手册.md
  • docs/产品研发RAG_增量更新与Dify维护手册.md
  • docs/产品研发RAG_接手说明.md

如果这次有版本变化,还同步:

  • dist/dify_import/02_版本变更总览.md

如果这次有新增专项规则,还同步:

  • 对应 inputs/priority_refs/*.md

6. 不要做的事

  • 不要把所有内容硬塞回 Dify 的一个知识库
  • 不要直接把未整理的专项 PDF 当作高优先规则
  • 不要让后台代码补充层覆盖培训文档主事实
  • 不要把模块当成知识组织的唯一主轴

7. 如果只剩 10 分钟

优先做:

  1. docs/产品研发RAG_增量更新与Dify维护手册.md
  2. 确认新资料应该放到 pdf/testCase/inputs/figma/ 还是 inputs/priority_refs/
  3. scripts/rebuild_version_kb.sh
  4. 在 Dify 里只替换受影响的知识库文件
  5. 同步更新飞书入口文档