AI专利撰写辅助系统 — 完整项目工作指南

项目概况

项目目标

开发一个 Web 端的 AI 专利撰写辅助系统，供公司内部专利代理师和企业技术人员使用。系统覆盖从技术交底书解析、专利检索、创新性分析到五书（权利要求书、说明书、摘要、说明书附图、摘要附图）生成的完整流程。聚焦软件/互联网/AI 领域的中国发明专利。

核心原则

底线原则：系统定位为"辅助工具"而非"替代代理师"。所有输出必须经过有资质的专利代理师审核后才能提交。系统界面中必须有明确的免责声明和人工审核提示。

你需要的团队

角色	人数	职责	何时需要
项目负责人(你)	1	统筹协调、验收把关、业务决策、提供专利案例	全程
资深专利代理师	1-2	提供测试数据集、标注案例、评审 AI 输出质量、编写审查规则知识库、撰写 prompt 中的专业内容	Phase 1-6 密集参与，后续持续评审
全栈开发工程师	1-2	后端 API、前端 Web 界面、LLM 集成、数据库	Phase 2 起
AI/NLP 工程师	1	Prompt 工程、LLM 调优、检索策略算法、输出质量评估	Phase 4 起

最小团队配置：你 + 1 名资深代理师 + 1 名全栈工程师（兼 AI 工程）= 3 人。

项目阶段总览

阶段	性质	关键产出	决策点
Phase 0-1	准备	团队到位、数据集就绪	—
Phase 2-4	概念验证	API 通了、知识库建了、手动跑通了	Go/No-Go 决策点：手动 PoC 结果是否达标
Phase 5-8	核心开发	四大引擎逐个开发并验证	每个引擎独立验收
Phase 9-10	集成测试	完整系统可用	内测通过
Phase 11	上线	部署 + 培训 + 运营	正式发布

推荐技术选型

以下技术选型面向你的开发工程师。你不需要理解细节，但需要知道选择的理由，以便在招聘或外包时评估候选人。

层面	推荐方案	选择理由
LLM 主力模型	DeepSeek-V3 / Qwen-Max （通过 API 调用，非本地部署）	中文法律/技术文本能力强，成本可控，支持长上下文
LLM 审核模型	Claude / GPT-4o （作为第二意见）	用不同模型做交叉审核，降低单一模型的偏差风险
后端框架	Python + FastAPI	AI/NLP 生态成熟，异步支持好，适合 LLM 流式输出
前端框架	React + Next.js	组件化开发、SSR 支持、生态丰富
数据库	PostgreSQL + Redis	结构化数据 + 缓存/队列
文件存储	MinIO 或阿里云 OSS	存储交底书、生成的文件、附图等
文档生成	python-docx	按 CNIPA 模板生成 Word 文件
附图生成	Mermaid → SVG → 后处理	流程图/架构图的自动化生成
专利检索	Incopat API	你已有的商业数据库
部署	Docker + 内网服务器	公司内部使用，数据安全可控

Phase 0

项目准备

目标：团队到位、开发环境就绪、所有外部依赖确认。

任务清单

0.1 组建团队 你
按照上方团队配置招募/指定人员。如果采用外包开发，需要选择有 AI 应用开发经验的团队，并签署保密协议（涉及企业技术交底书等敏感资料）。
0.2 开通 LLM API 账号 开发
注册并开通以下 API 服务（按优先级）：
- DeepSeek 开放平台（deepseek.com）— 申请 API Key，充值测试额度
- 阿里云 DashScope（Qwen 模型）— 开通并获取 API Key
- Anthropic Claude API 或 OpenAI API — 用于审核模型（二选一）
0.3 确认 Incopat API 权限 你
联系合享新创商务/技术支持，确认以下事项并获取 API 文档：
- 当前合同是否包含 API 调用权限（很多企业合同只含网页端）
- 如不包含，询问 API 模块的单独采购价格和开通流程
- 获取 API 技术文档（接口地址、认证方式、请求格式、返回字段）
- 确认 API 支持的检索方式：布尔检索、IPC 分类号、全文检索、语义检索
- 确认返回数据字段：摘要、权利要求、全文、法律状态、引用文献
- 确认调用频率限制（QPS）和月调用量上限
- 申请测试/沙盒环境
0.4 搭建开发环境 开发
- 准备一台内网服务器（推荐配置：8核 CPU / 32GB 内存 / 500GB SSD）
- 安装 Docker、Git、Python 3.11+、Node.js 20+
- 搭建代码仓库（GitLab 私有仓库或其他内网 Git 服务）
- 创建项目目录结构（后续 Phase 会细化）
0.5 准备《专利审查指南》原文 代理师
获取以下文件的电子版（PDF 或 Word），作为知识库构建的原始材料：
- 《专利审查指南》2024年1月20日施行版 — 完整版
- 重点章节：第二部分第二章（权利要求撰写）、第三章（说明书撰写）、第九章（计算机程序发明）
- CNIPA 官网发布的审查指南修改解读文件（2020年版、2024年版）

验收标准

团队人员全部到位并明确分工
至少 2 个 LLM API 可正常调用（能发送请求并收到回复）
收到 Incopat API 技术文档，明确了 API 能力边界
开发服务器可访问，Git 仓库已创建
《审查指南》相关章节电子版已收集齐

交付物

团队通讯录与分工表
各 API 的 Key / 账号信息（加密存储）
Incopat API 技术文档（含能力确认清单）
开发环境验证截图

Phase 1

测试数据集构建

目标：整理 12-15 件已授权软件/AI 领域中国发明专利案例，作为后续所有环节的评测基准。

任务清单

1.1 从案件库中初筛候选案例 代理师
从你们代理过的案子中筛选 20-25 件候选，筛选条件：
- 已获得中国发明专利授权（有 B 文本）
- 技术领域属于软件/互联网/AI
- 有原始技术交底书
- 代理师对案件记忆清晰（能回忆撰写思路）
1.2 按多样性标准精选 12-15 件 代理师你
从候选中精选，确保覆盖以下维度：
- 权利要求主题：方法类 5 件 + 装置类 3 件 + 混合类 4 件
- 技术子领域：至少覆盖 3 个（如 NLP、CV、推荐系统、数据处理、安全）
- 复杂度：简单（≤8条权利要求）4 件 + 中等（8-15条）5 件 + 复杂（>15条）3 件
- 审查过程：一次授权 5 件 + 经过 OA 的 7 件

1.3 整理每件案例的完整材料 代理师

为每件案例建立标准化文件夹，命名规则：序号_技术关键词

01_图像去噪CNN/
├── 交底书原文.docx            # 原始技术交底书
├── 授权公告文本.pdf           # 最终授权的完整文件
├── 申请公开文本.pdf           # 首次公开的文件（如与授权有差异）
├── OA/                        # 审查意见及答复（如有）
│   ├── OA1_审查意见.pdf
│   ├── OA1_答复.pdf
│   └── ...
└── 案例标注.md                # 代理师手动填写的标注

1.4 填写案例标注 代理师

这是整个数据集中最有价值的部分。每件案例的标注模板如下：

## 基本信息
- 专利号：CN XXXXXXXXX B
- 技术领域：自然语言处理
- IPC 分类号：G06F 40/XX
- 交底书质量评分：4/5（5为非常详细完整）

## 核心技术方案（2-3句话概括）
本发明提出一种基于XXX的文本分类方法...

## 权利要求结构分析
- 独立权利要求数量：4（方法1+装置1+介质1+设备1）
- 权利要求总条数：15
- 关键上位概括点：
  - "特征提取模块"概括了CNN/RNN/Transformer三种具体实现
  - "分类策略"概括了softmax和SVM两种具体分类器
- 概括策略说明：因交底书中给出了多种实现方式，故做了上位概括

## 审查过程（有OA的案子必填）
- OA次数：2
- OA1 驳回理由：创造性（引用对比文件CN XXXXXXX A + US XXXXXXX A1）
- OA1 答复策略：补入从属权利要求的技术特征到独立权利要求
- OA2 驳回理由：权利要求不清楚（步骤S3描述模糊）
- OA2 答复策略：明确步骤S3的具体数据处理方式

## 对比文件
- 最接近现有技术：CN 2019XXXXXXX A（技术主题最相关）
- 区别技术特征：本发明增加了XXX步骤，实现了XXX效果

## 代理师复盘
- 撰写难点：上位概括的尺度难把握，最终OA后被迫缩小
- 改进建议：如果重写，独立权利要求应直接限定XXX

1.5 数据集自检 你代理师
检查最终数据集的完整性和多样性：
- 制作一个汇总表，列出所有案例的编号、领域、复杂度、是否有OA
- 确认各维度的覆盖是否均衡，如有明显缺失则从候选列表中补充
- 确认所有标注已填写完整

验收标准

12-15 件案例全部整理完毕，文件结构符合标准
每件案例的"案例标注.md"已由代理师填写完整
多样性覆盖：至少 3 个技术子领域 × 3 个复杂度级别 × 有/无 OA
汇总表已制作，可一览全部案例的分布情况

Phase 2

Incopat API 对接验证

目标：完成 Incopat API 的技术对接，验证检索能力是否满足需求。

前置依赖：Phase 0.3 Incopat API 文档已获取

任务清单

2.1 API 基础联通测试 开发
编写测试脚本，验证 API 的基本调用能力：
- 认证：使用 API Key / Token 成功认证
- 简单查询：用一个已知专利号（如 CN XXXXXXXXX B）查询，验证返回数据
- 关键词检索：用"图像识别 AND 卷积神经网络"检索，验证返回结果
- IPC 分类号检索：用 G06F18/24 检索，验证结果
- 组合检索：关键词 + IPC 分类号的布尔组合
2.2 返回字段验证 开发
确认 API 返回数据是否包含以下必需字段：
- 【必需】专利号、标题、摘要、IPC 分类号、申请日、公开日
- 【必需】权利要求书全文
- 【必需】法律状态（授权/驳回/撤回/有效/无效）
- 【强烈建议】说明书全文
- 【强烈建议】引用/被引用文献列表
- 【建议】发明人、申请人信息
2.3 检索能力基准测试 开发代理师
从 Phase 1 数据集中选 3 件有 OA 的案例，进行以下测试：
- 代理师根据案例的技术方案，编写一组检索式
- 用该检索式通过 API 执行检索
- 核心验证：返回结果中是否包含审查员在 OA 中引用的对比文件
- 记录：检索结果总条数、Top 20 中的相关文献数量、对比文件是否命中

2.4 编写 API 封装模块 开发

基于测试结果，封装一个可复用的 Python 模块：

# patent_search/incopat_client.py

class IncopatClient:
    def search_by_keywords(self, keywords, ipc_codes=None, date_range=None) -> list
    def search_by_boolean(self, query_string) -> list
    def get_patent_detail(self, patent_number) -> dict
    def get_patent_claims(self, patent_number) -> str
    def get_patent_fulltext(self, patent_number) -> str
    def get_legal_status(self, patent_number) -> dict
    def get_citations(self, patent_number) -> list

2.5 编写 API 能力评估报告 开发
记录所有测试结果，输出一份简要报告，包含：
- API 支持的检索方式及语法
- 返回字段清单（标注哪些可用、哪些缺失）
- 3 件案例的检索基准测试结果
- 发现的问题和限制（如有）
- 是否需要补充其他数据源（如 Google Patents、Espacenet）

验收标准

API 基础调用全部通过（认证、检索、详情查询）
返回字段中"必需"项全部可用
3 件案例的检索测试中，至少 2 件命中了审查员引用的对比文件
API 封装模块代码可运行，接口清晰
能力评估报告已输出

如果验收不通过：如果 Incopat API 不支持关键能力（如不返回权利要求全文），需要评估：(1) 是否有更高级别的 API 套餐可升级 (2) 是否用 Espacenet Open Patent Services（免费）补充中国以外的数据 (3) 是否需要更换数据库供应商。此决策由你与开发团队共同做出。

Phase 3

审查规则知识库构建

目标：将《审查指南》的关键条款结构化为机器可读的知识库，作为 Prompt 和审核引擎的基础。

前置依赖：Phase 0.5 审查指南原文已获取

任务清单

3.1 校验已有知识库初稿 代理师
本项目已提供了一份第九章结构化知识库初稿（JSON 格式，含 11 条审查规则、5 种权利要求模板、14 个审查示例、6 种常见驳回模式、13 项审核检查清单）。代理师需要：
- 逐条对照《审查指南》2024 年施行版原文，校验每条规则的准确性
- 补充遗漏的重要规则（特别是第二部分第二章、第三章的通用撰写规范）
- 校验审查示例的编号、标题、结论是否与原文一致
- 标注任何需要修改或补充的内容
3.2 补充第二部分第二章（权利要求通用规范） 代理师
从第二部分第二章提取以下规则并结构化：
- 独立权利要求的"前序部分 + 特征部分"两段式要求（第3.1.2节）
- 从属权利要求的引用方式（第3.1.3节）
- 权利要求中的技术术语一致性要求
- 功能性限定的使用规则和限制
- 权利要求"以说明书为依据并得到说明书支持"的要求（专利法第26条第4款）
- 权利要求"清楚、简要"的要求
3.3 补充第二部分第三章（说明书通用规范） 代理师
从第二部分第三章提取以下规则并结构化：
- 说明书五段式结构要求：技术领域、背景技术、发明内容、附图说明、具体实施方式
- 各段的具体内容要求和撰写规范
- "充分公开"要求（专利法第26条第3款）——说明书使本领域技术人员能够实现
- 背景技术中引用现有技术的规范
- 具体实施方式的详细程度要求
- 摘要的撰写规范（300字以内）
- 附图的制图规范（黑白线条、标号规则）
3.4 整合为完整知识库文件 开发代理师
将代理师校验和补充的内容合并到 JSON 知识库中，确保格式一致。最终知识库应包含：
- 第九章规则（已有，校验后） — 客体判断 + 创造性审查 + 撰写规范
- 第二章规则（新增） — 权利要求通用撰写规范
- 第三章规则（新增） — 说明书通用撰写规范
- 审查示例库（已有，校验后）
- 常见驳回模式（已有，可由代理师补充更多实战经验）
- 自动审核检查清单（已有，根据新增规则扩展）

验收标准

知识库 JSON 文件通过代理师逐条校验，无事实性错误
知识库覆盖三大章节：第二章（权利要求）、第三章（说明书）、第九章（计算机程序）
审查示例不少于 14 个，且每个示例含 lesson_for_ai 字段
审核检查清单不少于 15 项，覆盖客体、格式、内容三个维度

Phase 4

手动 PoC 验证

目标：用纯手动方式（人 + LLM 对话）跑通完整流程 3 次，验证核心假设，产出 Prompt 初稿。

前置依赖：Phase 1 数据集就绪 Phase 2 Incopat API 可用 Phase 3 知识库初版完成

这是整个项目的 Go/No-Go 决策点。如果手动 PoC 的结果显示 AI 生成的权利要求质量无法达到"可用初稿"水平（评分低于 3/5），需要重新评估项目可行性或调整产品定位（如降为"辅助检索+格式生成"工具，不做核心权利要求生成）。

任务清单

4.1 选择 3 件案例 你代理师
从 Phase 1 数据集中选择：1 件简单 + 1 件中等 + 1 件复杂。优先选有 OA 的案子。

4.2 设计并测试"交底书解析"Prompt 代理师

对每件案例执行以下操作：

将技术交底书全文粘贴到 LLM 对话框（推荐 DeepSeek Chat 或 Claude）
使用以下 Prompt（根据实际效果迭代调整）：

你是一位在中国执业超过10年的资深专利代理师，专注软件和AI领域。
请分析以下技术交底书，提取并结构化以下信息：

1. 技术领域（对应 IPC 分类号）
2. 背景技术及现有技术的缺陷
3. 要解决的技术问题
4. 核心技术方案（逐步骤或逐模块描述）
5. 与现有技术的关键区别特征
6. 有益效果
7. 可能的实施例变体

重要要求：
- 如果交底书中某些信息不完整或不清楚，明确列出缺失项并说明其重要性
- 对技术方案的描述要具体到可以直接用于撰写权利要求的程度
- 识别可能存在的客体适格性风险（是否可能被认为属于智力活动规则和方法）

===技术交底书===
[粘贴全文]

对比：将 LLM 输出与代理师实际的理解做逐项对比
记录：正确提取的要素数 / 遗漏的要素 / 错误的要素 / Prompt 改进想法

4.3 设计并测试"检索策略生成"Prompt 代理师
- 使用 Step 4.2 的输出作为输入，让 LLM 生成检索策略
- 在 Incopat 中实际执行 LLM 生成的检索式
- 核心验证：检索结果是否包含审查员在 OA 中引用的对比文件
- 记录：检索式是否可直接执行 / 结果条数 / Top20相关率 / 对比文件命中情况

4.4 设计并测试"权利要求生成"Prompt（最关键） 代理师

这是核心验证。Prompt 中应注入知识库中的关键规则：

你是一位在中国执业超过10年的资深专利代理师，专注软件/AI领域。
请根据以下技术方案和检索结果，撰写一份符合中国《专利法》及
《专利审查指南》（2024年施行版）要求的权利要求书。

## 撰写规则（必须严格遵守）

1. 独立权利要求采用"前序部分 + 特征部分"两段式写法
2. 方法独立权利要求格式：
   "一种[技术目的]的方法，其特征在于，包括以下步骤：..."
3. 装置独立权利要求格式：
   "一种[技术目的]的装置，包括存储器、处理器及存储在存储器上
    的计算机程序，其特征在于，所述处理器执行所述计算机程序以
    实现权利要求X所述方法的步骤。"
4. 必须同时撰写：方法权利要求 + 装置权利要求 + 存储介质权利要求
   + 计算机程序产品权利要求
5. 独立权利要求应做适当上位概括，但不超出说明书支持范围
6. 从属权利要求按技术特征的重要性递进细化
7. 算法步骤中的数据参数必须具有确切技术含义
8. 确保技术方案满足客体适格性要求（非纯算法/纯商业规则）

## 技术方案
[粘贴 Step 4.2 的结构化输出]

## 最接近的现有技术
[粘贴从检索中找到的最相关对比文件的摘要和权利要求]

## 参考示例（以下是一个优秀的软件领域权利要求书示例）
[从数据集中选一件优秀案例的授权权利要求作为 few-shot 示例]

核心对比：将 AI 生成的权利要求与实际授权的权利要求做逐条对比
评估维度见下方评分表

4.5 设计并测试"说明书生成"Prompt 代理师
- 在 Prompt 中提供生成的权利要求和技术方案，要求按五段式输出完整说明书
- 对比 AI 输出的说明书与实际授权说明书的结构、内容、详细程度
4.6 综合评估与决策 你代理师
汇总 3 件案例的所有评估数据，使用以下评分体系：

评估维度	评分标准（1-5分）	最低可接受
交底书解析准确性	1=大量遗漏错误 3=基本准确有少量遗漏 5=完全准确	3分
检索式可执行性	1=完全不可用 3=需少量修改后可用 5=直接可执行	3分
对比文件命中率	审查员引用的对比文件是否出现在检索结果中	3件中≥2件命中
权利要求技术特征完整度	AI生成的权利要求覆盖了授权文本中多少比例的技术特征	≥70%
权利要求上位概括合理性	1=过宽或过窄严重 3=基本合理 5=与授权文本水平相当	3分
权利要求格式规范性	1=格式混乱 3=基本规范有小问题 5=完全规范	4分
说明书完整性	五段式结构是否完整，内容是否充分	3分
整体可用性（代理师主观评价）	1=不如自己从头写 3=可作为初稿修改 5=几乎可直接使用	3分

验收标准（Go/No-Go 决策）

3 件案例全部完成手动 PoC 流程
每个环节的 Prompt 至少迭代 2 轮优化
"整体可用性"平均分 ≥ 3.0 → Go，继续后续开发
"整体可用性"平均分 < 3.0 → 暂停，分析原因，评估是否继续
每件案例的 PoC 记录文档已完成（含评分、问题分析、Prompt 版本记录）
产出"最佳 Prompt"版本（每个环节各一份），作为 Phase 5-6 的输入

交付物

3 份完整的 PoC 记录文档（含每个环节的评分和详细对比分析）
4 份"最佳 Prompt"：交底书解析 / 检索策略 / 权利要求生成 / 说明书生成
Go/No-Go 决策结论及理由

Phase 5

权利要求生成引擎开发

目标：将手动 PoC 中验证的权利要求生成能力工程化为可调用的后端服务。

前置依赖：Phase 4 Go 决策通过 + 最佳 Prompt 就绪

任务清单

5.1 实现交底书解析模块 开发
- 输入：用户上传的 Word/PDF 交底书文件
- 处理：文件解析（python-docx / PyPDF2）→ 文本提取 → LLM 结构化分析
- 输出：结构化 JSON（技术领域/技术问题/技术方案/区别特征/有益效果/缺失信息提示）
- 交互：如检测到信息不完整，生成"追问清单"返回给用户补充
5.2 实现权利要求生成模块 开发
- 输入：结构化技术方案 + 对比文件信息（可选）
- Prompt 组装：基础 Prompt + 知识库规则注入 + few-shot 示例 + 用户输入
- 生成策略：生成"宽/中/窄"三个版本的独立权利要求，供用户选择
- 输出：完整的权利要求书（方法+装置+介质+程序产品四套）
- 流式输出：支持边生成边展示（提升用户体验）
5.3 实现审核 Agent 模块 开发
用第二个 LLM 调用（建议用不同模型）对生成结果做自动审核：
- 客体适格性检查：是否存在被第25条/第2条驳回的风险
- 格式规范检查：两段式结构、引用关系、术语一致性
- 完整性检查：是否遗漏必要技术特征
- 输出：审核报告（通过/警告/不通过 + 具体问题说明）

5.4 编写 API 接口 开发

# 接口设计
POST /api/disclosure/parse     # 上传并解析交底书
POST /api/disclosure/supplement # 提交补充信息
POST /api/claims/generate      # 生成权利要求书
POST /api/claims/review        # 审核权利要求书
GET  /api/claims/{id}/versions # 获取宽/中/窄三个版本

5.5 用测试数据集做回归测试 开发代理师
用 Phase 1 数据集中的全部 12-15 件案例跑一遍权利要求生成，代理师评分。

验收标准

交底书上传后能在 30 秒内返回结构化分析结果
权利要求生成能在 60 秒内输出完整结果
审核 Agent 能识别出至少 80% 的已知格式问题
12-15 件案例的批量测试中，代理师"整体可用性"平均评分 ≥ 3.0
所有 API 接口正常工作，有错误处理

Phase 6

说明书生成引擎开发

目标：实现完整说明书（五段式）和摘要的自动生成。

前置依赖：Phase 5 权利要求生成引擎完成

任务清单

6.1 实现说明书生成模块 开发
输入：结构化技术方案 + 已生成的权利要求书。按以下五段分别生成：
- 技术领域：根据 IPC 分类号和技术方案自动生成（1段话）
- 背景技术：参考检索到的对比文件，概述现有技术及不足（2-3段）
- 发明内容：技术问题 + 技术方案概述 + 有益效果（与权利要求一致）
- 附图说明：根据后续生成的附图列表自动生成（如"图1是本发明方法的流程图"）
- 具体实施方式：至少 2-3 个实施例，详细描述技术方案的具体实现
6.2 实现摘要生成模块 开发
- 基于说明书和权利要求自动生成说明书摘要（≤300字）
- 摘要应概括：技术领域、技术方案要点、主要技术效果
6.3 实现"说明书支持权利要求"校验 开发
自动检查说明书内容是否支持权利要求的概括范围：
- 权利要求中的每个技术特征是否在说明书中有对应描述
- 独立权利要求的上位概括是否有足够的实施例支撑
- 输出：支持关系检查报告（特征覆盖率 + 未覆盖特征列表）
6.4 实现 Word 文档导出 开发
- 使用 python-docx 按 CNIPA CPC 客户端要求的格式输出 Word 文件
- 包含：权利要求书、说明书、摘要，分别或合并导出
- 格式要求：宋体、特定字号、段落间距、页边距等
6.5 用测试数据集做回归测试 开发代理师

验收标准

说明书五段式结构完整且内容充实
具体实施方式包含至少 2 个实施例
摘要 ≤ 300 字且涵盖三要素
支持关系校验能识别出遗漏的技术特征
导出的 Word 文件格式正确，可直接在 CPC 客户端打开

Phase 7

专利检索与创新性分析模块开发

目标：实现从技术方案自动构建检索式、执行检索、筛选对比文件、生成特征对比分析报告的完整流程。

前置依赖：Phase 2 Incopat API 封装完成 Phase 5 交底书解析模块完成

任务清单

7.1 实现检索式自动构建 开发
- 输入：结构化技术方案
- LLM 生成：关键词提取 → 同义词扩展 → IPC 分类号匹配 → 布尔检索式组装
- 输出：可直接执行的 Incopat 检索式（中文 + 英文各一组）
- 用户可编辑：生成后展示给用户，允许手动修改检索式后再执行
7.2 实现检索执行与结果处理 开发
- 调用 Incopat API 执行检索
- 结果去重、排序（按相关度）
- 获取 Top 20 结果的详细信息（摘要、权利要求、IPC）
7.3 实现对比文件智能筛选 开发
- 用 LLM 对 Top 20 结果做相关性评估
- 输出：Top 5 最接近的现有技术，每件附带相关度评分和匹配说明
7.4 实现技术特征对比分析 开发
- 将发明的技术特征与最接近现有技术逐条对比
- 输出特征对比表：共有特征 / 区别特征 / 现有技术中未涉及的特征
- 标注区别特征对应的权利要求条款
7.5 实现客体适格性初步评估 开发
- 基于知识库中的三条路径判断框架，评估技术方案走哪条路径最稳妥
- 输出：客体风险等级（低/中/高）+ 建议的论证路径 + 风险说明
- 如果风险为"高"，系统应生成明确警告提示用户

7.6 生成综合检索分析报告 开发

汇总以上各模块的输出，生成一份结构化报告：

检索分析报告
├── 检索策略（使用的检索式、检索数据库、检索日期）
├── 检索结果概览（总条数、相关文献数量）
├── Top 5 对比文件详情
├── 技术特征对比表
├── 客体适格性评估（风险等级 + 建议路径）
├── 新颖性初步判断（区别特征是否存在）
├── 创造性风险提示（区别特征是否"显而易见"— 标注为需人工判断）
└── 建议（是否建议继续申请 / 需要进一步人工检索的领域）

验收标准

自动生成的检索式可在 Incopat 中直接执行
用测试数据集验证：对比文件命中率 ≥ 60%（即 12 件中至少 8 件命中审查员引用的对比文件）
特征对比表内容准确、格式清晰
客体适格性评估结论与代理师判断一致率 ≥ 70%
综合报告可导出为 PDF

重要提示：检索分析报告中的创造性判断必须明确标注为"AI辅助参考，需代理师确认"。系统不应给出"可以申请"或"不可以申请"的绝对结论。

Phase 8

附图辅助生成模块开发

目标：实现流程图和系统架构图的自动生成，符合专利局附图规范。

任务清单

8.1 实现方法流程图自动生成 开发
- 输入：方法权利要求中的步骤列表
- LLM 解析步骤结构（顺序/分支/循环）→ 生成 Mermaid 语法 → 渲染 SVG
- 后处理：去除彩色 → 转黑白线条 → 添加步骤编号（S101, S102...）
- 输出：符合专利规范的黑白流程图（PNG 格式，300dpi）
8.2 实现系统架构图自动生成 开发
- 输入：装置权利要求中的模块列表及其连接关系
- LLM 解析模块关系 → 生成 Mermaid/Graphviz 语法 → 渲染
- 后处理：同上（黑白、标号）
- 输出：符合规范的系统架构框图
8.3 实现附图标号与说明书联动 开发
- 附图中的标号（如 101、102...）与说明书中的引用保持一致
- 自动生成"附图说明"段落（如"图1为本发明实施例提供的XX方法的流程示意图"）
- 自动选择摘要附图（默认选方法流程图作为摘要附图）
8.4 实现附图在线编辑功能 开发
自动生成的附图可能不完美，用户需要能微调：
- 提供基于 Mermaid 语法的在线编辑器（修改语法即可实时预览效果）
- 支持拖拽调整节点位置（如果技术上可行）
- 支持用户上传自己的附图替换自动生成的附图

验收标准

方法流程图：输入步骤列表后能生成清晰的黑白流程图
架构图：输入模块列表后能生成清晰的黑白框图
附图格式：黑白线条、无灰度、标号使用阿拉伯数字、分辨率 ≥ 300dpi
附图标号与说明书中的引用一致
用户可以编辑或替换附图

Phase 9

全流程串联与 Web 系统开发

目标：将 Phase 5-8 的各模块串联为完整工作流，开发 Web 前端界面，实现端到端的用户体验。

9A — 后端流程串联

9A.1 定义完整工作流 开发

用户上传交底书
  → 交底书解析（Phase 5.1）
  → [如信息不完整] 追问补充
  → 检索策略生成（Phase 7.1）
  → [用户确认/修改检索式]
  → 执行检索 + 对比分析（Phase 7.2-7.6）
  → [用户确认检索结果]
  → 客体适格性评估（Phase 7.5）
  → [如风险高] 警告用户并建议调整方案
  → 权利要求生成（Phase 5.2）
  → [用户选择宽/中/窄版本并编辑]
  → 说明书生成（Phase 6.1）
  → 摘要生成（Phase 6.2）
  → 附图生成（Phase 8.1-8.2）
  → 审核 Agent 校验（Phase 5.3）
  → [展示审核报告，用户确认]
  → 导出 Word 文件（Phase 6.4）

9A.2 实现项目管理数据模型 开发
- 每个专利申请作为一个"项目"，有唯一 ID
- 项目状态：草稿 → 解析完成 → 检索完成 → 撰写完成 → 审核完成 → 已导出
- 保存每个环节的中间结果，支持断点续做
- 版本管理：权利要求的每次编辑都保存历史版本
9A.3 实现用户管理 开发
- 基础角色：管理员 / 专利代理师 / 技术人员
- 权限区分：代理师可见所有功能；技术人员只能上传交底书和查看结果
- 登录认证：用户名密码 + 可选的企业 SSO 对接

9B — Web 前端开发

9B.1 页面结构设计 开发

系统共需以下页面：

页面	功能	关键交互
登录页	用户登录	—
项目列表页	查看所有专利申请项目	新建项目、筛选、搜索
交底书上传页	上传并确认解析结果	文件上传、解析结果展示、补充信息表单
检索分析页	查看和编辑检索策略、查看检索结果和对比分析	检索式编辑器、结果列表、对比文件详情、特征对比表
权利要求编辑页	查看AI生成的权利要求，选择版本，在线编辑	三版本切换、富文本编辑、审核结果侧栏
说明书编辑页	查看和编辑说明书各段	五段式分区编辑、与权利要求联动高亮
附图管理页	查看/编辑/上传附图	Mermaid编辑器、预览、上传替换
审核报告页	查看自动审核结果	问题清单、逐条处理、重新审核
导出页	导出最终文件	选择导出格式、一键下载

9B.2 核心交互设计要求 开发
- 步骤导航：左侧或顶部显示当前处于工作流的哪一步，可前后跳转
- 实时反馈：LLM 生成过程中显示流式输出（打字机效果）
- 在线编辑：权利要求和说明书页面提供富文本编辑器，用户可直接修改 AI 生成的内容
- 对比视图：权利要求编辑页可并排显示 AI 生成版本和用户修改版本
- 免责声明：每个生成结果页面底部都显示"AI 生成内容，仅供参考，请由持证代理师审核"
9B.3 实现所有页面 开发
按页面优先级开发：交底书上传页 → 权利要求编辑页 → 说明书编辑页 → 检索分析页 → 附图管理页 → 审核报告页 → 导出页 → 项目列表页 → 登录页

验收标准

完整工作流可从头到尾跑通（上传交底书 → 导出 Word 文件）
所有 9 个页面功能正常、布局合理
项目数据可持久化保存，断点续做正常
用户管理和权限控制正常
流式输出体验流畅（无明显卡顿）
所有生成结果页面包含免责声明

Phase 10

测试与质量保障

目标：通过系统性测试确保系统可靠、安全、输出质量达标。

任务清单

10.1 全量回归测试 开发代理师
用 Phase 1 的全部 12-15 件案例，从头到尾走一遍完整流程：
- 每件案例生成完整的五书（权利要求书+说明书+摘要+附图）
- 代理师对每件案例的输出做评分（使用 Phase 4 的评分表）
- 汇总评分，确认平均分达标
10.2 新案例测试 代理师
用 3-5 件不在数据集中的新交底书测试（避免"过拟合"）：
- 选择最近收到的真实技术交底书
- 用系统生成全套文件
- 代理师评估：与自己手动撰写的质量差距
10.3 边界条件测试 开发
- 上传格式异常的文件（扫描版 PDF、带密码的 Word、超大文件）
- 输入极简/极长的交底书
- 多用户同时操作
- 网络中断后恢复
- LLM API 超时/报错的降级处理
10.4 安全测试 开发
- 确认交底书内容不会泄露到外部（LLM API 调用的数据安全策略）
- 如使用国外 LLM API，需评估数据出境合规性
- 用户权限隔离：A 用户看不到 B 用户的项目
- 文件上传安全：防止恶意文件上传
10.5 内部试用（Beta） 全员
邀请 3-5 名公司内的专利代理师和技术人员试用 1-2 周：
- 每人至少用系统完成 2 件真实案例的撰写
- 收集使用反馈（功能缺失、体验问题、生成质量问题）
- 按优先级修复问题

验收标准

12-15 件数据集案例的平均"整体可用性"评分 ≥ 3.0
3-5 件新案例的评分 ≥ 2.5（新案例标准可略低）
边界条件测试全部通过（无崩溃、有友好的错误提示）
安全测试通过，数据隔离确认
Beta 试用用户的核心反馈已处理

关于数据安全的特别说明：技术交底书通常包含企业未公开的核心技术，数据安全至关重要。如果使用第三方 LLM API，需要：(1) 确认 API 提供商的数据处理协议（如 DeepSeek 的企业版承诺不使用用户数据训练模型）(2) 考虑是否需要部署私有化模型（成本更高但数据完全可控）(3) 在用户界面中明确告知数据处理方式。

Phase 11

部署上线与培训

目标：完成系统部署、用户培训和运营机制建立。

任务清单

11.1 生产环境部署 开发
- 在公司内网服务器上部署（Docker 容器化）
- 配置域名 / 内网地址
- 配置 HTTPS（即使内网也建议）
- 配置自动备份（数据库 + 用户上传文件）
- 配置监控告警（服务挂掉、API 余额不足等）
11.2 编写用户手册 开发你
两份手册：
- 专利代理师使用手册：完整功能说明 + 每个环节的最佳实践 + AI 输出的审核要点 + 常见问题
- 技术人员使用手册：交底书上传流程 + 如何补充信息 + 如何查看生成结果
11.3 组织培训 你
- 面向代理师：2小时培训 — 系统操作 + AI 输出审核要点 + 实操演练
- 面向技术人员：1小时培训 — 交底书上传和基本操作
- 录制培训视频供后续新员工学习
11.4 建立运营反馈机制 你
- 系统内置反馈按钮：用户可对每次生成结果评分和留言
- 每月汇总：使用量统计 + 用户评分趋势 + 高频问题
- 持续优化：根据反馈调整 Prompt、补充 few-shot 示例、更新知识库
11.5 建立知识库更新机制 代理师
- 每次《审查指南》修订后，更新规则知识库
- 每季度将新增的优秀案例加入 few-shot 示例库
- 收集审查意见答复经验，丰富"常见驳回模式"库

验收标准

系统在生产环境稳定运行 72 小时无故障
所有目标用户可正常登录和使用
两份用户手册已编写完成
培训已完成，参与率 ≥ 90%
反馈机制已建立并可收集到用户评分

附录 A：完整验收检查清单

以下是整个项目的终极验收清单。所有项目全部勾选 = 项目完成。

#	检查项	Phase	负责人
1	团队组建完毕，LLM API 和 Incopat API 均可用	0	你
2	12-15件标注完整的测试数据集	1	代理师
3	Incopat API 封装模块通过检索基准测试	2	开发
4	审查规则知识库通过代理师校验	3	代理师
5	手动PoC完成3件案例，平均分≥3.0，Go决策通过	4	全员
6	权利要求生成引擎通过回归测试（平均分≥3.0）	5	开发
7	说明书+摘要生成正常，Word导出格式正确	6	开发
8	检索+对比分析流程正常，对比文件命中率≥60%	7	开发
9	附图自动生成符合专利局规范	8	开发
10	完整工作流端到端跑通	9	开发
11	全量+新案例测试达标，安全测试通过	10	全员
12	Beta试用反馈已处理	10	开发
13	生产环境部署完成，稳定运行72小时	11	开发
14	用户手册+培训完成	11	你
15	运营反馈和知识库更新机制建立	11	你

附录 B：风险登记册

风险	影响	概率	缓解措施
AI生成的权利要求质量不达标	致命	中	Phase 4 手动PoC做Go/No-Go把关；降级为"辅助检索+格式工具"
Incopat API 能力不足或费用过高	高	低	Phase 2 提前验证；准备 Espacenet/Google Patents 备选方案
技术交底书数据通过LLM API外传	致命	低	选择有数据协议的企业版API；评估私有化部署方案
审查指南修订导致规则变化	中	中	Phase 11 建立知识库更新机制，关注CNIPA公告
用户过度依赖AI输出不做审核	高	中	强制审核流程（代理师必须点"确认已审核"才能导出）；界面免责声明
LLM 模型升级导致输出质量波动	中	中	锁定模型版本号；每次升级前用数据集做回归测试

附录 C：关键决策记录

以下决策已在需求分析阶段确定，开发过程中如需变更，必须经项目负责人确认。

决策项	决定	理由
目标用户	代理师 + 企业技术人员双覆盖	代理师用于提效，技术人员用于降低门槛
专利类型	仅中国发明专利	审查最严格但价值最高，实用新型可后期扩展
技术领域	聚焦软件/互联网/AI	附图相对标准化，权利要求句式相对固定，可行性更高
数据库	Incopat（合享新创）	已有商业合同
产品定位	辅助工具（非替代代理师）	法律合规 + 质量风控
附图方案	系统辅助生成（流程图/架构图为主）	软件领域附图以流程图为主，自动化可行性高
部署方式	公司内网私有部署	数据安全要求