AI 专利撰写辅助系统

完整项目工作指南 — 从概念验证到上线运营
版本 1.0 | 2026-04-29 | 面向:项目负责人 / 开发团队 / 专利代理师
项目概况

项目目标

开发一个 Web 端的 AI 专利撰写辅助系统,供公司内部专利代理师和企业技术人员使用。系统覆盖从技术交底书解析、专利检索、创新性分析到五书(权利要求书、说明书、摘要、说明书附图、摘要附图)生成的完整流程。聚焦软件/互联网/AI 领域的中国发明专利。

核心原则

底线原则:系统定位为"辅助工具"而非"替代代理师"。所有输出必须经过有资质的专利代理师审核后才能提交。系统界面中必须有明确的免责声明和人工审核提示。

你需要的团队

角色人数职责何时需要
项目负责人(你)1 统筹协调、验收把关、业务决策、提供专利案例全程
资深专利代理师1-2 提供测试数据集、标注案例、评审 AI 输出质量、编写审查规则知识库、撰写 prompt 中的专业内容Phase 1-6 密集参与,后续持续评审
全栈开发工程师1-2 后端 API、前端 Web 界面、LLM 集成、数据库Phase 2 起
AI/NLP 工程师1 Prompt 工程、LLM 调优、检索策略算法、输出质量评估Phase 4 起

最小团队配置:你 + 1 名资深代理师 + 1 名全栈工程师(兼 AI 工程)= 3 人。

项目阶段总览

阶段性质关键产出决策点
Phase 0-1准备团队到位、数据集就绪
Phase 2-4概念验证API 通了、知识库建了、手动跑通了Go/No-Go 决策点:手动 PoC 结果是否达标
Phase 5-8核心开发四大引擎逐个开发并验证每个引擎独立验收
Phase 9-10集成测试完整系统可用内测通过
Phase 11上线部署 + 培训 + 运营正式发布
推荐技术选型

以下技术选型面向你的开发工程师。你不需要理解细节,但需要知道选择的理由,以便在招聘或外包时评估候选人。

层面推荐方案选择理由
LLM 主力模型DeepSeek-V3 / Qwen-Max
(通过 API 调用,非本地部署)
中文法律/技术文本能力强,成本可控,支持长上下文
LLM 审核模型Claude / GPT-4o
(作为第二意见)
用不同模型做交叉审核,降低单一模型的偏差风险
后端框架Python + FastAPIAI/NLP 生态成熟,异步支持好,适合 LLM 流式输出
前端框架React + Next.js组件化开发、SSR 支持、生态丰富
数据库PostgreSQL + Redis结构化数据 + 缓存/队列
文件存储MinIO 或阿里云 OSS存储交底书、生成的文件、附图等
文档生成python-docx按 CNIPA 模板生成 Word 文件
附图生成Mermaid → SVG → 后处理流程图/架构图的自动化生成
专利检索Incopat API你已有的商业数据库
部署Docker + 内网服务器公司内部使用,数据安全可控
Phase 0
项目准备
目标:团队到位、开发环境就绪、所有外部依赖确认。

任务清单

  • 0.1 组建团队
    按照上方团队配置招募/指定人员。如果采用外包开发,需要选择有 AI 应用开发经验的团队,并签署保密协议(涉及企业技术交底书等敏感资料)。
  • 0.2 开通 LLM API 账号 开发
    注册并开通以下 API 服务(按优先级):
    • DeepSeek 开放平台(deepseek.com)— 申请 API Key,充值测试额度
    • 阿里云 DashScope(Qwen 模型)— 开通并获取 API Key
    • Anthropic Claude API 或 OpenAI API — 用于审核模型(二选一)
  • 0.3 确认 Incopat API 权限
    联系合享新创商务/技术支持,确认以下事项并获取 API 文档:
    • 当前合同是否包含 API 调用权限(很多企业合同只含网页端)
    • 如不包含,询问 API 模块的单独采购价格和开通流程
    • 获取 API 技术文档(接口地址、认证方式、请求格式、返回字段)
    • 确认 API 支持的检索方式:布尔检索、IPC 分类号、全文检索、语义检索
    • 确认返回数据字段:摘要、权利要求、全文、法律状态、引用文献
    • 确认调用频率限制(QPS)和月调用量上限
    • 申请测试/沙盒环境
  • 0.4 搭建开发环境 开发
    • 准备一台内网服务器(推荐配置:8核 CPU / 32GB 内存 / 500GB SSD)
    • 安装 Docker、Git、Python 3.11+、Node.js 20+
    • 搭建代码仓库(GitLab 私有仓库或其他内网 Git 服务)
    • 创建项目目录结构(后续 Phase 会细化)
  • 0.5 准备《专利审查指南》原文 代理师
    获取以下文件的电子版(PDF 或 Word),作为知识库构建的原始材料:
    • 《专利审查指南》2024年1月20日施行版 — 完整版
    • 重点章节:第二部分第二章(权利要求撰写)、第三章(说明书撰写)、第九章(计算机程序发明)
    • CNIPA 官网发布的审查指南修改解读文件(2020年版、2024年版)

验收标准

  • 团队人员全部到位并明确分工
  • 至少 2 个 LLM API 可正常调用(能发送请求并收到回复)
  • 收到 Incopat API 技术文档,明确了 API 能力边界
  • 开发服务器可访问,Git 仓库已创建
  • 《审查指南》相关章节电子版已收集齐

交付物

  • 团队通讯录与分工表
  • 各 API 的 Key / 账号信息(加密存储)
  • Incopat API 技术文档(含能力确认清单)
  • 开发环境验证截图
Phase 1
测试数据集构建
目标:整理 12-15 件已授权软件/AI 领域中国发明专利案例,作为后续所有环节的评测基准。

任务清单

  • 1.1 从案件库中初筛候选案例 代理师
    从你们代理过的案子中筛选 20-25 件候选,筛选条件:
    • 已获得中国发明专利授权(有 B 文本)
    • 技术领域属于软件/互联网/AI
    • 有原始技术交底书
    • 代理师对案件记忆清晰(能回忆撰写思路)
  • 1.2 按多样性标准精选 12-15 件 代理师
    从候选中精选,确保覆盖以下维度:
    • 权利要求主题:方法类 5 件 + 装置类 3 件 + 混合类 4 件
    • 技术子领域:至少覆盖 3 个(如 NLP、CV、推荐系统、数据处理、安全)
    • 复杂度:简单(≤8条权利要求)4 件 + 中等(8-15条)5 件 + 复杂(>15条)3 件
    • 审查过程:一次授权 5 件 + 经过 OA 的 7 件
  • 1.3 整理每件案例的完整材料 代理师
    为每件案例建立标准化文件夹,命名规则:序号_技术关键词
    01_图像去噪CNN/
    ├── 交底书原文.docx            # 原始技术交底书
    ├── 授权公告文本.pdf           # 最终授权的完整文件
    ├── 申请公开文本.pdf           # 首次公开的文件(如与授权有差异)
    ├── OA/                        # 审查意见及答复(如有)
    │   ├── OA1_审查意见.pdf
    │   ├── OA1_答复.pdf
    │   └── ...
    └── 案例标注.md                # 代理师手动填写的标注
  • 1.4 填写案例标注 代理师
    这是整个数据集中最有价值的部分。每件案例的标注模板如下:
    ## 基本信息
    - 专利号:CN XXXXXXXXX B
    - 技术领域:自然语言处理
    - IPC 分类号:G06F 40/XX
    - 交底书质量评分:4/5(5为非常详细完整)
    
    ## 核心技术方案(2-3句话概括)
    本发明提出一种基于XXX的文本分类方法...
    
    ## 权利要求结构分析
    - 独立权利要求数量:4(方法1+装置1+介质1+设备1)
    - 权利要求总条数:15
    - 关键上位概括点:
      - "特征提取模块"概括了CNN/RNN/Transformer三种具体实现
      - "分类策略"概括了softmax和SVM两种具体分类器
    - 概括策略说明:因交底书中给出了多种实现方式,故做了上位概括
    
    ## 审查过程(有OA的案子必填)
    - OA次数:2
    - OA1 驳回理由:创造性(引用对比文件CN XXXXXXX A + US XXXXXXX A1)
    - OA1 答复策略:补入从属权利要求的技术特征到独立权利要求
    - OA2 驳回理由:权利要求不清楚(步骤S3描述模糊)
    - OA2 答复策略:明确步骤S3的具体数据处理方式
    
    ## 对比文件
    - 最接近现有技术:CN 2019XXXXXXX A(技术主题最相关)
    - 区别技术特征:本发明增加了XXX步骤,实现了XXX效果
    
    ## 代理师复盘
    - 撰写难点:上位概括的尺度难把握,最终OA后被迫缩小
    - 改进建议:如果重写,独立权利要求应直接限定XXX
  • 1.5 数据集自检 代理师
    检查最终数据集的完整性和多样性:
    • 制作一个汇总表,列出所有案例的编号、领域、复杂度、是否有OA
    • 确认各维度的覆盖是否均衡,如有明显缺失则从候选列表中补充
    • 确认所有标注已填写完整

验收标准

  • 12-15 件案例全部整理完毕,文件结构符合标准
  • 每件案例的"案例标注.md"已由代理师填写完整
  • 多样性覆盖:至少 3 个技术子领域 × 3 个复杂度级别 × 有/无 OA
  • 汇总表已制作,可一览全部案例的分布情况
Phase 2
Incopat API 对接验证
目标:完成 Incopat API 的技术对接,验证检索能力是否满足需求。
前置依赖:Phase 0.3 Incopat API 文档已获取

任务清单

  • 2.1 API 基础联通测试 开发
    编写测试脚本,验证 API 的基本调用能力:
    • 认证:使用 API Key / Token 成功认证
    • 简单查询:用一个已知专利号(如 CN XXXXXXXXX B)查询,验证返回数据
    • 关键词检索:用"图像识别 AND 卷积神经网络"检索,验证返回结果
    • IPC 分类号检索:用 G06F18/24 检索,验证结果
    • 组合检索:关键词 + IPC 分类号的布尔组合
  • 2.2 返回字段验证 开发
    确认 API 返回数据是否包含以下必需字段:
    • 【必需】专利号、标题、摘要、IPC 分类号、申请日、公开日
    • 【必需】权利要求书全文
    • 【必需】法律状态(授权/驳回/撤回/有效/无效)
    • 【强烈建议】说明书全文
    • 【强烈建议】引用/被引用文献列表
    • 【建议】发明人、申请人信息
  • 2.3 检索能力基准测试 开发 代理师
    从 Phase 1 数据集中选 3 件有 OA 的案例,进行以下测试:
    • 代理师根据案例的技术方案,编写一组检索式
    • 用该检索式通过 API 执行检索
    • 核心验证:返回结果中是否包含审查员在 OA 中引用的对比文件
    • 记录:检索结果总条数、Top 20 中的相关文献数量、对比文件是否命中
  • 2.4 编写 API 封装模块 开发
    基于测试结果,封装一个可复用的 Python 模块:
    # patent_search/incopat_client.py
    
    class IncopatClient:
        def search_by_keywords(self, keywords, ipc_codes=None, date_range=None) -> list
        def search_by_boolean(self, query_string) -> list
        def get_patent_detail(self, patent_number) -> dict
        def get_patent_claims(self, patent_number) -> str
        def get_patent_fulltext(self, patent_number) -> str
        def get_legal_status(self, patent_number) -> dict
        def get_citations(self, patent_number) -> list
  • 2.5 编写 API 能力评估报告 开发
    记录所有测试结果,输出一份简要报告,包含:
    • API 支持的检索方式及语法
    • 返回字段清单(标注哪些可用、哪些缺失)
    • 3 件案例的检索基准测试结果
    • 发现的问题和限制(如有)
    • 是否需要补充其他数据源(如 Google Patents、Espacenet)

验收标准

  • API 基础调用全部通过(认证、检索、详情查询)
  • 返回字段中"必需"项全部可用
  • 3 件案例的检索测试中,至少 2 件命中了审查员引用的对比文件
  • API 封装模块代码可运行,接口清晰
  • 能力评估报告已输出
如果验收不通过:如果 Incopat API 不支持关键能力(如不返回权利要求全文),需要评估:(1) 是否有更高级别的 API 套餐可升级 (2) 是否用 Espacenet Open Patent Services(免费)补充中国以外的数据 (3) 是否需要更换数据库供应商。此决策由你与开发团队共同做出。
Phase 3
审查规则知识库构建
目标:将《审查指南》的关键条款结构化为机器可读的知识库,作为 Prompt 和审核引擎的基础。
前置依赖:Phase 0.5 审查指南原文已获取

任务清单

  • 3.1 校验已有知识库初稿 代理师
    本项目已提供了一份第九章结构化知识库初稿(JSON 格式,含 11 条审查规则、5 种权利要求模板、14 个审查示例、6 种常见驳回模式、13 项审核检查清单)。代理师需要:
    • 逐条对照《审查指南》2024 年施行版原文,校验每条规则的准确性
    • 补充遗漏的重要规则(特别是第二部分第二章、第三章的通用撰写规范)
    • 校验审查示例的编号、标题、结论是否与原文一致
    • 标注任何需要修改或补充的内容
  • 3.2 补充第二部分第二章(权利要求通用规范) 代理师
    从第二部分第二章提取以下规则并结构化:
    • 独立权利要求的"前序部分 + 特征部分"两段式要求(第3.1.2节)
    • 从属权利要求的引用方式(第3.1.3节)
    • 权利要求中的技术术语一致性要求
    • 功能性限定的使用规则和限制
    • 权利要求"以说明书为依据并得到说明书支持"的要求(专利法第26条第4款)
    • 权利要求"清楚、简要"的要求
  • 3.3 补充第二部分第三章(说明书通用规范) 代理师
    从第二部分第三章提取以下规则并结构化:
    • 说明书五段式结构要求:技术领域、背景技术、发明内容、附图说明、具体实施方式
    • 各段的具体内容要求和撰写规范
    • "充分公开"要求(专利法第26条第3款)——说明书使本领域技术人员能够实现
    • 背景技术中引用现有技术的规范
    • 具体实施方式的详细程度要求
    • 摘要的撰写规范(300字以内)
    • 附图的制图规范(黑白线条、标号规则)
  • 3.4 整合为完整知识库文件 开发 代理师
    将代理师校验和补充的内容合并到 JSON 知识库中,确保格式一致。最终知识库应包含:
    • 第九章规则(已有,校验后) — 客体判断 + 创造性审查 + 撰写规范
    • 第二章规则(新增) — 权利要求通用撰写规范
    • 第三章规则(新增) — 说明书通用撰写规范
    • 审查示例库(已有,校验后)
    • 常见驳回模式(已有,可由代理师补充更多实战经验)
    • 自动审核检查清单(已有,根据新增规则扩展)

验收标准

  • 知识库 JSON 文件通过代理师逐条校验,无事实性错误
  • 知识库覆盖三大章节:第二章(权利要求)、第三章(说明书)、第九章(计算机程序)
  • 审查示例不少于 14 个,且每个示例含 lesson_for_ai 字段
  • 审核检查清单不少于 15 项,覆盖客体、格式、内容三个维度
Phase 4
手动 PoC 验证
目标:用纯手动方式(人 + LLM 对话)跑通完整流程 3 次,验证核心假设,产出 Prompt 初稿。
前置依赖:Phase 1 数据集就绪   Phase 2 Incopat API 可用   Phase 3 知识库初版完成
这是整个项目的 Go/No-Go 决策点。如果手动 PoC 的结果显示 AI 生成的权利要求质量无法达到"可用初稿"水平(评分低于 3/5),需要重新评估项目可行性或调整产品定位(如降为"辅助检索+格式生成"工具,不做核心权利要求生成)。

任务清单

  • 4.1 选择 3 件案例 代理师
    从 Phase 1 数据集中选择:1 件简单 + 1 件中等 + 1 件复杂。优先选有 OA 的案子。
  • 4.2 设计并测试"交底书解析"Prompt 代理师
    对每件案例执行以下操作:
    • 将技术交底书全文粘贴到 LLM 对话框(推荐 DeepSeek Chat 或 Claude)
    • 使用以下 Prompt(根据实际效果迭代调整):
    你是一位在中国执业超过10年的资深专利代理师,专注软件和AI领域。
    请分析以下技术交底书,提取并结构化以下信息:
    
    1. 技术领域(对应 IPC 分类号)
    2. 背景技术及现有技术的缺陷
    3. 要解决的技术问题
    4. 核心技术方案(逐步骤或逐模块描述)
    5. 与现有技术的关键区别特征
    6. 有益效果
    7. 可能的实施例变体
    
    重要要求:
    - 如果交底书中某些信息不完整或不清楚,明确列出缺失项并说明其重要性
    - 对技术方案的描述要具体到可以直接用于撰写权利要求的程度
    - 识别可能存在的客体适格性风险(是否可能被认为属于智力活动规则和方法)
    
    ===技术交底书===
    [粘贴全文]
    • 对比:将 LLM 输出与代理师实际的理解做逐项对比
    • 记录:正确提取的要素数 / 遗漏的要素 / 错误的要素 / Prompt 改进想法
  • 4.3 设计并测试"检索策略生成"Prompt 代理师
    • 使用 Step 4.2 的输出作为输入,让 LLM 生成检索策略
    • 在 Incopat 中实际执行 LLM 生成的检索式
    • 核心验证:检索结果是否包含审查员在 OA 中引用的对比文件
    • 记录:检索式是否可直接执行 / 结果条数 / Top20相关率 / 对比文件命中情况
  • 4.4 设计并测试"权利要求生成"Prompt(最关键) 代理师
    这是核心验证。Prompt 中应注入知识库中的关键规则:
    你是一位在中国执业超过10年的资深专利代理师,专注软件/AI领域。
    请根据以下技术方案和检索结果,撰写一份符合中国《专利法》及
    《专利审查指南》(2024年施行版)要求的权利要求书。
    
    ## 撰写规则(必须严格遵守)
    
    1. 独立权利要求采用"前序部分 + 特征部分"两段式写法
    2. 方法独立权利要求格式:
       "一种[技术目的]的方法,其特征在于,包括以下步骤:..."
    3. 装置独立权利要求格式:
       "一种[技术目的]的装置,包括存储器、处理器及存储在存储器上
        的计算机程序,其特征在于,所述处理器执行所述计算机程序以
        实现权利要求X所述方法的步骤。"
    4. 必须同时撰写:方法权利要求 + 装置权利要求 + 存储介质权利要求
       + 计算机程序产品权利要求
    5. 独立权利要求应做适当上位概括,但不超出说明书支持范围
    6. 从属权利要求按技术特征的重要性递进细化
    7. 算法步骤中的数据参数必须具有确切技术含义
    8. 确保技术方案满足客体适格性要求(非纯算法/纯商业规则)
    
    ## 技术方案
    [粘贴 Step 4.2 的结构化输出]
    
    ## 最接近的现有技术
    [粘贴从检索中找到的最相关对比文件的摘要和权利要求]
    
    ## 参考示例(以下是一个优秀的软件领域权利要求书示例)
    [从数据集中选一件优秀案例的授权权利要求作为 few-shot 示例]
    • 核心对比:将 AI 生成的权利要求与实际授权的权利要求做逐条对比
    • 评估维度见下方评分表
  • 4.5 设计并测试"说明书生成"Prompt 代理师
    • 在 Prompt 中提供生成的权利要求和技术方案,要求按五段式输出完整说明书
    • 对比 AI 输出的说明书与实际授权说明书的结构、内容、详细程度
  • 4.6 综合评估与决策 代理师
    汇总 3 件案例的所有评估数据,使用以下评分体系:
评估维度评分标准(1-5分)最低可接受
交底书解析准确性1=大量遗漏错误 3=基本准确有少量遗漏 5=完全准确3分
检索式可执行性1=完全不可用 3=需少量修改后可用 5=直接可执行3分
对比文件命中率审查员引用的对比文件是否出现在检索结果中3件中≥2件命中
权利要求技术特征完整度AI生成的权利要求覆盖了授权文本中多少比例的技术特征≥70%
权利要求上位概括合理性1=过宽或过窄严重 3=基本合理 5=与授权文本水平相当3分
权利要求格式规范性1=格式混乱 3=基本规范有小问题 5=完全规范4分
说明书完整性五段式结构是否完整,内容是否充分3分
整体可用性(代理师主观评价)1=不如自己从头写 3=可作为初稿修改 5=几乎可直接使用3分

验收标准(Go/No-Go 决策)

  • 3 件案例全部完成手动 PoC 流程
  • 每个环节的 Prompt 至少迭代 2 轮优化
  • "整体可用性"平均分 ≥ 3.0 → Go,继续后续开发
  • "整体可用性"平均分 < 3.0 → 暂停,分析原因,评估是否继续
  • 每件案例的 PoC 记录文档已完成(含评分、问题分析、Prompt 版本记录)
  • 产出"最佳 Prompt"版本(每个环节各一份),作为 Phase 5-6 的输入

交付物

  • 3 份完整的 PoC 记录文档(含每个环节的评分和详细对比分析)
  • 4 份"最佳 Prompt":交底书解析 / 检索策略 / 权利要求生成 / 说明书生成
  • Go/No-Go 决策结论及理由
Phase 5
权利要求生成引擎开发
目标:将手动 PoC 中验证的权利要求生成能力工程化为可调用的后端服务。
前置依赖:Phase 4 Go 决策通过 + 最佳 Prompt 就绪

任务清单

  • 5.1 实现交底书解析模块 开发
    • 输入:用户上传的 Word/PDF 交底书文件
    • 处理:文件解析(python-docx / PyPDF2)→ 文本提取 → LLM 结构化分析
    • 输出:结构化 JSON(技术领域/技术问题/技术方案/区别特征/有益效果/缺失信息提示)
    • 交互:如检测到信息不完整,生成"追问清单"返回给用户补充
  • 5.2 实现权利要求生成模块 开发
    • 输入:结构化技术方案 + 对比文件信息(可选)
    • Prompt 组装:基础 Prompt + 知识库规则注入 + few-shot 示例 + 用户输入
    • 生成策略:生成"宽/中/窄"三个版本的独立权利要求,供用户选择
    • 输出:完整的权利要求书(方法+装置+介质+程序产品四套)
    • 流式输出:支持边生成边展示(提升用户体验)
  • 5.3 实现审核 Agent 模块 开发
    用第二个 LLM 调用(建议用不同模型)对生成结果做自动审核:
    • 客体适格性检查:是否存在被第25条/第2条驳回的风险
    • 格式规范检查:两段式结构、引用关系、术语一致性
    • 完整性检查:是否遗漏必要技术特征
    • 输出:审核报告(通过/警告/不通过 + 具体问题说明)
  • 5.4 编写 API 接口 开发
    # 接口设计
    POST /api/disclosure/parse     # 上传并解析交底书
    POST /api/disclosure/supplement # 提交补充信息
    POST /api/claims/generate      # 生成权利要求书
    POST /api/claims/review        # 审核权利要求书
    GET  /api/claims/{id}/versions # 获取宽/中/窄三个版本
  • 5.5 用测试数据集做回归测试 开发 代理师
    用 Phase 1 数据集中的全部 12-15 件案例跑一遍权利要求生成,代理师评分。

验收标准

  • 交底书上传后能在 30 秒内返回结构化分析结果
  • 权利要求生成能在 60 秒内输出完整结果
  • 审核 Agent 能识别出至少 80% 的已知格式问题
  • 12-15 件案例的批量测试中,代理师"整体可用性"平均评分 ≥ 3.0
  • 所有 API 接口正常工作,有错误处理
Phase 6
说明书生成引擎开发
目标:实现完整说明书(五段式)和摘要的自动生成。
前置依赖:Phase 5 权利要求生成引擎完成

任务清单

  • 6.1 实现说明书生成模块 开发
    输入:结构化技术方案 + 已生成的权利要求书。按以下五段分别生成:
    • 技术领域:根据 IPC 分类号和技术方案自动生成(1段话)
    • 背景技术:参考检索到的对比文件,概述现有技术及不足(2-3段)
    • 发明内容:技术问题 + 技术方案概述 + 有益效果(与权利要求一致)
    • 附图说明:根据后续生成的附图列表自动生成(如"图1是本发明方法的流程图")
    • 具体实施方式:至少 2-3 个实施例,详细描述技术方案的具体实现
  • 6.2 实现摘要生成模块 开发
    • 基于说明书和权利要求自动生成说明书摘要(≤300字)
    • 摘要应概括:技术领域、技术方案要点、主要技术效果
  • 6.3 实现"说明书支持权利要求"校验 开发
    自动检查说明书内容是否支持权利要求的概括范围:
    • 权利要求中的每个技术特征是否在说明书中有对应描述
    • 独立权利要求的上位概括是否有足够的实施例支撑
    • 输出:支持关系检查报告(特征覆盖率 + 未覆盖特征列表)
  • 6.4 实现 Word 文档导出 开发
    • 使用 python-docx 按 CNIPA CPC 客户端要求的格式输出 Word 文件
    • 包含:权利要求书、说明书、摘要,分别或合并导出
    • 格式要求:宋体、特定字号、段落间距、页边距等
  • 6.5 用测试数据集做回归测试 开发 代理师

验收标准

  • 说明书五段式结构完整且内容充实
  • 具体实施方式包含至少 2 个实施例
  • 摘要 ≤ 300 字且涵盖三要素
  • 支持关系校验能识别出遗漏的技术特征
  • 导出的 Word 文件格式正确,可直接在 CPC 客户端打开
Phase 7
专利检索与创新性分析模块开发
目标:实现从技术方案自动构建检索式、执行检索、筛选对比文件、生成特征对比分析报告的完整流程。
前置依赖:Phase 2 Incopat API 封装完成   Phase 5 交底书解析模块完成

任务清单

  • 7.1 实现检索式自动构建 开发
    • 输入:结构化技术方案
    • LLM 生成:关键词提取 → 同义词扩展 → IPC 分类号匹配 → 布尔检索式组装
    • 输出:可直接执行的 Incopat 检索式(中文 + 英文各一组)
    • 用户可编辑:生成后展示给用户,允许手动修改检索式后再执行
  • 7.2 实现检索执行与结果处理 开发
    • 调用 Incopat API 执行检索
    • 结果去重、排序(按相关度)
    • 获取 Top 20 结果的详细信息(摘要、权利要求、IPC)
  • 7.3 实现对比文件智能筛选 开发
    • 用 LLM 对 Top 20 结果做相关性评估
    • 输出:Top 5 最接近的现有技术,每件附带相关度评分和匹配说明
  • 7.4 实现技术特征对比分析 开发
    • 将发明的技术特征与最接近现有技术逐条对比
    • 输出特征对比表:共有特征 / 区别特征 / 现有技术中未涉及的特征
    • 标注区别特征对应的权利要求条款
  • 7.5 实现客体适格性初步评估 开发
    • 基于知识库中的三条路径判断框架,评估技术方案走哪条路径最稳妥
    • 输出:客体风险等级(低/中/高)+ 建议的论证路径 + 风险说明
    • 如果风险为"高",系统应生成明确警告提示用户
  • 7.6 生成综合检索分析报告 开发
    汇总以上各模块的输出,生成一份结构化报告:
    检索分析报告
    ├── 检索策略(使用的检索式、检索数据库、检索日期)
    ├── 检索结果概览(总条数、相关文献数量)
    ├── Top 5 对比文件详情
    ├── 技术特征对比表
    ├── 客体适格性评估(风险等级 + 建议路径)
    ├── 新颖性初步判断(区别特征是否存在)
    ├── 创造性风险提示(区别特征是否"显而易见"— 标注为需人工判断)
    └── 建议(是否建议继续申请 / 需要进一步人工检索的领域)

验收标准

  • 自动生成的检索式可在 Incopat 中直接执行
  • 用测试数据集验证:对比文件命中率 ≥ 60%(即 12 件中至少 8 件命中审查员引用的对比文件)
  • 特征对比表内容准确、格式清晰
  • 客体适格性评估结论与代理师判断一致率 ≥ 70%
  • 综合报告可导出为 PDF
重要提示:检索分析报告中的创造性判断必须明确标注为"AI辅助参考,需代理师确认"。系统不应给出"可以申请"或"不可以申请"的绝对结论。
Phase 8
附图辅助生成模块开发
目标:实现流程图和系统架构图的自动生成,符合专利局附图规范。

任务清单

  • 8.1 实现方法流程图自动生成 开发
    • 输入:方法权利要求中的步骤列表
    • LLM 解析步骤结构(顺序/分支/循环)→ 生成 Mermaid 语法 → 渲染 SVG
    • 后处理:去除彩色 → 转黑白线条 → 添加步骤编号(S101, S102...)
    • 输出:符合专利规范的黑白流程图(PNG 格式,300dpi)
  • 8.2 实现系统架构图自动生成 开发
    • 输入:装置权利要求中的模块列表及其连接关系
    • LLM 解析模块关系 → 生成 Mermaid/Graphviz 语法 → 渲染
    • 后处理:同上(黑白、标号)
    • 输出:符合规范的系统架构框图
  • 8.3 实现附图标号与说明书联动 开发
    • 附图中的标号(如 101、102...)与说明书中的引用保持一致
    • 自动生成"附图说明"段落(如"图1为本发明实施例提供的XX方法的流程示意图")
    • 自动选择摘要附图(默认选方法流程图作为摘要附图)
  • 8.4 实现附图在线编辑功能 开发
    自动生成的附图可能不完美,用户需要能微调:
    • 提供基于 Mermaid 语法的在线编辑器(修改语法即可实时预览效果)
    • 支持拖拽调整节点位置(如果技术上可行)
    • 支持用户上传自己的附图替换自动生成的附图

验收标准

  • 方法流程图:输入步骤列表后能生成清晰的黑白流程图
  • 架构图:输入模块列表后能生成清晰的黑白框图
  • 附图格式:黑白线条、无灰度、标号使用阿拉伯数字、分辨率 ≥ 300dpi
  • 附图标号与说明书中的引用一致
  • 用户可以编辑或替换附图
Phase 9
全流程串联与 Web 系统开发
目标:将 Phase 5-8 的各模块串联为完整工作流,开发 Web 前端界面,实现端到端的用户体验。

9A — 后端流程串联

  • 9A.1 定义完整工作流 开发
    用户上传交底书
      → 交底书解析(Phase 5.1)
      → [如信息不完整] 追问补充
      → 检索策略生成(Phase 7.1)
      → [用户确认/修改检索式]
      → 执行检索 + 对比分析(Phase 7.2-7.6)
      → [用户确认检索结果]
      → 客体适格性评估(Phase 7.5)
      → [如风险高] 警告用户并建议调整方案
      → 权利要求生成(Phase 5.2)
      → [用户选择宽/中/窄版本并编辑]
      → 说明书生成(Phase 6.1)
      → 摘要生成(Phase 6.2)
      → 附图生成(Phase 8.1-8.2)
      → 审核 Agent 校验(Phase 5.3)
      → [展示审核报告,用户确认]
      → 导出 Word 文件(Phase 6.4)
  • 9A.2 实现项目管理数据模型 开发
    • 每个专利申请作为一个"项目",有唯一 ID
    • 项目状态:草稿 → 解析完成 → 检索完成 → 撰写完成 → 审核完成 → 已导出
    • 保存每个环节的中间结果,支持断点续做
    • 版本管理:权利要求的每次编辑都保存历史版本
  • 9A.3 实现用户管理 开发
    • 基础角色:管理员 / 专利代理师 / 技术人员
    • 权限区分:代理师可见所有功能;技术人员只能上传交底书和查看结果
    • 登录认证:用户名密码 + 可选的企业 SSO 对接

9B — Web 前端开发

  • 9B.1 页面结构设计 开发
    系统共需以下页面:
    页面功能关键交互
    登录页用户登录
    项目列表页查看所有专利申请项目新建项目、筛选、搜索
    交底书上传页上传并确认解析结果文件上传、解析结果展示、补充信息表单
    检索分析页查看和编辑检索策略、查看检索结果和对比分析检索式编辑器、结果列表、对比文件详情、特征对比表
    权利要求编辑页查看AI生成的权利要求,选择版本,在线编辑三版本切换、富文本编辑、审核结果侧栏
    说明书编辑页查看和编辑说明书各段五段式分区编辑、与权利要求联动高亮
    附图管理页查看/编辑/上传附图Mermaid编辑器、预览、上传替换
    审核报告页查看自动审核结果问题清单、逐条处理、重新审核
    导出页导出最终文件选择导出格式、一键下载
  • 9B.2 核心交互设计要求 开发
    • 步骤导航:左侧或顶部显示当前处于工作流的哪一步,可前后跳转
    • 实时反馈:LLM 生成过程中显示流式输出(打字机效果)
    • 在线编辑:权利要求和说明书页面提供富文本编辑器,用户可直接修改 AI 生成的内容
    • 对比视图:权利要求编辑页可并排显示 AI 生成版本和用户修改版本
    • 免责声明:每个生成结果页面底部都显示"AI 生成内容,仅供参考,请由持证代理师审核"
  • 9B.3 实现所有页面 开发
    按页面优先级开发:交底书上传页 → 权利要求编辑页 → 说明书编辑页 → 检索分析页 → 附图管理页 → 审核报告页 → 导出页 → 项目列表页 → 登录页

验收标准

  • 完整工作流可从头到尾跑通(上传交底书 → 导出 Word 文件)
  • 所有 9 个页面功能正常、布局合理
  • 项目数据可持久化保存,断点续做正常
  • 用户管理和权限控制正常
  • 流式输出体验流畅(无明显卡顿)
  • 所有生成结果页面包含免责声明
Phase 10
测试与质量保障
目标:通过系统性测试确保系统可靠、安全、输出质量达标。

任务清单

  • 10.1 全量回归测试 开发 代理师
    用 Phase 1 的全部 12-15 件案例,从头到尾走一遍完整流程:
    • 每件案例生成完整的五书(权利要求书+说明书+摘要+附图)
    • 代理师对每件案例的输出做评分(使用 Phase 4 的评分表)
    • 汇总评分,确认平均分达标
  • 10.2 新案例测试 代理师
    用 3-5 件不在数据集中的新交底书测试(避免"过拟合"):
    • 选择最近收到的真实技术交底书
    • 用系统生成全套文件
    • 代理师评估:与自己手动撰写的质量差距
  • 10.3 边界条件测试 开发
    • 上传格式异常的文件(扫描版 PDF、带密码的 Word、超大文件)
    • 输入极简/极长的交底书
    • 多用户同时操作
    • 网络中断后恢复
    • LLM API 超时/报错的降级处理
  • 10.4 安全测试 开发
    • 确认交底书内容不会泄露到外部(LLM API 调用的数据安全策略)
    • 如使用国外 LLM API,需评估数据出境合规性
    • 用户权限隔离:A 用户看不到 B 用户的项目
    • 文件上传安全:防止恶意文件上传
  • 10.5 内部试用(Beta) 全员
    邀请 3-5 名公司内的专利代理师和技术人员试用 1-2 周:
    • 每人至少用系统完成 2 件真实案例的撰写
    • 收集使用反馈(功能缺失、体验问题、生成质量问题)
    • 按优先级修复问题

验收标准

  • 12-15 件数据集案例的平均"整体可用性"评分 ≥ 3.0
  • 3-5 件新案例的评分 ≥ 2.5(新案例标准可略低)
  • 边界条件测试全部通过(无崩溃、有友好的错误提示)
  • 安全测试通过,数据隔离确认
  • Beta 试用用户的核心反馈已处理
关于数据安全的特别说明:技术交底书通常包含企业未公开的核心技术,数据安全至关重要。如果使用第三方 LLM API,需要:(1) 确认 API 提供商的数据处理协议(如 DeepSeek 的企业版承诺不使用用户数据训练模型)(2) 考虑是否需要部署私有化模型(成本更高但数据完全可控)(3) 在用户界面中明确告知数据处理方式。
Phase 11
部署上线与培训
目标:完成系统部署、用户培训和运营机制建立。

任务清单

  • 11.1 生产环境部署 开发
    • 在公司内网服务器上部署(Docker 容器化)
    • 配置域名 / 内网地址
    • 配置 HTTPS(即使内网也建议)
    • 配置自动备份(数据库 + 用户上传文件)
    • 配置监控告警(服务挂掉、API 余额不足等)
  • 11.2 编写用户手册 开发
    两份手册:
    • 专利代理师使用手册:完整功能说明 + 每个环节的最佳实践 + AI 输出的审核要点 + 常见问题
    • 技术人员使用手册:交底书上传流程 + 如何补充信息 + 如何查看生成结果
  • 11.3 组织培训
    • 面向代理师:2小时培训 — 系统操作 + AI 输出审核要点 + 实操演练
    • 面向技术人员:1小时培训 — 交底书上传和基本操作
    • 录制培训视频供后续新员工学习
  • 11.4 建立运营反馈机制
    • 系统内置反馈按钮:用户可对每次生成结果评分和留言
    • 每月汇总:使用量统计 + 用户评分趋势 + 高频问题
    • 持续优化:根据反馈调整 Prompt、补充 few-shot 示例、更新知识库
  • 11.5 建立知识库更新机制 代理师
    • 每次《审查指南》修订后,更新规则知识库
    • 每季度将新增的优秀案例加入 few-shot 示例库
    • 收集审查意见答复经验,丰富"常见驳回模式"库

验收标准

  • 系统在生产环境稳定运行 72 小时无故障
  • 所有目标用户可正常登录和使用
  • 两份用户手册已编写完成
  • 培训已完成,参与率 ≥ 90%
  • 反馈机制已建立并可收集到用户评分

附录 A:完整验收检查清单

以下是整个项目的终极验收清单。所有项目全部勾选 = 项目完成。

#检查项Phase负责人
1团队组建完毕,LLM API 和 Incopat API 均可用0
212-15件标注完整的测试数据集1代理师
3Incopat API 封装模块通过检索基准测试2开发
4审查规则知识库通过代理师校验3代理师
5手动PoC完成3件案例,平均分≥3.0,Go决策通过4全员
6权利要求生成引擎通过回归测试(平均分≥3.0)5开发
7说明书+摘要生成正常,Word导出格式正确6开发
8检索+对比分析流程正常,对比文件命中率≥60%7开发
9附图自动生成符合专利局规范8开发
10完整工作流端到端跑通9开发
11全量+新案例测试达标,安全测试通过10全员
12Beta试用反馈已处理10开发
13生产环境部署完成,稳定运行72小时11开发
14用户手册+培训完成11
15运营反馈和知识库更新机制建立11

附录 B:风险登记册

风险影响概率缓解措施
AI生成的权利要求质量不达标致命 Phase 4 手动PoC做Go/No-Go把关;降级为"辅助检索+格式工具"
Incopat API 能力不足或费用过高 Phase 2 提前验证;准备 Espacenet/Google Patents 备选方案
技术交底书数据通过LLM API外传致命 选择有数据协议的企业版API;评估私有化部署方案
审查指南修订导致规则变化 Phase 11 建立知识库更新机制,关注CNIPA公告
用户过度依赖AI输出不做审核 强制审核流程(代理师必须点"确认已审核"才能导出);界面免责声明
LLM 模型升级导致输出质量波动 锁定模型版本号;每次升级前用数据集做回归测试

附录 C:关键决策记录

以下决策已在需求分析阶段确定,开发过程中如需变更,必须经项目负责人确认。

决策项决定理由
目标用户代理师 + 企业技术人员双覆盖代理师用于提效,技术人员用于降低门槛
专利类型仅中国发明专利审查最严格但价值最高,实用新型可后期扩展
技术领域聚焦软件/互联网/AI附图相对标准化,权利要求句式相对固定,可行性更高
数据库Incopat(合享新创)已有商业合同
产品定位辅助工具(非替代代理师)法律合规 + 质量风控
附图方案系统辅助生成(流程图/架构图为主)软件领域附图以流程图为主,自动化可行性高
部署方式公司内网私有部署数据安全要求