---
name: sumeru-finalize
description: 小说完稿校验与导出,适用于用户说"小说写完了帮我检查下"、"导出适合起点/番茄的格式"、"查有没有错别字"、"检测敏感词"、"整理成发布版本"、"帮我导出小说发布格式"、"检查小说错别字"、"敏感词检测"、"小说完稿检查"、"适配起点格式导出"、"番茄小说格式导出"、"小说排版整理"、"多平台格式导出"等需求,负责全技术性文字校验(错别字、标点、语法错误)与合规检查,导出适配各平台的发布格式,**批量处理时使用子Agent并行校验,每个Agent最多负责3个章节**
type: skill
---
## 网文完稿校验
### 触发关键词
小说写完了帮我检查下、导出适合起点/番茄的格式、查有没有错别字、检测敏感词、整理成发布版本、帮我导出小说发布格式、检查小说错别字、敏感词检测、小说完稿检查、适配起点格式导出、番茄小说格式导出、小说排版整理、多平台格式导出、小说完稿导出
### 核心功能
1. 错别字、标点符号、语法错误检查
2. 敏感内容、违规内容排查
3. 格式规范统一:章节标题、段落格式、标点规范
4. 全文字数统计、完稿报告生成
5. 适配不同平台发布格式导出
6. 批量替换功能
7. 自动分段功能
> **Skill 边界说明**:技术性文字校验(错别字/标点/语法)由本 Skill 负责,`sumeru-polish` Skill 专注于文笔和内容层面的优化,两者互补不重叠。用户在润色后仍应通过 finalize 进行最终技术校验。
### 子Agent并行校验机制
当需要校验/导出的章节数量大于3章时,自动启用子Agent并行处理模式:
**⚠️ 遵循全局约束:每个子Agent最多负责3个章节**(详见 AGENTS.md "子Agent并行处理规则")
- 所需Agent数 = ceil(总章节数 / 3)
- 相邻章节分配给同一Agent,保持格式处理一致性
**调度逻辑**
```mermaid
flowchart LR
A[批量校验任务] --> B[读取章节列表与校验配置]
B --> C[创建任务队列,按每Agent最多3章分配]
C --> D[计算所需Agent数 = ceil/总章数/3/]
D --> E[启动N个并行子agent]
E --> F[子Agent拉取任务 → 校验章节 → 生成错误报告 → 导出格式]
F --> G{队列是否为空?}
G -->|否| F
G -->|是| H[汇总校验结果,合并错误报告,生成完稿报告]
```
**章节分配规则**
- 按章节顺序连续分配(如Agent1负责第1-3章,Agent2负责第4-6章)
- 尾部不足3章的Agent按实际剩余章节数分配
**每个子Agent的校验范围**
- 错别字、标点、语法错误检查
- 敏感词检测(按三级标准)
- 格式规范统一
- 对应平台格式导出
### 输出内容
- 错误列表:错别字、标点错误、语法问题
- 敏感内容提示:需要调整的违规内容
- 校验后的纯净版全文
- 完稿报告:总字数、章节数、核心内容摘要
- 多平台发布格式版本(起点、番茄、晋江等)
### 各平台导出格式规则
#### 起点中文网(qidian)
- 章节标题格式:`第X章 标题内容`,居中对齐
- 段落首行缩进2字符
- 每段空一行
- 标点符号使用中文全角
- 章节字数建议3000-5000字
- 禁止使用特殊符号作为章节标题
- 对话单独成段
#### 番茄小说(fanqie)
- 章节标题格式:`第X章 标题内容`
- 段落首行不缩进,段落间空一行
- 每句尽量简短,适合移动端阅读
- 章节字数建议2000-3000字
- 重点内容可使用加粗标记
- 对话使用引号包裹,说话人单独成段或句尾注明
#### 晋江文学城(jjwxc)
- 章节标题格式:`第X章 标题内容`
- 支持HTML格式标签
- 段落首行缩进2字符
- 章节字数建议2500-4000字
- 作者有话要说区域单独设置
- 支持章节提要
#### 纵横中文网(zongheng)
- 章节标题格式:`第X章 标题内容`
- 段落首行缩进2字符
- 章节字数建议3000-6000字
- 支持分卷设置
- 标点规范使用中文全角
#### 17K小说网(17k)
- 章节标题格式:`第X章 标题内容`
- 段落首行缩进2字符
- 章节字数建议2000-4000字
- 支持章节预览
- 每章结束可设置下章预告
### 敏感词检测标准
#### 一级敏感(必须修改)
- 违反国家法律法规的内容
- 涉及政治敏感人物、事件
- 色情、淫秽描写
- 暴力、恐怖内容
- 分裂国家、破坏民族团结言论
- 宗教极端内容
#### 二级敏感(建议修改)
- 过于血腥暴力的细节描写
- 低俗用语、粗口
- 可能引起不适的医疗描写
- 涉及未成年人的不当内容
- 赌博、毒品相关描写
- 侵犯他人隐私的内容
#### 三级敏感(优化建议)
- 网络用语过多影响阅读
- 容易产生歧义的表述
- 可能引起争议的话题
- 过度使用网络热梗
- 重复冗余的表述
### 错误分级提示
#### 严重错误(红色标记)
- 错别字导致语义完全改变
- 敏感词一级违规内容
- 章节标题格式完全不符合规范
- 段落结构严重混乱
- 标点符号大面积错误
#### 中等错误(黄色标记)
- 一般错别字
- 标点符号使用不规范
- 敏感词二级内容
- 段落格式不统一
- 语法错误影响理解
#### 轻微错误(蓝色标记)
- 建议优化的用词
- 标点符号使用可以更规范
- 敏感词三级内容
- 段落排版可进一步美化
- 重复性表述建议
### 批量替换功能说明
#### 功能特性
- 支持全局批量替换指定词汇
- 支持正则表达式替换
- 支持替换前预览确认
- 支持多组替换规则同时执行
- 支持替换历史记录查询
#### 使用场景
1. 角色名统一修改
2. 地名、设定名称批量调整
3. 敏感词批量替换
4. 标点符号统一规范
5. 网络用语批量转换
#### 操作方式
- 预设规则:选择常用替换规则模板
- 自定义规则:手动输入查找内容和替换内容
- 正则模式:使用正则表达式进行复杂匹配
- 确认替换:查看替换预览后确认执行
### 自动分段功能说明
#### 功能特性
- 智能识别对话与叙述内容
- 根据句子长度自动分段
- 支持自定义分段字数阈值
- 保持段落逻辑完整性
- 对话自动单独成段
#### 分段规则
1. 对话优先:对话内容自动单独成段
2. 字数控制:单段建议100-300字
3. 逻辑完整:避免在句子中间分段
4. 场景切换:场景转换时自动分段
5. 心理活动:大段心理描写适当分段
#### 可配置参数
- 最大段落字数(默认300字)
- 最小段落字数(默认50字)
- 是否强制对话单独成段
- 是否在场景切换时加分隔线
- 是否保留原有分段结构
### 数据持久化
完稿数据自动保存到 `.sumeru/finalize/` 目录:
- `clean/full-text.md`:校验后的纯净版全文
- `clean/chapters/`:按章节拆分的纯净版文件
- `error-report.json`:错误列表,含错别字、标点、敏感词等所有问题
- `stats.json`:完稿统计报告,总字数、章节数、平均章节长度等
- `export-config.json`:各平台导出配置参数
**用户可见输出(当前工作目录)**:
- `publish/`:各平台导出版本,按平台名分类存放
#### 与其他 Skill 配合
- **前置 Skill**:读取最终章节内容
- 默认从 `chapters/` 读取最新章节内容(review 修复和 polish 润色直接修改 chapters/,无需额外操作)
#### 数据复用
- 可随时重新导出其他平台格式,无需重新校验
- 错误报告可作为后续写作的规避参考
- 支持增量导出,修改部分章节后仅重新生成对应章节的平台版本
Creator's repository · xindoo/sumeru