laohan-shencha

Best for: <UNKNOWN>
Product / discoveryatomicno-setup
Skill file

Preview skill file↓↑
---
name: laohan-shencha
version: 1.0
description: 深度联网审查技术文档和部署方案，联网验证事实准确性、参数正确性、版本兼容性。Use when 用户说"深度审查""老韩审查""联网审查""技术文档审查"或要求对技术方案/部署脚本/配置文件进行事实核查。不适合纯文字审查或非技术文档。
---

# Laohan Shencha（老韩深度审查）

## 核心原则

LLM 写技术文档时天然相信自己写的声明是对的。本 skill 的唯一目的：**找出并修正那些"看起来正确但实际是错的"声明。**

纯文字审查（表述矛盾、格式不统一）不是本 skill 的重点——那些靠文本比对就能发现。

**分级抽样（声明超 50 条时启用，节省 token）：** 高可信（官方 README 复制、环境变量名）→ 抽检 20%；中可信（版本号、参数值）→ 抽检 50%；低/未知可信（社区讨论、博客引用）→ 全部验证。声明数 ≤50 条时，逐条全量验证。常识性声明（如"PyTorch 是深度学习框架"）始终跳过。

## 五阶段审查流程

### 阶段 1：扫描 — 提取可验证声明

读取工作区所有相关文件，提取以下类型的声明：

**文件范围选择：** 优先扫描可执行脚本（.py/.sh/.ps1）、配置文件（.json/.yaml/.toml）、项目文档（README.md/workflows/）。纯散文/日记/日志类文件跳过。文件超 20 个时优先脚本+配置类。

**声明提取模式：**

- **GitHub 仓库**：`github\.com/[\w.-]+/[\w.-]+` → `github.com/xxx/yyy`
- **版本号**：`v?\d+\.\d+(\.\d+)*(?:-[.\w]+)?` → `PyTorch 2.7.1`
- **参数值**：`"?\w+"?\s*[:=]\s*"?[^\s,;"]+"?` → `blocks_to_swap=10`, `port: 3000`
- **API 端点**：`https?://[^\s]+\bapi[^\s]+` → `https://api.example.com/v1/chat`
- **CLI 命令**：`(?:^|[\s]+)(docker|npm|pip|python|git|curl|cargo|go)\s[^\n]+` → `docker compose up -d`
- **环境变量**：`\b[A-Z_]{3,}\b`（仅 .env/.sh/配置文件激活）→ `OPENAI_API_KEY`
- **文件路径**：`(?:/[\w.-]+)+/?` → `/etc/nginx/conf.d/`, `~/.config/`
- **端口号**：`:\d{2,5}(?:/\w+)?` → `:18789`, `:3000/api`
- **Docker 标签**：`[\w.-]+:[\w][\w.-]*` → `python:3.11-slim`
- **硬件需求**：`\d+\s*(GB|MB|GiB|MiB)\s*(VRAM|RAM|显存)` → `16GB VRAM`
- **文件大小**：`(?:~|大约|约|about)?\s*\d+\s*(KB|MB|GB|TB)` → `~10GB`
- **pip 安装**：`(?:pip3?|python\s+-m\s+pip|uv\s+pip)\s+install\s+\S+` → `pip install xxx`
- **npm 包**：`"(@?[\w@./-]+)":\s*"([^"]+)"` → `"next": "^14.2.0"`
- **CVE 编号**：`CVE-\d{4}-\d{4,}` → `CVE-2024-1234`
- **浏览器兼容**：`(Chrome|Safari|Firefox|Edge)\s*\d+` → `Chrome 90+`
- **git clone**：`git\s+clone\s+(?:--depth\s+\d+\s+)?\S+` → `git clone --depth 1 https://...`

**可执行脚本中的外部资源引用自动提升一个严重度等级。** 脚本（.ps1/.py/.sh）里的文件名、URL、仓库 ID 写错会直接导致运行失败，比文档中的同名错误严重得多。

输出：按文件分组的声明清单，标注每条的验证方法和优先级。

### 阶段 2：联网验证 — 逐条查证

对每条声明使用对应验证方法。**必须实际查询，不能凭训练知识判断。**

验证工具优先级：
1. `gh repo view` / `gh api` — GitHub 仓库可用性，`gh api repos/{o}/{r}/releases/latest` 查最新发布
2. Web search — 官方文档、社区报告
3. Context7 — 库/框架的最新文档（注意 API 限流）
4. `curl -I {url}` — 快速检查 URL 可达性（HEAD 请求优先）
5. `npm view {pkg}` / `pip index versions {pkg}` / `brew info {fmla}` — 包管理器验证
6. Docker Hub API / HuggingFace API / PyPI JSON API — 镜像和模型验证
7. `gh auth status` — 先检查认证状态，再决定是否设 GH_TOKEN

**并行化：** 独立的验证项用多个 Agent 并行跑，不要串行。

**API 频率限制处理：**
- GitHub API 未认证：60 req/hr。设置 `GH_TOKEN` 或 `GITHUB_TOKEN` 环境变量可获得 5000 req/hr。
- HuggingFace API：`https://huggingface.co/api/models/{user}/{repo}` 查看模型信息，`/tree/main` 查看文件列表。
- PyPI API：`https://pypi.org/pypi/{package}/json` 获取版本信息。

**源冲突解决优先级：** 官方文档 > GitHub README > 官方 Wiki > 社区讨论 > 博客文章。当源冲突时，以优先级高的为准，在报告中注明冲突详情。

### 阶段 3：交叉比对 — 文档间一致性

检查同一参数/描述在不同文件中的表述是否一致：

- 数值参数（节点数、VRAM、版本号）
- 仓库 URL 和安装命令
- 硬件需求描述
- 步骤/流程描述

### 阶段 3.5：确认 — 向用户展示发现

CRITICAL 发现必须经用户确认后才能修复。HIGH 发现若超过 3 个，或任一修复会改动超过 5 行，也需确认。MEDIUM/LOW 自动修复，汇总报告。确认格式：

```
### 发现 #1 [CRITICAL]
文件：xxx.py:42  原：`pip instal torch`  应为：`pip install torch`
证据：PyPI 官方文档 https://pypi.org/project/torch/
是否修复？[Y/n]（拒绝时标为"用户否决"，不修复但保留在报告中）
```

### 阶段 4：修复 — 逐项修正

按严重度排序修复。每个严重度锚定到可检验的后果：

| 严重度 | 定义 | 示例 |
|-------|------|------|
| CRITICAL | 可证明会导致崩溃或异常 | 仓库不存在、命令语法错误、NameError |
| HIGH | 可证明会导致错误输出/行为 | 参数值错误、VRAM 估算偏差 >20% |
| MEDIUM | 信息不正确但不会改变系统行为 | 版本号过时、失效链接（若无人点击） |
| LOW | 功能正确但表述不精确 | 措辞不统一、格式差异 |

### 阶段 5：出报告

输出格式：

```
## 审查报告

### 统计
- 总声明数：X
- 已验证：X
- 有问题：X（CRITICAL: X / HIGH: X / MEDIUM: X / LOW: X）
- 已修复：X

### 发现的问题
| 文件 | 行 | 原值 | 应为 | 证据来源 | 严重度 | 状态 |
|------|-----|------|------|---------|--------|------|
| ... | ... | ... | ... | ... | ... | 已修/待定/用户否决 |

### 仍需实际验证的项
（需要实际运行环境才能确认的项目）
```

## 关键注意事项

1. **不信任训练知识**：即使是"常识性"的参数值，也要联网验证。模型训练数据有时效性。
2. **验证仓库可用性**：仓库被删除/私有化/改名（如 `user/repo` 突然 404）只有实际查询才能发现，静态分析检测不到。
3. **参数值查官方源**：blocks_to_swap 的推荐值、VRAM 需求，以官方 README/文档为准，不以博客为准。
4. **跨文档同步**：修了一处参数，必须检查所有引用该参数的文件是否也需要更新。
5. **标注不确定项**：无法通过网络验证的（如需要实际硬件测试），在报告中明确标注。
6. **迭代审查**：阶段 4 修复完成后，回到阶段 1 重新扫描修复过的文件，确认修复没有引入新错误。最多迭代 2 轮。
7. **Token 预算管理**：单次审查总 token 预算建议 200K。文件超 30 个时分批审查，每批 ≤15 个文件。声明超 50 条时，按严重度排序，优先验证脚本和配置文件中的声明。
8. **时间限制**：每条声明最多 3 次验证查询。每批声明最多 5 分钟工具调用墙钟时间。超过 80% token 使用量时停止验证，报告部分结果。若 10 分钟内未发现 CRITICAL/HIGH，输出"未发现严重问题"并跳过剩余 LOW 验证。

## 适用项目类型

本 skill 是**外部资源验证器**，不是代码审查器。它验证 URL、版本号、包名、文件路径等可联网查证的外部声明。**无法检测**：未定义变量、类型错误、逻辑缺陷、缺少导入等代码级 bug。

适用场景：
- AI 模型部署方案（ComfyUI、LoRA 训练、推理服务）
- 基础设施配置（Docker、K8s、CI/CD）
- 依赖版本密集的技术项目
- 多文档维护的项目（指南 + 脚本 + 工作流）
- Web 应用后端、移动应用、数据库架构等任何引用外部资源的技术项目

## 审查反模式（不应标记为问题）

以下场景在特定项目环境中是**正常的**，不应标记：
1. **包管理器版本命名空间差异**：brew/apt/pip/npm 各有独立版本号体系，同一个工具在不同包管理器中版本号不同是正常的，不要交叉对比标记"过时"。
2. **平台/环境特定参数**：某些 CLI 参数依赖本地环境（如浏览器 cookie、硬件特定 flag），在其他 OS 上不可用是设计如此，不是错误。
3. **故意使用 shell=True**：某些脚本为了路径展开必须用 `shell=True`，不是安全漏洞。结合上下文判断而非机械标记。
4. **私有/内部包**：内部 npm/pip/cargo 包可能无法在公共注册表中查到，标记为"未公开"而非"不存在"。
5. **文档化的已知问题**：代码注释或文档中已标注"404"/"暂停"/"已废弃"/"TODO"的条目是有意记录，不是待修复的错误。
6. **长时间操作的大超时设置**：音视频处理、大文件下载等操作的超时设置（如 300s+）是必要的，不要按常规 RPC 标准"优化"缩短。
7. **平台特定标准路径**：各 OS 有标准安装路径（macOS `/opt/homebrew`、Linux `/usr/local`、Windows `C:\Program Files`），不应交叉标记。
8. **区域镜像/代理**：`pypi.tuna.tsinghua.edu.cn`、`ghproxy.com` 等是合法镜像，不应标记为"非官方"。
Source

Creator's repository · hanzhcn/laohan-skills
View on GitHub ↗
Security

Security checks in progress
Results will appear here once audits complete
What this skill can do
Reads your filesConnects to the internetRuns code on your machine
Checked by 3 independent security firms
Does it try to trick the AI?Not yet checkedPending · Gen Agent Trust Hub
Does it sneak in hidden code?Not yet checkedPending · Socket
Does it have known bugs?Not yet checkedPending · Snyk