douyin-works-crawler

Skill file

Preview skill file
---
name: douyin-works-crawler
description: 抖音作品爬取工具,输入抖音名称或抖音ID,输出抖音账号基础信息和近期作品内容列表(最多50条)。当用户提到"爬取抖音作品"、"抖音作品列表"、"查看抖音视频"、"抖音内容采集"、"抓取抖音作品"时使用。
---

# 抖音作品爬取

> 输入抖音名称或ID,一键获取账号基础信息 + 近期作品内容

---

## 简介

抖音作品爬取是一款专为抖音内容分析打造的智能工具,帮助用户快速获取任意抖音账号的基础信息和近期作品数据。

通过简单的账号名称或抖音号输入,你可以:
- 📊 获取账号基础信息(粉丝数、获赞、作品总数、红狐指数等)
- 📋 查看近期作品列表(最多50条,含互动数据和作品链接)
- 🔍 发现互动TOP3作品,获取值得学习的内容分析
- 📥 未收录账号支持一键提交收录,30分钟后自动同步

适用于品牌方、MCN机构、内容运营、自媒体从业者等需要分析抖音账号表现的场景。

---

## 功能特性

### 🎯 核心功能

- **📊 账号信息查询**:输入抖音昵称或抖音号,一键获取账号基础数据(粉丝数、获赞、作品总数、红狐指数等)
- **📋 近期作品爬取**:自动获取近期作品列表(最多50条),包含点赞、评论、分享、互动数及作品链接
- **🔍 数据亮点分析**:互动量TOP3作品分析 + 账号特征分析(更新频率、互动表现、爆款特征)

### ✨ 特色亮点

- **⚡ 智能识别**:自动判断输入类型(昵称/抖音号),无需手动切换查询模式
- **📥 账号收录**:未收录账号支持一键提交收录,30分钟后自动同步数据
- **🔗 直达链接**:昵称跳转账号主页,作品列表跳转视频页面
- **🔒 安全可靠**:API 接入方式,无需登录抖音账号

---

## 一键安装

### 前置条件

- Python 3.6+
- 红狐数据API密钥(格式 `ak_xxx`)

### 安装方式

#### 方式一:直接使用(推荐)

1. 确保项目文件已下载到本地
2. 配置环境变量:
   ```bash
   # macOS/Linux
   export REDFOX_API_KEY=你的API密钥值

   # Windows PowerShell
   $env:REDFOX_API_KEY="你的API密钥值"
   ```
3. 运行查询:
   ```bash
   python scripts/douyin_works_fetcher.py --account "抖音名称或抖音号"
   ```

#### 方式二:在 Coze/Dify 等平台配置

1. 将技能文件夹上传至平台
2. 在环境变量中配置 `REDFOX_API_KEY`
3. 配置触发词,即可通过对话调用

### 环境变量配置

| 变量名 | 必填 | 说明 |
|--------|------|------|
| `REDFOX_API_KEY` | 是 | 红狐数据API密钥(格式 `ak_xxx`) |

---

## 使用指南

### 基础使用

#### 1. 查询账号作品

告诉助手你想查询的抖音账号:

> 用户:爬取"周幺姑家常菜"的抖音作品
>
> 助手:已为您查询到「周幺姑家常菜」的账号数据,粉丝547.1w,近期47条作品...

#### 2. 精准查询(推荐)

使用抖音号进行精准查询,避免昵称模糊匹配:

> 用户:帮我查询抖音号 cdjjc028 的作品
>
> 助手:已精准匹配到「周幺姑家常菜」的账号数据...

#### 3. 账号收录

当账号未被收录时,回复抖音号即可提交收录:

> 用户:帮我查询"xxx"的作品
>
> 助手:未查询到当前账号的相关信息,可提交当前抖音账号进行账号收录。1. 回复抖音号...2. 下次再说;
>
> 用户:1212_1234
>
> 助手:已提交账号收录请求,系统正在同步数据,约30分钟后可再次查询。

### 高级使用

#### 4. 导出JSON格式

需要结构化数据时,可指定JSON输出:

```bash
python scripts/douyin_works_fetcher.py --account "抖音号" --output json
```

#### 5. 命令行直接提交收录

```bash
python scripts/douyin_works_fetcher.py --account "任意" --sync "抖音号"
```

### 命令速查

| 命令 | 功能 |
|------|------|
| `爬取抖音作品 [名称/抖音号]` | 查询账号作品数据 |
| `抖音作品列表 [名称/抖音号]` | 获取近期作品列表 |
| `抖音内容采集 [名称/抖音号]` | 采集账号内容 |
| `导出抖音作品 [名称/抖音号]` | 导出作品数据 |
| 回复抖音号 | 提交账号收录(未命中时) |

---

## 使用场景

### 场景一:品牌方竞品监测

**角色**:品牌营销经理

**需求**:监测竞品抖音账号的内容表现和互动数据

**使用方式**:
1. 输入竞品账号的抖音号进行查询
2. 查看近期作品列表和互动数据
3. 分析互动TOP3作品的内容特征

**预期收益**:及时掌握竞品内容动态,优化自身内容策略

---

### 场景二:MCN 机构达人评估

**角色**:MCN 运营人员

**需求**:评估达人账号的数据表现和内容方向

**使用方式**:
1. 查询目标达人的账号基础信息(粉丝数、获赞、红狐指数)
2. 分析近期作品的互动表现
3. 查看账号特征分析,了解更新频率和内容方向

**预期收益**:快速评估达人价值,辅助签约决策

---

### 场景三:自媒体内容优化

**角色**:抖音内容创作者

**需求**:学习同领域头部账号的爆款内容特征

**使用方式**:
1. 查询同领域头部账号的作品数据
2. 查看互动TOP3作品的分析
3. 学习爆款内容值得借鉴的点

**预期收益**:找到内容优化方向,提升账号互动表现

---

### 场景四:数据分析报告

**角色**:数据分析师

**需求**:批量获取抖音账号的结构化数据用于分析

**使用方式**:
1. 使用 `--output json` 参数导出结构化数据
2. 批量查询多个账号
3. 结合其他数据进行综合分析

**预期收益**:高效获取数据,支撑分析报告输出

---

## 项目架构

### 目录结构

```
douyin-works-crawler/
├── scripts/
│   └── douyin_works_fetcher.py   # 核心脚本(API调用+数据格式化)
├── references/
│   └── core_workflow.md          # 核心技能逻辑(接口规范、输出模板、处理规则)
├── CONFIG.json                   # 技能配置文件
└── SKILL.md                      # 技能说明文档
```

### 技术栈

| 项目 | 说明 |
|------|------|
| 运行环境 | Python 3.6+ |
| 数据来源 | 红狐数据API |
| 认证方式 | API Key(X-API-KEY请求头) |
| 输出格式 | Markdown / JSON |


### 核心模块说明

- **DouyinWorksFetcher**:核心类,封装查询和收录两大功能
  - `query_account()`:查询账号信息和作品列表
  - `sync_account()`:提交账号收录请求
  - `format_markdown()` / `format_json()`:输出格式化

> 📌 **完整的接口规范、输出模板、处理规则等核心逻辑详见 [references/core_workflow.md](references/core_workflow.md)**,Agent 执行时必须遵循该文件中的所有规则。

---

## 常见问答

### 安装相关问题

**Q1: 运行时提示"未设置环境变量 REDFOX_API_KEY"怎么办?**

A: 请先配置环境变量:
```bash
# macOS/Linux
export REDFOX_API_KEY=你的API密钥值

# Windows PowerShell
$env:REDFOX_API_KEY="你的API密钥值"
```

**Q2: 红狐数据API密钥如何获取?**

A: 前往红狐平台注册并申请API密钥,格式为 `ak_xxx`。

---

### 使用相关问题

**Q3: 用昵称查询返回的不是我要找的账号怎么办?**

A: 抖音昵称不唯一,建议使用抖音号进行精准查询。抖音号在抖音APP → 目标账号主页 → 昵称下方查看。

**Q4: 为什么有些账号查不到?**

A: 可能该账号尚未被红狐平台收录。查询未命中时会提示账号收录,回复抖音号即可提交收录,约30分钟后可再次查询。

**Q5: 作品列表最多显示多少条?**

A: 近期作品数据最多50条,按发布时间倒序排列。`awemeCount` 字段为账号历史作品总数,作品列表中的数量可能小于该值。

---

### 故障排除

**Q6: API调用报错"积分不足"怎么办?**

A: 红狐API按调用次数计费,请前往红狐平台充值积分。

**Q7: 查询超时怎么办?**

A: 请检查网络连接是否正常,脚本默认超时时间为30秒。如持续超时,可稍后重试。

---

### 版本信息

- **当前版本:** v2.3
- **v2.3更新:** 新增账号收录功能;未查询到账号时输出收录提示;新增数据亮点模块(互动量TOP3+账号特征分析);数据来源描述统一为"红狐数据API"
- **v2.2更新:** 数字格式规范(万→w,≥1亿用亿,<1万千分位);链接列格式固定为`[链接](url)`/`-`
- **v2.1更新:** 接口新增url字段,支持作品直达链接输出
- **v2.0更新:** 切换至 `/dyData/queryUserWithWorks` 接口,支持近期作品数据爬取
- **v1.0更新:** 初始版本

Source

Creator's repository · redfox-data/redfox-community

View on GitHub

Security

Security checks in progress
Results will appear here once audits complete
Checked by 3 independent security firms
Does it try to trick the AI?Not yet checkedPending · Gen Agent Trust Hub
Does it sneak in hidden code?Not yet checkedPending · Socket
Does it have known bugs?Not yet checkedPending · Snyk