统一图片内容提取技能。智能识别终端/文档/通用模式,自动提取内容生成Markdown。
统一图片内容提取技能,集成terminal-ocr功能,支持智能模式检测,自动提取内容并生成Markdown格式。
终端模式(Terminal) - 专门处理终端/命令行截图
文档模式(Document) - 专门处理文档截图
通用模式(General) - 适用于各种类型图片
# 自动检测模式(推荐)
python3 scripts/extract.py /path/to/image.png
# 指定模式
python3 scripts/extract.py /path/to/terminal.png --mode terminal
python3 scripts/extract.py /path/to/document.png --mode document
python3 scripts/extract.py /path/to/image.png --mode general
# 保存到文件
python3 scripts/extract.py /path/to/image.png -o output.md
# 保存到知识库
python3 scripts/extract.py /path/to/image.png \
-k -c testing -t "测试用例设计"
# 详细输出
python3 scripts/extract.py /path/to/image.png -v
# 批量处理整个目录
python3 scripts/extract.py /path/to/images/ \
--batch \
-k -c knowledge
# 指定模式批量处理
python3 scripts/extract.py /path/to/screenshots/ \
--batch \
--mode terminal \
-k -c terminal-logs
用户:[发送终端截图]
AI:[自动检测terminal模式] → 提取命令 → 格式化输出
用户:[发送DeepSeek分享截图]
AI:[自动检测document模式] → 提取内容 → 生成Markdown
用户:[发送普通图片]
AI:[使用general模式] → 提取文本 → 结构化输出
image-content-extractor/
├── SKILL.md # 本文档
├── README.md # 快速开始
├── package.json # 技能元数据
├── install.sh # 安装脚本
├── config/
│ └── extractor-config.json # 配置文件
├── core/ # 核心模块
│ ├── __init__.py
│ ├── ocr.py # OCR引擎管理
│ ├── preprocess.py # 图片预处理
│ ├── merge.py # 内容合并
│ └── structure.py # 结构分析
├── modes/ # 模式模块
│ ├── __init__.py
│ ├── terminal.py # 终端模式
│ ├── document.py # 文档模式
│ └── general.py # 通用模式
└── scripts/
└── extract.py # 主入口
1. 图片输入
↓
2. 自动模式检测(可选)
↓
3. 模式特定预处理
↓
4. 智能分块
↓
5. OCR识别(Tesseract + AI备用)
↓
6. 智能合并
↓
7. 结构分析
↓
8. Markdown生成
↓
9. 模式特定后处理
↓
10. 输出/知识库集成
输入:终端截图(黑色背景,白色文字)
AI:[terminal模式] → 提取命令 → 高亮显示
输出示例:
```bash
$ npm install
/usr/local/bin
❌ Error: Package not found
### 场景2:DeepSeek分享截图
输入:DeepSeek长截图(43,936像素) AI:[document模式] → 识别8大模块 → 生成Markdown
输出:
提取时间: 2026-03-06 09:20
### 场景3:知识库建设
输入:批量技术文档截图 AI:[batch模式] → 自动分类 → 更新索引 → Git提交
结果:
## 🔧 配置选项
### extractor-config.json
```json
{
"ocr": {
"engine": "tesseract",
"languages": ["chi_sim", "eng"],
"fallback_to_ai": true,
"config": "--psm 6 --oem 3",
"timeout": 30
},
"preprocessing": {
"block_height": 2000,
"overlap_height": 100,
"min_block_height": 500,
"contrast_enhancement": 1.5,
"binary_threshold": 150
},
"structure_detection": {
"detect_headers": true,
"detect_lists": true,
"detect_code_blocks": true,
"detect_tables": true
},
"output": {
"format": "markdown",
"add_toc": true,
"add_metadata": true
},
"knowledge_base": {
"auto_index": true,
"auto_commit": false,
"default_category": "uncategorized"
}
}
| 指标 | 目标 | 实际 |
|---|---|---|
| 识别准确率 | > 95% | 待测试 |
| 处理速度 | < 15秒/图 | 待测试 |
| 模式检测准确率 | > 90% | 待测试 |
| 最大图片尺寸 | 50000px | ✅ |
| 批量处理 | 支持 | ✅ |
图片内容提取技能 v2.0 - 统一版本,更强大更灵活 版本:2.0.0 创建:2026-03-06 更新:2026-03-06
ZIP package — ready to use