2026-05-20 21:39:12 +08:00

72 lines
3.2 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: 文档处理 Skills
created: 2026-05-02
updated: 2026-05-02
type: entity
tags: [skill, module, backend]
sources: [packages/backend/skills/minimax-pdf/, packages/backend/skills/minimax-docx/, packages/backend/skills/minimax-xlsx/]
---
# 文档处理 Skills
文档处理 Skills 是 2026-04-26 之后新增的一组本地 skill 包,主要面向 PDF、DOCX、XLSX 的生成、编辑、排版、验证和格式修复。它们属于 [[skill-system]] 的 compute-toolkit 方向:核心能力通过 `SKILL.md` 指导 Agent实际工作由 skill 目录内脚本和参考文档完成。
## 当前包
| Skill | 目录 | 主要能力 |
| --- | --- | --- |
| `minimax-pdf` | `packages/backend/skills/minimax-pdf/` | 长文本 PDF 生成、封面、正文渲染、调色、重排版、填表与合并 |
| `minimax-docx` | `packages/backend/skills/minimax-docx/` | DOCX 创建、内容编辑、模板套用、样式检查、OpenXML 顺序修复、批注和修订 |
| `minimax-xlsx` | `packages/backend/skills/minimax-xlsx/` | XLSX 创建、读取分析、行列插入、公式检查、样式审计、重新打包和验证 |
这些 skill 不是 NetaClaw 核心运行时的一部分,但会通过 [[skill-runtime]] 被 Agent 发现、读取和执行。
## minimax-pdf
`minimax-pdf` 包含:
- `SKILL.md``README.md`
- `design/design.md`
- `scripts/make.sh`
- Python 渲染脚本:`cover.py``render_body.py``fill_write.py``reformat_parse.py`
- `render_cover.js`
- `skill.config.yaml`
近期修复重点是长文本场景不再走容易失败的 JSON 拼接路线,而改用 Markdown 路线;同时增加跨平台兼容处理,包括 Python 自动检测和本地浏览器优先。
## minimax-docx
`minimax-docx` 是三者中体量最大的 skill包含大量 OpenXML 参考资料、XSD、样式模板和 .NET 实现:
- `scripts/dotnet/MiniMaxAIDocx.Core/`DOCX 创建、编辑、模板、验证、批注、修订、样式分析等命令。
- `references/`OpenXML element order、命名空间、单位、排版、批注、修订和场景指南。
- `assets/styles/``assets/xsd/`:样式和验证资源。
它要求 Agent 在执行前读取具体场景 references不能只凭 `SKILL.md` 直接生成复杂 OpenXML。
## minimax-xlsx
`minimax-xlsx` 主要由 Python 脚本和最小 XLSX 模板组成:
- `scripts/xlsx_create.py``xlsx_reader.py``xlsx_insert_row.py``xlsx_add_column.py`
- `scripts/formula_check.py``style_audit.py``libreoffice_recalc.py`
- `templates/minimal_xlsx/`
- `references/create.md``edit.md``format.md``validate.md`
它的设计目标是让 Agent 通过结构化脚本操作 XLSX ZIP/XML而不是直接用脆弱的字符串拼接改 Office 文件。
## 与运行时的边界
- 这些包放在 `packages/backend/skills/`,由 [[skill-system]] 扫描。
- 如果声明 `skill.config.yaml`,由 [[skill-runtime]] 分类为 compute-toolkit 或 compute-entry。
- 如果脚本执行 cwd 位于 skill 目录内bash 工具可注入该 skill 的 scoped env。
- 执行脚本仍受 [[tool-governance]] 和 [[tool-runtime-policy]] 约束;禁用 bash 或限制 shell 会影响 compute-toolkit。
## 相关页面
- [[skill-system]]
- [[skill-runtime]]
- [[tool-system]]
- [[tool-governance]]
- [[project-overview]]