72 lines
3.2 KiB
Markdown
72 lines
3.2 KiB
Markdown
---
|
||
title: 文档处理 Skills
|
||
created: 2026-05-02
|
||
updated: 2026-05-02
|
||
type: entity
|
||
tags: [skill, module, backend]
|
||
sources: [packages/backend/skills/minimax-pdf/, packages/backend/skills/minimax-docx/, packages/backend/skills/minimax-xlsx/]
|
||
---
|
||
|
||
# 文档处理 Skills
|
||
|
||
文档处理 Skills 是 2026-04-26 之后新增的一组本地 skill 包,主要面向 PDF、DOCX、XLSX 的生成、编辑、排版、验证和格式修复。它们属于 [[skill-system]] 的 compute-toolkit 方向:核心能力通过 `SKILL.md` 指导 Agent,实际工作由 skill 目录内脚本和参考文档完成。
|
||
|
||
## 当前包
|
||
|
||
| Skill | 目录 | 主要能力 |
|
||
| --- | --- | --- |
|
||
| `minimax-pdf` | `packages/backend/skills/minimax-pdf/` | 长文本 PDF 生成、封面、正文渲染、调色、重排版、填表与合并 |
|
||
| `minimax-docx` | `packages/backend/skills/minimax-docx/` | DOCX 创建、内容编辑、模板套用、样式检查、OpenXML 顺序修复、批注和修订 |
|
||
| `minimax-xlsx` | `packages/backend/skills/minimax-xlsx/` | XLSX 创建、读取分析、行列插入、公式检查、样式审计、重新打包和验证 |
|
||
|
||
这些 skill 不是 NetaClaw 核心运行时的一部分,但会通过 [[skill-runtime]] 被 Agent 发现、读取和执行。
|
||
|
||
## minimax-pdf
|
||
|
||
`minimax-pdf` 包含:
|
||
|
||
- `SKILL.md` 和 `README.md`
|
||
- `design/design.md`
|
||
- `scripts/make.sh`
|
||
- Python 渲染脚本:`cover.py`、`render_body.py`、`fill_write.py`、`reformat_parse.py` 等
|
||
- `render_cover.js`
|
||
- `skill.config.yaml`
|
||
|
||
近期修复重点是长文本场景不再走容易失败的 JSON 拼接路线,而改用 Markdown 路线;同时增加跨平台兼容处理,包括 Python 自动检测和本地浏览器优先。
|
||
|
||
## minimax-docx
|
||
|
||
`minimax-docx` 是三者中体量最大的 skill,包含大量 OpenXML 参考资料、XSD、样式模板和 .NET 实现:
|
||
|
||
- `scripts/dotnet/MiniMaxAIDocx.Core/`:DOCX 创建、编辑、模板、验证、批注、修订、样式分析等命令。
|
||
- `references/`:OpenXML element order、命名空间、单位、排版、批注、修订和场景指南。
|
||
- `assets/styles/` 与 `assets/xsd/`:样式和验证资源。
|
||
|
||
它要求 Agent 在执行前读取具体场景 references,不能只凭 `SKILL.md` 直接生成复杂 OpenXML。
|
||
|
||
## minimax-xlsx
|
||
|
||
`minimax-xlsx` 主要由 Python 脚本和最小 XLSX 模板组成:
|
||
|
||
- `scripts/xlsx_create.py`、`xlsx_reader.py`、`xlsx_insert_row.py`、`xlsx_add_column.py`
|
||
- `scripts/formula_check.py`、`style_audit.py`、`libreoffice_recalc.py`
|
||
- `templates/minimal_xlsx/`
|
||
- `references/create.md`、`edit.md`、`format.md`、`validate.md`
|
||
|
||
它的设计目标是让 Agent 通过结构化脚本操作 XLSX ZIP/XML,而不是直接用脆弱的字符串拼接改 Office 文件。
|
||
|
||
## 与运行时的边界
|
||
|
||
- 这些包放在 `packages/backend/skills/`,由 [[skill-system]] 扫描。
|
||
- 如果声明 `skill.config.yaml`,由 [[skill-runtime]] 分类为 compute-toolkit 或 compute-entry。
|
||
- 如果脚本执行 cwd 位于 skill 目录内,bash 工具可注入该 skill 的 scoped env。
|
||
- 执行脚本仍受 [[tool-governance]] 和 [[tool-runtime-policy]] 约束;禁用 bash 或限制 shell 会影响 compute-toolkit。
|
||
|
||
## 相关页面
|
||
|
||
- [[skill-system]]
|
||
- [[skill-runtime]]
|
||
- [[tool-system]]
|
||
- [[tool-governance]]
|
||
- [[project-overview]]
|