3.2 KiB
3.2 KiB
| title | created | updated | type | tags | sources | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 文档处理 Skills | 2026-05-02 | 2026-05-02 | entity |
|
|
文档处理 Skills
文档处理 Skills 是 2026-04-26 之后新增的一组本地 skill 包,主要面向 PDF、DOCX、XLSX 的生成、编辑、排版、验证和格式修复。它们属于 skill-system 的 compute-toolkit 方向:核心能力通过 SKILL.md 指导 Agent,实际工作由 skill 目录内脚本和参考文档完成。
当前包
| Skill | 目录 | 主要能力 |
|---|---|---|
minimax-pdf |
packages/backend/skills/minimax-pdf/ |
长文本 PDF 生成、封面、正文渲染、调色、重排版、填表与合并 |
minimax-docx |
packages/backend/skills/minimax-docx/ |
DOCX 创建、内容编辑、模板套用、样式检查、OpenXML 顺序修复、批注和修订 |
minimax-xlsx |
packages/backend/skills/minimax-xlsx/ |
XLSX 创建、读取分析、行列插入、公式检查、样式审计、重新打包和验证 |
这些 skill 不是 NetaClaw 核心运行时的一部分,但会通过 skill-runtime 被 Agent 发现、读取和执行。
minimax-pdf
minimax-pdf 包含:
SKILL.md和README.mddesign/design.mdscripts/make.sh- Python 渲染脚本:
cover.py、render_body.py、fill_write.py、reformat_parse.py等 render_cover.jsskill.config.yaml
近期修复重点是长文本场景不再走容易失败的 JSON 拼接路线,而改用 Markdown 路线;同时增加跨平台兼容处理,包括 Python 自动检测和本地浏览器优先。
minimax-docx
minimax-docx 是三者中体量最大的 skill,包含大量 OpenXML 参考资料、XSD、样式模板和 .NET 实现:
scripts/dotnet/MiniMaxAIDocx.Core/:DOCX 创建、编辑、模板、验证、批注、修订、样式分析等命令。references/:OpenXML element order、命名空间、单位、排版、批注、修订和场景指南。assets/styles/与assets/xsd/:样式和验证资源。
它要求 Agent 在执行前读取具体场景 references,不能只凭 SKILL.md 直接生成复杂 OpenXML。
minimax-xlsx
minimax-xlsx 主要由 Python 脚本和最小 XLSX 模板组成:
scripts/xlsx_create.py、xlsx_reader.py、xlsx_insert_row.py、xlsx_add_column.pyscripts/formula_check.py、style_audit.py、libreoffice_recalc.pytemplates/minimal_xlsx/references/create.md、edit.md、format.md、validate.md
它的设计目标是让 Agent 通过结构化脚本操作 XLSX ZIP/XML,而不是直接用脆弱的字符串拼接改 Office 文件。
与运行时的边界
- 这些包放在
packages/backend/skills/,由 skill-system 扫描。 - 如果声明
skill.config.yaml,由 skill-runtime 分类为 compute-toolkit 或 compute-entry。 - 如果脚本执行 cwd 位于 skill 目录内,bash 工具可注入该 skill 的 scoped env。
- 执行脚本仍受 tool-governance 和 tool-runtime-policy 约束;禁用 bash 或限制 shell 会影响 compute-toolkit。