tantingwu/GPU_GUARD_MONOREPO

Fork 0

陈二狗 cc660d19d1 初始化提交

2026-05-20 21:39:12 +08:00

2.8 KiB

Raw Permalink Blame History

name

description

license

metadata

vehicle-invoice-ocr

机动车销售发票识别。使用多模态大模型识别机动车销售统一发票的发票代码、号码、开票日期、购买方、车辆类型、厂牌型号、车架号码、发动机号码、价税合计、销货单位等关键字段，支持URL、base64和PDF输入；不需要百度OCR API Key。

MIT

version

机动车销售发票识别

当需要从机动车销售统一发票图片或PDF中提取结构化字段时使用本技能。本技能不调用百度 OCR，也不需要配置百度 API Key。

推荐流程：

让多模态大模型直接查看 imageUrl、imageBase64、pdfUrl 或 pdfBase64 中的发票。
按本技能输出 schema 让模型只返回 JSON。
将模型返回 JSON 作为 modelResult 传入本技能，做字段归一化和稳定输出。

{
  "name": "vehicle-invoice-ocr",
  "input": {
    "imageUrl": "https://example.com/vehicle-invoice.jpg",
    "modelResult": {
      "fields": {
        "buyerName": "张三",
        "vin": "LS6D3G0Y0NA500002",
        "engineNo": "ABC123456",
        "issueDate": "2026-04-27"
      }
    }
  }
}

如果没有传 modelResult，本技能会返回 needsModelVision:true 和一段可直接给多模态模型使用的 prompt。

输入

imageUrl: 发票图片URL。
imageBase64: 发票图片base64，支持 data:image/...;base64, 前缀。
pdfUrl: 发票PDF URL。
pdfBase64: 发票PDF base64，支持 data:application/pdf;base64, 前缀。
modelResult: 可选，多模态模型识别后的 JSON 对象或 JSON 字符串。
ocrResult: 可选，等同于 modelResult。
mockResult: 可选，联调用 JSON 对象或 JSON 字符串。
fields: 可选，直接传入已识别字段对象。

输出

成功时输出：

{
  "success": true,
  "fields": {
    "invoiceCode": "050002300111",
    "invoiceNumber": "12345678",
    "issueDate": "2026-04-27",
    "buyerName": "张三",
    "vehicleType": "乘用车",
    "brandModel": "阿维塔...",
    "vin": "LS6D3G0Y0NA500002",
    "engineNo": "ABC123456",
    "totalAmount": "245000.00",
    "sellerName": "重庆某汽车销售服务有限公司"
  },
  "raw": {}
}

未传模型识别结果时输出 success:false、needsModelVision:true、prompt，不会向 stdout 输出非 JSON 内容。

注意

本技能只负责发票识别结果归一化，不做投保业务审核。
在 TYCM AI 审核链路中，如果本技能返回 success:false 或执行异常，后续编排仍应调用 tycm-callback，向 TYCM 的 /agent-invoke-callback 回推 status:"failed" 和失败原因。
字段和提示词细节见 references/multimodal_vehicle_invoice_ocr.md。

2.8 KiB Raw Permalink Blame History Unescape Escape

机动车销售发票识别

输入

输出

注意

2.8 KiB

Raw Permalink Blame History