2026-05-20 21:39:12 +08:00

2.3 KiB
Raw Blame History

name description license metadata
vehicle-damage-inspection 汽车环车视频旧伤检测。用户上传车辆环车视频后,如说“请检查”“请分析”“检查是否有旧伤”“分析车辆视频”等, 必须使用 execute_skill 调用本技能。本技能会抽帧、检测旧伤候选、定位标注、放大复核,并返回最佳证据帧和复核放大图。 MIT
version category skillType tags
1.0.0 vehicle-inspection multimodal
vehicle
video
damage
bbox
旧伤检测
环车检测

汽车环车视频旧伤检测

当用户需要分析汽车环车视频、检查车辆外观、判断是否存在旧伤、划痕、凹陷、掉漆、裂纹、锈蚀时,直接使用 execute_skill 调用:

{
  "name": "vehicle-damage-inspection",
  "input": {
    "videoUrl": "/upload/20260504/car.mp4",
    "fps": 5,
    "batchSize": 50,
    "topN": 1
  }
}

关键规则

  • 不要使用 image_recognize 直接分析视频;视频必须交给本技能抽帧处理。
  • 输出中的 damages 是最终旧伤结论,candidates 只是中间候选,不代表最终结果。
  • bestFrameImages 是最终证据帧。
  • reviewImages 是模型不清楚时裁剪/放大后用于复核的图片,应返回给前端,并说明“模型不清楚,放大后判断”;这些图片保存在 workspace 的 source 目录。
  • 损伤部位直接使用中文车身部位名,例如“左前门”“右前翼子板”“前保险杠”,不要返回 front_right_door 这类英文标签。

输入

  • videoUrl: 必填。视频本地路径、/upload/... 路径或本机可访问 URL。
  • taskId: 可选。
  • fps: 可选,默认 5。
  • quality: 可选,默认 90。
  • batchSize: 可选,默认 50。
  • concurrency: 可选,默认 5。
  • groundingWindow: 可选,默认 2 秒。
  • groundingFrameLimit: 可选,默认每个候选最多 5 张关键帧参与定位,避免长视频超时。
  • reviewConcurrency: 可选,默认 3。
  • topN: 可选,默认每处损伤 1 张最佳帧。
  • mode: 可选,fullframes-onlydetect-only

输出

返回 JSON包含 summaryvehicleInfodamagesbestFrameImagesreviewImagesartifacts。所有产物写入后端 dataDir 下的 workspace/vehicle-damage-inspection/{taskId}