20 KiB
20 KiB
Geo 模块整体路线图(S1–S4)
本文是 Geo 模块的主索引文档。所有子项目(S1/S2/S3/S4)的 spec、plan、实施记录都从这里导航。 阅读顺序:路线图(本文)→ 当前正在做的子项目 spec → 子项目 plan → 任务清单。
目标读者:未来接手 Geo 模块的任何 Agent 或开发者。读完本文不应再需要重新上网搜索 GEO 概念。
| 元数据 | 值 |
|---|---|
| 创建日期 | 2026-05-03 |
| 当前阶段 | S1 设计中 |
| 业务负责 | (待补) |
| 依赖项目 | NetaClaw 模块(Agent 引擎、Skill Runtime、加密工具) |
1. Geo 模块是什么
一句话:Geo 是 Neta 平台的 GEO(生成式引擎优化)执行系统,通过社媒账号矩阵自动化生产并分发内容,最终目的是让品牌内容被 AI 引擎(DeepSeek/豆包/Kimi/文心/通义/腾讯元宝/ChatGPT/Perplexity 等)优先引用。
关键认知(避免再被问一次):
- GEO ≠ 地理定位。在本项目里 GEO 永远指 Generative Engine Optimization(生成式引擎优化)。
- GEO 是 SEO 的 AI 时代继任者。SEO 关心"网页排名",GEO 关心"AI 答案中是否被引用、引用是否权威、是否有正面情感"。
- 美团、知乎、东风本田、广汽、天翼云、东阿阿胶、海信、立白等头部企业 2026 年都启动了 GEO 年框供应商招标。本项目对齐这一行业标准。
- 美团等招标的核心 KPI(详见 §6):AI 平台覆盖率 ≥ 80%、排名波动 ≤ 20%、引用率提升 ≥ 200%、合规通过率 100%。
业务闭环:
关键词词库 + 知识图谱
↓
AI 生产 E-E-A-T 内容(含 Schema.org/JSON-LD 注入)
↓
账号矩阵分发(独立 IP + 指纹浏览器,强绑定 1:1:1)
↓
社媒互动数据回流(点赞/评论/曝光) + AI 引用监测(8 大引擎)
↓
归因分析 → 高引用内容反向加权生产 → 异常告警 → 周期报告
2. 子项目分解(4 个 spec)
| 子项目 | 范围 | 数据表 | 估期 | 状态 |
|---|---|---|---|---|
| S1 基础设施层 | 账号矩阵 / 天启 HTTP IP 池 / BitBrowser 指纹浏览器 / 菜单注入 | 3 | ~9 天 | 设计完成(本文同目录 spec) |
| S2 关键词与知识图谱 | 词库分级 / 实体三元组 / Schema.org 生成器 / 内容模板 / E-E-A-T 评分 | 4 | ~6 天 | 待 brainstorm |
| S3 平台适配与发布 | 人设 / 执行策略 / 调度 / 小红书 + 抖音适配器 / 浏览痕迹 / 发布物 / 评论回访 / 社媒指标 / 合规审核 | 10 | ~14 天 | 待 brainstorm |
| S4 AI 引用监测与分析 | 探测 Query / AI 平台 / 引用记录(情感+幻觉+竞品+引用源)/ 归因 / 报告 / 异常告警 | 7 | ~12 天 | 待 brainstorm |
为什么这样拆:每个子项目对应一个能独立交付的能力域;前一个不完成不影响后一个的设计;每个子项目走完整 brainstorm → spec → plan → 实施 → 验收循环。
3. 各子项目核心交付
S1 基础设施层(已设计,本目录 spec)
核心能力:
- 账号矩阵 CRUD,平台维度(小红书/抖音/微博/知乎/微信等)
- IP 池:抽象 ProxyProvider + 内置 LocalProvider + 占位 TianqiProvider(天启 HTTP)
- 指纹浏览器(两层正交):① 浏览器进程层
IBrowserProvider:S1 主实现PlainChromiumProvider(playwright-cli + Chromium)+ 占位 BitBrowser/AntBrowser/AdsPower。② 自动化层BrowserAutomationService:统一用 playwright-cli 做 cookie/state/click,与底层浏览器解耦。等 ant-browser 源码到位后新增 AntBrowserProvider,自动化层无需改动 - 强绑定:account ↔ proxy_ip ↔ browser_profile 严格 1:1:1
- 启动浏览器 + 用户自己登录 + Cookie 自动抱回
- 菜单注入:base_sys_menu 增加 🌍 GEO 一级菜单
关键设计决策:
- 与 Neta 现有架构契合:复用 BaseEntity、@CoolController 自动 CRUD、TypeORM synchronize
- 加密:自建
GeoEncryptService(复用 AES-256-GCM 算法和SKILL_SECRET_KEY/APP_SECRET密钥派生逻辑,接口适配字符串场景。不直接调用SkillSecretService——后者签名和语义不匹配) - 数据库:不写 SQL 文件,TypeORM synchronize 自动建表 + MCP mysql 工具直接 INSERT 菜单
- S1 不引入 gateway/skill/runtime(属过度设计)
详见:2026-05-03-geo-s1-infrastructure-design.md
S2 关键词与知识图谱(待设计)
核心能力:
- 关键词词库:分级(核心/意向/长尾/LBS)、权重、宣传词库("推荐""排行""TOP10")
- 知识图谱实体:实体-属性-关系三元组(如
[品牌X|拥有产品|产品Y]),是 Schema.org 的数据源 - Schema.org / JSON-LD 生成器:把发布物自动包装为机器可读的结构化数据。这是 GEO 区别于 SEO 的灵魂——AI 引擎优先抓取结构化数据
- E-E-A-T 评分器:内容自动按 Experience、Expertise、Authoritativeness、Trustworthiness 四维打分
- 内容模板:问答模块化(FAQPage Schema)、爆款拆解结构、E-E-A-T 框架
- 数据表:
geo_target_keywordgeo_keyword_groupgeo_knowledge_entitygeo_content_template
关键设计要点(避免再搜):
- Schema.org 类型组合:Product + FAQPage + LocalBusiness(本地生活专属)+ Organization + Review
- JSON-LD 嵌入位置:① 平台正文尾部 ② 自有官网/独立站 ③ 持久化到
geo_post_schema表(S3 范畴)做事后审计 - E-E-A-T 红线:禁伪原创堆砌、批量垃圾外链、AI 幻觉式批量生成
- 长尾词覆盖目标:每 300 字至少 1 数据 / 1 案例 / 1 对比
S3 平台适配与发布(待设计)
核心能力:
- 人设牌:systemPrompt 注入到 NetaClaw Agent,让生成内容带人设
- 执行策略 (geo_agent_config):browseConfig / publishConfig / interactConfig / schedule
- 调度器:复用 Neta
task模块 cron,schedule.json 定义 cron + 动作清单 - 平台适配器接口
IPlatformAdapter:login/browse/publish/listComments/replyComment/getPostMetrics - 首发:小红书 + 抖音;预留知乎、微博、视频号、本地生活
- 4 大业务动作(用户原始需求):
- browse:定时用独立 IP + 指纹浏览器刷特定内容(关键词/标签/账号)
- publish:生成软广 → 合规审核 → 发布到平台
- interact:评论回访(AI 草拟 + 一键发送 / 自动回复)
- metrics:周期采集点赞/评论/曝光/收藏/分享
- 合规审核:敏感词扫描 + NetaClaw Agent 语义审核(医疗/金融/品牌冲突)+ minimaxMCP 检查相似已发
- Skill 包装:
packages/backend/skills/geo-platform/把发布、评论、指标暴露给 NetaClaw Agent,Agent 在对话中也能驱动账号
关键设计要点(避免再搜):
- 行业风控共识:一账号一独立固定 IP(小红书 100 个号要 100 个不同 IP),强绑定已在 S1 落实
- 平台特定登录策略:QR 轮询、账密表单、短信验证码 → S3 才完整实现(S1 仅做 cookie 注入)
- 发布频率参考:单账号每天 ≤ 3 条,避免被风控
- 评论回访:AI 生成回复需经 compliance_auditor 二次审核才发出
- 内容生成调用链:scheduler → contentGenerator → chatOrchestrator(NetaClaw) + persona.systemPrompt + targetKeywords → 草稿 → 审核 → 发布
S4 AI 引用监测与分析(待设计)
核心能力(GEO 系统的最终 KPI 来源):
- 探测 Query 库 (geo_ai_query):模拟"普通用户提问",如 "上海工业传感器品牌有哪些"
- AI 平台清单 (geo_ai_platform):DeepSeek、豆包、文心一言、腾讯元宝、通义千问、Kimi、ChatGPT、Perplexity、Claude、Gemini
- AI 引用记录 (geo_ai_mention) 增强 4 维:
sentiment情感(正面/中性/负面)citedSourcesAI 引用了哪些原始 URL/媒体competitorsCo同时出现的竞品hallucinationFlag是否出现 AI 幻觉(虚假参数/伪造案例/捏造负评)
- 两种探针:
- 官方 API(OpenAI/通义/文心 有 API) → 直接调用
- 网页自动化(DeepSeek/豆包/元宝 网页版) → 复用 S1 的 playwright-cli skill
- 归因引擎 (attribution.ts):把"优化动作(publish/edit/schema 更新)"和"AI 引用率变化曲线"按时间轴对齐,输出哪条发布物带来引用率提升、哪类内容被高频引用、哪些关键词长期未覆盖
- 覆盖率分析 (coverage_analyzer.ts):已覆盖词 / 总目标词 + 未覆盖词清单 + 覆盖率热力图
- AI 报告生成器 (report_generator.ts):日/周/月 PDF 报告,复用 minimax-pdf Skill + notification 模块(飞书)
- 异常告警 (geo_alert):排名暴跌 / AI 幻觉命中 / 账号风控
关键设计要点(避免再搜):
- 业内行情:监测精度需 ≥ 行业均值,30 天波动 ≤ 20%,算法调整恢复 ≤ 5 天
- AI 幻觉是 GEO 第一红线 — 大模型可能编造虚假产品参数、伪造合作案例、捏造负面评价;必须主动识别 + 矫正
- 幻觉检测策略:把答案与
geo_knowledge_entity三元组比对,不一致即标记 - 情感分析复用 NetaClaw Agent 而非外部 API(统一 LLM 渠道)
- 报告口径需对齐美团等招标维度(覆盖率 / 引用率 / 曝光数 / 趋势 / TOP 关键词 / TOP 引用内容 / 竞品动态 / 风险事件 / 优化建议)
4. 数据模型总览(24 张表)
| 子项目 | 表 |
|---|---|
| S1(3) | geo_account geo_proxy_ip geo_browser_profile |
| S2(4) | geo_target_keyword geo_keyword_group geo_knowledge_entity geo_content_template |
| S3(10) | geo_persona geo_agent_config geo_account_group geo_browse_task geo_publish_post geo_post_schema geo_post_comment geo_post_metric geo_compliance_rule geo_content_audit |
| S4(7) | geo_ai_query geo_ai_platform geo_ai_mention geo_competitor geo_attribution_event geo_report geo_alert |
实际数 24 张是 v3 修正后估算(S1:3 + S2:4 + S3:10 + S4:7);实施时若有合并/拆分以子项目 spec 为准。
5. 服务清单总览(v3,23 个)
基础设施 (S1):account, proxy_ip, browser_profile
策略层 (S3):persona, agent_config, account_group
关键词 (S2):keyword, knowledge_graph
内容生产 (S2/S3):content_generator, content_template, schema_generator,
multimodal_studio*, viral_decoder*
合规 (S3):compliance_auditor, eeat_evaluator
发布与互动 (S3):publish, comment_interactor
调度 (S3):scheduler
数据回流 (S3/S4):metrics_collector, ai_mention_collector,
sentiment_analyzer, hallucination_detector, competitor_tracker
分析与报告 (S4):attribution, coverage_analyzer, report_generator
告警 (S4):alert
看板 (各):geo_dashboard
*标注的多模态/爆款拆解可后置为 S5(不在前 4 子项目内)。
6. 行业 KPI 标准(招标对标)
来源:美团 2026 GEO 年框供应商招标、知乎 GEO 年框(200 万预算不承诺保底)、东风本田 GEO 中标、广汽 GEO 项目等公开信息综合。
| 维度 | 行业标准 | Geo 模块对应能力 |
|---|---|---|
| AI 平台覆盖 | 主流 8+ 家命中率 ≥ 80% | S4 AI 引用监测 |
| 排名稳定性 | 30 天波动 ≤ 20% | S4 时序快照 + 趋势看板 |
| 算法调整恢复 | ≤ 5 天 | S4 异常告警 + 快速复跑 |
| 多元展示位 | 知识卡片/本地生活模块 ≥ 2 种 | S2 Schema 多类型组合 |
| 高转化意向词占比 | ≥ 30% | S2 关键词分级(intent) |
| 地域精准度 | 核心地域 ≥ 70% | S2 LBS 词 + LocalBusiness Schema |
| 引用率提升 | ≥ 200% | S4 归因引擎 + 基线对比 |
| 合规通过率 | 100% | S3 compliance + S2 E-E-A-T 评分 |
| 响应时效 | 24h 技术响应 | S4 异常告警 + 任务重试 |
7. GEO 领域知识沉淀(避免再搜)
7.1 GEO 八大行业必备功能(调研沉淀)
- 关键词与词库(多级 + 宣传词 + 行业词)
- AI 内容生产(关键词驱动、爆款拆解、E-E-A-T、问答模块化、AI 绘画、视频/数字人)
- 结构化数据/知识图谱(Schema.org / JSON-LD / 实体-属性-关系三元组 / LocalBusiness Schema)
- 账号矩阵管理(多账号、IP 隔离、分组、定时发布、跨平台分发)
- AI 引擎引用监测(8+ 平台、品牌可见度、引用率、AI 对话原文、引用源、情感、竞品对比、AI 幻觉、异常预警)
- 效果归因分析(动作-效果对应、基线对比、未覆盖词、高引用反向加权)
- 合规与风控(敏感词、医疗金融禁词、品牌冲突、AI 幻觉矫正、E-E-A-T 红线)
- 报告与看板(日/周/月报、可视化大盘、KPI 仪表盘)
7.2 主流 GEO 系统对标
| 厂商/产品 | 突出能力 | 借鉴点 |
|---|---|---|
| 纳基 AI-GEO | 1 小时千篇内容、智能分发、品牌专属内容标准库 | 内容批量化 + 标准库化 |
| GEO 领航系统 | 多账户多线程、宣传词库、多平台适配 | 调度模型 + 词库分级 |
| 蓝鲸 AI | 数字人 + 矩阵管理 | 后置 S5 多模态 |
| 焱坤矩阵 | 1 天 300 条短视频、200 账号同后台 | 大规模账号管理 |
| RiaFlow 睿晰 | 品牌 GEO 实时查询 + 周期监测 + 可视化报告 | S4 监测设计参考 |
| 透镜 GEO | 免费 GEO 排名查询、覆盖国内主流大模型 | S4 探针实现参考 |
| 搜极星 | 国产 GEO 监测工具,排名/引用/情感 | S4 字段设计参考 |
| aibase 工具 | AI 对话原文展示、品牌 vs 竞品共现 | S4 引用记录字段 |
| 全息美 AISEO | Schema 注入、50+ 媒体平台一键发布 | S2 Schema + S3 发布 |
| 盈达科技 | 品牌认知免疫、Schema 给内容装 GPS | S2 Schema 价值理解 |
7.3 容易被忽略的"细规则"
- Schema.org 优先级:FAQ 页、产品详情页、技术指南、解决方案案例 — 这 4 类页面 AI 引用概率最高,要重点部署
- 图片/视频内容:纯视觉无法被 AI 解析,必须配 alt 文本和文字摘要
- 更新频率影响引用:长期未更新的页面会被 AI 视为过时;需要为产品/技术文档设审核机制
- 黑帽红线:AI 幻觉式批量生成、伪原创堆砌、批量垃圾外链 → 直接被算法判罚
- 本地生活 GEO 特殊规则:必须用 LocalBusiness Schema + 经纬度坐标 + areaServed + 本地域名后缀;流量逻辑从"商家主动曝光"变为"AI 被动筛选"
- 效果验证:在 DeepSeek、豆包、通义、Kimi 等输入典型问题,看回答是否准确提及品牌;这是 S4 探针的设计原型
7.4 与 SEO 的对比(一图记住)
| 维度 | SEO(旧) | GEO(新) |
|---|---|---|
| 优化目标 | 网页排名 | AI 答案中被引用 |
| 内容形态 | 长文 + 关键词堆砌 | 模块化问答 + 数据 + 案例 |
| 优化指标 | 关键词排名、点击率 | 引用率、情感、竞品共现、幻觉率 |
| 数据载体 | HTML + meta | Schema.org / JSON-LD / 知识图谱 |
| 技术核心 | 反向链接、SEO 文案 | 结构化数据 + E-E-A-T + 知识图谱嵌入 |
| 流量入口 | 搜索引擎 SERP | AI 对话答案直接呈现 |
8. 关键技术依赖
| 依赖 | 用途 | 状态 |
|---|---|---|
| NetaClaw 模块 | Agent 生成内容、Skill 暴露能力、加密工具 | ✅ 已存在 |
| task 模块 | cron 定时调度 | ✅ 已存在 |
| base 模块 | 菜单、权限、用户 | ✅ 已存在 |
| notification 模块 | 飞书报告推送 | ✅ 已存在(S4 用) |
| minimax-pdf Skill | 报告 PDF 生成 | ✅ 已存在(S4 用) |
| BitBrowser 客户端 | 指纹浏览器(S1 不依赖,降为 stub) | 外部依赖(等 ant-browser) |
| playwright-cli | 浏览器自动化(S1 主实现,Neta 已有 skill) | ✅ 已存在 |
| 天启 HTTP | 第三方 IP 池 | 等用户提供文档 |
| Playwright | playwright-cli skill 已封装 | ✅ 已存在 |
| AI 平台 API | OpenAI/通义/文心/Claude/Gemini | 需配置密钥 |
| AI 平台网页版 | DeepSeek/豆包/元宝(无 API) | 需 BitBrowser 自动化 |
9. 风险与红线
9.1 项目级风险
| 风险 | 缓解 |
|---|---|
| 范围过大一次实施失败 | 已拆 4 个子项目独立交付 |
| 平台风控(小红书/抖音封号) | 强绑定 1:1:1 + 单账号低频 + 合规审核 |
| AI 幻觉传播虚假品牌信息 | S4 必须做幻觉检测 + 主动矫正 |
| 第三方依赖(天启/BitBrowser)不稳 | Provider 抽象,可换 |
| 合规违规 | 多层审核 + E-E-A-T 红线(S2/S3) |
| 内容审核漏掉医疗金融敏感 | S3 compliance_auditor 调 NetaClaw Agent 二次审核 |
9.2 不在范围内(明确否决)
- ❌ 不做 SEO(旧时代产物)
- ❌ 不做谷歌竞价/百度推广(不属于 GEO)
- ❌ 不做用户裂变营销(外延)
- ❌ 不做 CRM/客户管理(出范围)
- ❌ 不做电商交易闭环(出范围)
10. 工作流约定
10.1 单子项目 SOP
1. brainstorming - 澄清需求、提出方案、分段呈现设计
2. spec doc - 写到 docs/superpowers/specs/YYYY-MM-DD-geo-{sX}-{topic}-design.md
3. user 复核 spec
4. writing-plans - 写到 docs/superpowers/plans/YYYY-MM-DD-geo-{sX}-{topic}-plan.md
5. user 复核 plan
6. executing-plans / TDD 实施
7. verification - 验收清单逐条核对
8. requesting-code-review
9. finishing-a-development-branch
10. 更新本路线图:当前阶段、状态
10.2 数据库工作约定
- 不写 SQL 文件:用户明确要求
- 表创建:Entity 文件 + TypeORM
synchronize: true自动同步 - 数据 seed(菜单等):用
mcp__mysql__executeINSERT - 表结构查询:
mcp__mysql__list_tables/describe_table - 数据校验:
mcp__mysql__query - 测试环境:默认连
tycm_service/src/main/resources/application-test.yml(按 CLAUDE.md)
10.3 Neta 模块开发红线
- 文件名下划线、Entity 字段驼峰
- Controller 用
@CoolController - Service 写业务,不下沉到 Controller
- 响应
this.ok()/this.fail() - Entity 放在
modules/{name}/entity/下,entities.ts由cool entity命令自动生成(不手动修改) - 前端模块必有
config.ts - 菜单走
base_sys_menu,不在前端硬编码
11. 索引
子项目设计文档
- ✅ S1:
2026-05-03-geo-s1-infrastructure-design.md(本目录) - 🟡 S2:(待写)
- 🟡 S3:(待写)
- 🟡 S4:(待写)
子项目实施计划
- 🟡 S1 plan:(写完 spec 后由 writing-plans 生成到
docs/superpowers/plans/)
上游参考
- Neta 项目入口:
Neta-monorepo/CLAUDE.md - Neta wiki:
Neta-monorepo/docs/code-wiki/index.md - 关键 wiki 页面:project-overview netaclaw-module base-module cool-admin-framework development-conventions
12. 变更日志
| 日期 | 变更 | 备注 |
|---|---|---|
| 2026-05-03 | 初稿 | brainstorming 后产出,含 v3 设计 + 行业调研沉淀 |
| 2026-05-03 | 架构审查修复 | S3 表数 7→10,总表数 21→24;entities.ts 自动生成说明;加密方案修正;定时任务注册方式修正 |
| 2026-05-03 | 浏览器层重构 | 发现 Neta 已有 playwright-cli skill,S1 主实现改为 PlaywrightCliProvider,BitBrowser 降为 stub,等 ant-browser 源码到位后新增 AntBrowserProvider |
| 2026-05-03 | 浏览器层二次重构 | 澄清"自动化"与"浏览器"是正交两层。新增 BrowserAutomationService 统一 playwright-cli 包装。IBrowserProvider 仅管进程生命周期。S1 主 provider 改为 PlainChromiumProvider。换浏览器只增 provider 不改自动化层 |