2026-05-20 21:39:12 +08:00

20 KiB

Raw Blame History

Geo 模块整体路线图（S1–S4）

本文是 Geo 模块的主索引文档。所有子项目（S1/S2/S3/S4）的 spec、plan、实施记录都从这里导航。阅读顺序：路线图（本文）→ 当前正在做的子项目 spec → 子项目 plan → 任务清单。

目标读者：未来接手 Geo 模块的任何 Agent 或开发者。读完本文不应再需要重新上网搜索 GEO 概念。

元数据	值
创建日期	2026-05-03
当前阶段	S1 设计中
业务负责	（待补）
依赖项目	NetaClaw 模块（Agent 引擎、Skill Runtime、加密工具）

1. Geo 模块是什么

一句话：Geo 是 Neta 平台的 GEO（生成式引擎优化）执行系统，通过社媒账号矩阵自动化生产并分发内容，最终目的是让品牌内容被 AI 引擎（DeepSeek/豆包/Kimi/文心/通义/腾讯元宝/ChatGPT/Perplexity 等）优先引用。

关键认知（避免再被问一次）：

GEO ≠ 地理定位。在本项目里 GEO 永远指 Generative Engine Optimization（生成式引擎优化）。
GEO 是 SEO 的 AI 时代继任者。SEO 关心"网页排名"，GEO 关心"AI 答案中是否被引用、引用是否权威、是否有正面情感"。
美团、知乎、东风本田、广汽、天翼云、东阿阿胶、海信、立白等头部企业 2026 年都启动了 GEO 年框供应商招标。本项目对齐这一行业标准。
美团等招标的核心 KPI（详见 §6）：AI 平台覆盖率 ≥ 80%、排名波动 ≤ 20%、引用率提升 ≥ 200%、合规通过率 100%。

业务闭环：

关键词词库 + 知识图谱
   ↓
AI 生产 E-E-A-T 内容（含 Schema.org/JSON-LD 注入）
   ↓
账号矩阵分发（独立 IP + 指纹浏览器，强绑定 1:1:1）
   ↓
社媒互动数据回流（点赞/评论/曝光） + AI 引用监测（8 大引擎）
   ↓
归因分析 → 高引用内容反向加权生产 → 异常告警 → 周期报告

2. 子项目分解（4 个 spec）

子项目	范围	数据表	估期	状态
S1 基础设施层	账号矩阵 / 天启 HTTP IP 池 / BitBrowser 指纹浏览器 / 菜单注入	3	~9 天	设计完成（本文同目录 spec）
S2 关键词与知识图谱	词库分级 / 实体三元组 / Schema.org 生成器 / 内容模板 / E-E-A-T 评分	4	~6 天	待 brainstorm
S3 平台适配与发布	人设 / 执行策略 / 调度 / 小红书 + 抖音适配器 / 浏览痕迹 / 发布物 / 评论回访 / 社媒指标 / 合规审核	10	~14 天	待 brainstorm
S4 AI 引用监测与分析	探测 Query / AI 平台 / 引用记录（情感+幻觉+竞品+引用源）/ 归因 / 报告 / 异常告警	7	~12 天	待 brainstorm

为什么这样拆：每个子项目对应一个能独立交付的能力域；前一个不完成不影响后一个的设计；每个子项目走完整 brainstorm → spec → plan → 实施 → 验收循环。

3. 各子项目核心交付

S1 基础设施层（已设计，本目录 spec）

核心能力：

账号矩阵 CRUD，平台维度（小红书/抖音/微博/知乎/微信等）
IP 池：抽象 ProxyProvider + 内置 LocalProvider + 占位 TianqiProvider（天启 HTTP）
指纹浏览器（两层正交）：① 浏览器进程层 IBrowserProvider：S1 主实现 PlainChromiumProvider（playwright-cli + Chromium）+ 占位 BitBrowser/AntBrowser/AdsPower。② 自动化层 BrowserAutomationService：统一用 playwright-cli 做 cookie/state/click，与底层浏览器解耦。等 ant-browser 源码到位后新增 AntBrowserProvider，自动化层无需改动
强绑定：account ↔ proxy_ip ↔ browser_profile 严格 1:1:1
启动浏览器 + 用户自己登录 + Cookie 自动抱回
菜单注入：base_sys_menu 增加 🌍 GEO 一级菜单

关键设计决策：

与 Neta 现有架构契合：复用 BaseEntity、@CoolController 自动 CRUD、TypeORM synchronize
加密：自建 GeoEncryptService（复用 AES-256-GCM 算法和 SKILL_SECRET_KEY/APP_SECRET 密钥派生逻辑，接口适配字符串场景。不直接调用 SkillSecretService——后者签名和语义不匹配）
数据库：不写 SQL 文件，TypeORM synchronize 自动建表 + MCP mysql 工具直接 INSERT 菜单
S1 不引入 gateway/skill/runtime（属过度设计）

详见：2026-05-03-geo-s1-infrastructure-design.md

S2 关键词与知识图谱（待设计）

核心能力：

关键词词库：分级（核心/意向/长尾/LBS）、权重、宣传词库（"推荐""排行""TOP10"）
知识图谱实体：实体-属性-关系三元组（如 [品牌X|拥有产品|产品Y]），是 Schema.org 的数据源
Schema.org / JSON-LD 生成器：把发布物自动包装为机器可读的结构化数据。这是 GEO 区别于 SEO 的灵魂——AI 引擎优先抓取结构化数据
E-E-A-T 评分器：内容自动按 Experience、Expertise、Authoritativeness、Trustworthiness 四维打分
内容模板：问答模块化（FAQPage Schema）、爆款拆解结构、E-E-A-T 框架
数据表：geo_target_keyword geo_keyword_group geo_knowledge_entity geo_content_template

关键设计要点（避免再搜）：

Schema.org 类型组合：Product + FAQPage + LocalBusiness（本地生活专属）+ Organization + Review
JSON-LD 嵌入位置：① 平台正文尾部 ② 自有官网/独立站 ③ 持久化到 geo_post_schema 表（S3 范畴）做事后审计
E-E-A-T 红线：禁伪原创堆砌、批量垃圾外链、AI 幻觉式批量生成
长尾词覆盖目标：每 300 字至少 1 数据 / 1 案例 / 1 对比

S3 平台适配与发布（待设计）

核心能力：

人设牌：systemPrompt 注入到 NetaClaw Agent，让生成内容带人设
执行策略 (geo_agent_config)：browseConfig / publishConfig / interactConfig / schedule
调度器：复用 Neta task 模块 cron，schedule.json 定义 cron + 动作清单
平台适配器接口 IPlatformAdapter：login / browse / publish / listComments / replyComment / getPostMetrics
首发：小红书 + 抖音；预留知乎、微博、视频号、本地生活
4 大业务动作（用户原始需求）：
1. browse：定时用独立 IP + 指纹浏览器刷特定内容（关键词/标签/账号）
2. publish：生成软广 → 合规审核 → 发布到平台
3. interact：评论回访（AI 草拟 + 一键发送 / 自动回复）
4. metrics：周期采集点赞/评论/曝光/收藏/分享
合规审核：敏感词扫描 + NetaClaw Agent 语义审核（医疗/金融/品牌冲突）+ minimaxMCP 检查相似已发
Skill 包装：packages/backend/skills/geo-platform/ 把发布、评论、指标暴露给 NetaClaw Agent，Agent 在对话中也能驱动账号

关键设计要点（避免再搜）：

行业风控共识：一账号一独立固定 IP（小红书 100 个号要 100 个不同 IP），强绑定已在 S1 落实
平台特定登录策略：QR 轮询、账密表单、短信验证码 → S3 才完整实现（S1 仅做 cookie 注入）
发布频率参考：单账号每天 ≤ 3 条，避免被风控
评论回访：AI 生成回复需经 compliance_auditor 二次审核才发出
内容生成调用链：scheduler → contentGenerator → chatOrchestrator(NetaClaw) + persona.systemPrompt + targetKeywords → 草稿 → 审核 → 发布

S4 AI 引用监测与分析（待设计）

核心能力（GEO 系统的最终 KPI 来源）：

探测 Query 库 (geo_ai_query)：模拟"普通用户提问"，如 "上海工业传感器品牌有哪些"
AI 平台清单 (geo_ai_platform)：DeepSeek、豆包、文心一言、腾讯元宝、通义千问、Kimi、ChatGPT、Perplexity、Claude、Gemini
AI 引用记录 (geo_ai_mention) 增强 4 维：
- sentiment 情感（正面/中性/负面）
- citedSources AI 引用了哪些原始 URL/媒体
- competitorsCo 同时出现的竞品
- hallucinationFlag 是否出现 AI 幻觉（虚假参数/伪造案例/捏造负评）
两种探针：
- 官方 API（OpenAI/通义/文心有 API） → 直接调用
- 网页自动化（DeepSeek/豆包/元宝网页版） → 复用 S1 的 playwright-cli skill
归因引擎 (attribution.ts)：把"优化动作（publish/edit/schema 更新）"和"AI 引用率变化曲线"按时间轴对齐，输出哪条发布物带来引用率提升、哪类内容被高频引用、哪些关键词长期未覆盖
覆盖率分析 (coverage_analyzer.ts)：已覆盖词 / 总目标词 + 未覆盖词清单 + 覆盖率热力图
AI 报告生成器 (report_generator.ts)：日/周/月 PDF 报告，复用 minimax-pdf Skill + notification 模块（飞书）
异常告警 (geo_alert)：排名暴跌 / AI 幻觉命中 / 账号风控

关键设计要点（避免再搜）：

业内行情：监测精度需 ≥ 行业均值，30 天波动 ≤ 20%，算法调整恢复 ≤ 5 天
AI 幻觉是 GEO 第一红线 — 大模型可能编造虚假产品参数、伪造合作案例、捏造负面评价；必须主动识别 + 矫正
幻觉检测策略：把答案与 geo_knowledge_entity 三元组比对，不一致即标记
情感分析复用 NetaClaw Agent 而非外部 API（统一 LLM 渠道）
报告口径需对齐美团等招标维度（覆盖率 / 引用率 / 曝光数 / 趋势 / TOP 关键词 / TOP 引用内容 / 竞品动态 / 风险事件 / 优化建议）

4. 数据模型总览（24 张表）

子项目	表
S1（3）	`geo_account` `geo_proxy_ip` `geo_browser_profile`
S2（4）	`geo_target_keyword` `geo_keyword_group` `geo_knowledge_entity` `geo_content_template`
S3（10）	`geo_persona` `geo_agent_config` `geo_account_group` `geo_browse_task` `geo_publish_post` `geo_post_schema` `geo_post_comment` `geo_post_metric` `geo_compliance_rule` `geo_content_audit`
S4（7）	`geo_ai_query` `geo_ai_platform` `geo_ai_mention` `geo_competitor` `geo_attribution_event` `geo_report` `geo_alert`

实际数 24 张是 v3 修正后估算（S1:3 + S2:4 + S3:10 + S4:7）；实施时若有合并/拆分以子项目 spec 为准。

5. 服务清单总览（v3，23 个）

基础设施 (S1)：account, proxy_ip, browser_profile
策略层 (S3)：persona, agent_config, account_group
关键词 (S2)：keyword, knowledge_graph
内容生产 (S2/S3)：content_generator, content_template, schema_generator,
                 multimodal_studio*, viral_decoder*
合规 (S3)：compliance_auditor, eeat_evaluator
发布与互动 (S3)：publish, comment_interactor
调度 (S3)：scheduler
数据回流 (S3/S4)：metrics_collector, ai_mention_collector,
                 sentiment_analyzer, hallucination_detector, competitor_tracker
分析与报告 (S4)：attribution, coverage_analyzer, report_generator
告警 (S4)：alert
看板 (各)：geo_dashboard

* 标注的多模态/爆款拆解可后置为 S5（不在前 4 子项目内）。

6. 行业 KPI 标准（招标对标）

来源：美团 2026 GEO 年框供应商招标、知乎 GEO 年框（200 万预算不承诺保底）、东风本田 GEO 中标、广汽 GEO 项目等公开信息综合。

维度	行业标准	Geo 模块对应能力
AI 平台覆盖	主流 8+ 家命中率 ≥ 80%	S4 AI 引用监测
排名稳定性	30 天波动 ≤ 20%	S4 时序快照 + 趋势看板
算法调整恢复	≤ 5 天	S4 异常告警 + 快速复跑
多元展示位	知识卡片/本地生活模块 ≥ 2 种	S2 Schema 多类型组合
高转化意向词占比	≥ 30%	S2 关键词分级（intent）
地域精准度	核心地域 ≥ 70%	S2 LBS 词 + LocalBusiness Schema
引用率提升	≥ 200%	S4 归因引擎 + 基线对比
合规通过率	100%	S3 compliance + S2 E-E-A-T 评分
响应时效	24h 技术响应	S4 异常告警 + 任务重试

7. GEO 领域知识沉淀（避免再搜）

7.1 GEO 八大行业必备功能（调研沉淀）

关键词与词库（多级 + 宣传词 + 行业词）
AI 内容生产（关键词驱动、爆款拆解、E-E-A-T、问答模块化、AI 绘画、视频/数字人）
结构化数据/知识图谱（Schema.org / JSON-LD / 实体-属性-关系三元组 / LocalBusiness Schema）
账号矩阵管理（多账号、IP 隔离、分组、定时发布、跨平台分发）
AI 引擎引用监测（8+ 平台、品牌可见度、引用率、AI 对话原文、引用源、情感、竞品对比、AI 幻觉、异常预警）
效果归因分析（动作-效果对应、基线对比、未覆盖词、高引用反向加权）
合规与风控（敏感词、医疗金融禁词、品牌冲突、AI 幻觉矫正、E-E-A-T 红线）
报告与看板（日/周/月报、可视化大盘、KPI 仪表盘）

7.2 主流 GEO 系统对标

厂商/产品	突出能力	借鉴点
纳基 AI-GEO	1 小时千篇内容、智能分发、品牌专属内容标准库	内容批量化 + 标准库化
GEO 领航系统	多账户多线程、宣传词库、多平台适配	调度模型 + 词库分级
蓝鲸 AI	数字人 + 矩阵管理	后置 S5 多模态
焱坤矩阵	1 天 300 条短视频、200 账号同后台	大规模账号管理
RiaFlow 睿晰	品牌 GEO 实时查询 + 周期监测 + 可视化报告	S4 监测设计参考
透镜 GEO	免费 GEO 排名查询、覆盖国内主流大模型	S4 探针实现参考
搜极星	国产 GEO 监测工具，排名/引用/情感	S4 字段设计参考
aibase 工具	AI 对话原文展示、品牌 vs 竞品共现	S4 引用记录字段
全息美 AISEO	Schema 注入、50+ 媒体平台一键发布	S2 Schema + S3 发布
盈达科技	品牌认知免疫、Schema 给内容装 GPS	S2 Schema 价值理解

7.3 容易被忽略的"细规则"

Schema.org 优先级：FAQ 页、产品详情页、技术指南、解决方案案例 — 这 4 类页面 AI 引用概率最高，要重点部署
图片/视频内容：纯视觉无法被 AI 解析，必须配 alt 文本和文字摘要
更新频率影响引用：长期未更新的页面会被 AI 视为过时；需要为产品/技术文档设审核机制
黑帽红线：AI 幻觉式批量生成、伪原创堆砌、批量垃圾外链 → 直接被算法判罚
本地生活 GEO 特殊规则：必须用 LocalBusiness Schema + 经纬度坐标 + areaServed + 本地域名后缀；流量逻辑从"商家主动曝光"变为"AI 被动筛选"
效果验证：在 DeepSeek、豆包、通义、Kimi 等输入典型问题，看回答是否准确提及品牌；这是 S4 探针的设计原型

7.4 与 SEO 的对比（一图记住）

维度	SEO（旧）	GEO（新）
优化目标	网页排名	AI 答案中被引用
内容形态	长文 + 关键词堆砌	模块化问答 + 数据 + 案例
优化指标	关键词排名、点击率	引用率、情感、竞品共现、幻觉率
数据载体	HTML + meta	Schema.org / JSON-LD / 知识图谱
技术核心	反向链接、SEO 文案	结构化数据 + E-E-A-T + 知识图谱嵌入
流量入口	搜索引擎 SERP	AI 对话答案直接呈现

8. 关键技术依赖

依赖	用途	状态
NetaClaw 模块	Agent 生成内容、Skill 暴露能力、加密工具	✅ 已存在
task 模块	cron 定时调度	✅ 已存在
base 模块	菜单、权限、用户	✅ 已存在
notification 模块	飞书报告推送	✅ 已存在（S4 用）
minimax-pdf Skill	报告 PDF 生成	✅ 已存在（S4 用）
BitBrowser 客户端	指纹浏览器（S1 不依赖，降为 stub）	外部依赖（等 ant-browser）
playwright-cli	浏览器自动化（S1 主实现，Neta 已有 skill）	✅ 已存在
天启 HTTP	第三方 IP 池	等用户提供文档
Playwright	playwright-cli skill 已封装	✅ 已存在
AI 平台 API	OpenAI/通义/文心/Claude/Gemini	需配置密钥
AI 平台网页版	DeepSeek/豆包/元宝（无 API）	需 BitBrowser 自动化

9. 风险与红线

9.1 项目级风险

风险	缓解
范围过大一次实施失败	已拆 4 个子项目独立交付
平台风控（小红书/抖音封号）	强绑定 1:1:1 + 单账号低频 + 合规审核
AI 幻觉传播虚假品牌信息	S4 必须做幻觉检测 + 主动矫正
第三方依赖（天启/BitBrowser）不稳	Provider 抽象，可换
合规违规	多层审核 + E-E-A-T 红线（S2/S3）
内容审核漏掉医疗金融敏感	S3 compliance_auditor 调 NetaClaw Agent 二次审核

9.2 不在范围内（明确否决）

❌ 不做 SEO（旧时代产物）
❌ 不做谷歌竞价/百度推广（不属于 GEO）
❌ 不做用户裂变营销（外延）
❌ 不做 CRM/客户管理（出范围）
❌ 不做电商交易闭环（出范围）

10. 工作流约定

10.1 单子项目 SOP

1. brainstorming   - 澄清需求、提出方案、分段呈现设计
2. spec doc        - 写到 docs/superpowers/specs/YYYY-MM-DD-geo-{sX}-{topic}-design.md
3. user 复核 spec
4. writing-plans   - 写到 docs/superpowers/plans/YYYY-MM-DD-geo-{sX}-{topic}-plan.md
5. user 复核 plan
6. executing-plans / TDD 实施
7. verification    - 验收清单逐条核对
8. requesting-code-review
9. finishing-a-development-branch
10. 更新本路线图：当前阶段、状态

10.2 数据库工作约定

不写 SQL 文件：用户明确要求
表创建：Entity 文件 + TypeORM synchronize: true 自动同步
数据 seed（菜单等）：用 mcp__mysql__execute INSERT
表结构查询：mcp__mysql__list_tables / describe_table
数据校验：mcp__mysql__query
测试环境：默认连 tycm_service/src/main/resources/application-test.yml（按 CLAUDE.md）

10.3 Neta 模块开发红线

文件名下划线、Entity 字段驼峰
Controller 用 @CoolController
Service 写业务，不下沉到 Controller
响应 this.ok() / this.fail()
Entity 放在 modules/{name}/entity/ 下，entities.ts 由 cool entity 命令自动生成（不手动修改）
前端模块必有 config.ts
菜单走 base_sys_menu，不在前端硬编码

11. 索引

子项目设计文档

✅ S1：2026-05-03-geo-s1-infrastructure-design.md（本目录）
🟡 S2：（待写）
🟡 S3：（待写）
🟡 S4：（待写）

子项目实施计划

🟡 S1 plan：（写完 spec 后由 writing-plans 生成到 docs/superpowers/plans/）

上游参考

Neta 项目入口：Neta-monorepo/CLAUDE.md
Neta wiki：Neta-monorepo/docs/code-wiki/index.md
关键 wiki 页面：project-overview netaclaw-module base-module cool-admin-framework development-conventions

12. 变更日志

日期	变更	备注
2026-05-03	初稿	brainstorming 后产出，含 v3 设计 + 行业调研沉淀
2026-05-03	架构审查修复	S3 表数 7→10，总表数 21→24；entities.ts 自动生成说明；加密方案修正；定时任务注册方式修正
2026-05-03	浏览器层重构	发现 Neta 已有 playwright-cli skill，S1 主实现改为 PlaywrightCliProvider，BitBrowser 降为 stub，等 ant-browser 源码到位后新增 AntBrowserProvider
2026-05-03	浏览器层二次重构	澄清"自动化"与"浏览器"是正交两层。新增 `BrowserAutomationService` 统一 playwright-cli 包装。`IBrowserProvider` 仅管进程生命周期。S1 主 provider 改为 `PlainChromiumProvider`。换浏览器只增 provider 不改自动化层

20 KiB Raw Blame History Unescape Escape

Geo 模块整体路线图（S1–S4）

1. Geo 模块是什么

2. 子项目分解（4 个 spec）

3. 各子项目核心交付

S1 基础设施层（已设计，本目录 spec）

S2 关键词与知识图谱（待设计）

S3 平台适配与发布（待设计）

S4 AI 引用监测与分析（待设计）

4. 数据模型总览（24 张表）

5. 服务清单总览（v3，23 个）

6. 行业 KPI 标准（招标对标）

7. GEO 领域知识沉淀（避免再搜）

7.1 GEO 八大行业必备功能（调研沉淀）

7.2 主流 GEO 系统对标

7.3 容易被忽略的"细规则"

7.4 与 SEO 的对比（一图记住）

8. 关键技术依赖

9. 风险与红线

9.1 项目级风险

9.2 不在范围内（明确否决）

10. 工作流约定

10.1 单子项目 SOP

10.2 数据库工作约定

10.3 Neta 模块开发红线

11. 索引

子项目设计文档

子项目实施计划

上游参考

12. 变更日志

20 KiB

Raw Blame History