超高标准 PRD 含系统原型 + 钉钉互动卡片 供技术方案拆解

AI 人机协同投放决策执行系统 PRD

本文档把“投放算法对抗策略”产品化为自研投放系统中的 AI 决策执行模块。目标不是让 AI 全自动接管投放,而是让 AI 完成读数、诊断、动作卡生成、通知、复盘,人负责确认高风险动作,系统负责执行、冻结窗口、审计和学习沉淀。

一、模块地图:总纲跳转到每个详细设计

点击任一模块卡,会在浮窗里打开本地模块详细设计文档;技术方案稳定后,可再拆成独立文档。

二、系统设计:AI 决策不是孤立模型,而是执行闭环

架构目标是让技术团队能拆清楚:谁提供数据、谁生成动作、谁确认、谁执行、谁复盘、谁负责审计。

输入层

计划、素材、用户、订单、回传、预算、出价、历史动作日志。

数据契约

  • 字段校验
  • 缺失降级
  • 指标口径
  • 快照版本

AI 决策引擎

  • P0-P3 分池
  • 跑不动诊断
  • 大 R 判断
  • 置信度/风险等级

动作编排

  • 动作卡生成
  • 人工确认等级
  • 冻结窗口
  • 回滚条件

执行与复盘

  • 预算/复制计划
  • 回传策略草案
  • 复盘任务
  • 审计日志

协同层

系统工作台 + 钉钉互动卡片。低风险批量确认,高风险跳回系统强确认。

1

定时读数

每日 08:00 拉取快照,动作后按窗口补拉增量。

2

AI 诊断

先跑卡点诊断,再跑分池和动作规则。

3

生成动作卡

输出证据、动作、风险、置信度、复盘计划。

4

通知人

工作台待办 + 钉钉卡片同步触达。

5

确认执行

低风险批量确认,高风险二次确认。

6

复盘任务

执行后自动创建 50/110 分钟等复盘任务。

7

结论回写

继续、维持、回退、禁止复制或沉淀失败参数。

三、系统原型:自研投放系统里的“今日动作台”

技术同学可以按这个原型拆页面、接口和组件。第一版只做一个核心工作台,不先做复杂多页面。

交互演示入口

点击不同场景可定位到对应操作流;每个操作流都包含证据、参数、确认项和人工处理动作。

执行系统约束

动作台不是建议列表,而是 AI 决策进入人机协同执行前的最后控制台。

强风险动作必须勾选确认清单,不能被批量确认带走。 驳回必须选择原因,原因会回写 AI 样本和失败参数库。 每个确认动作必须生成执行任务、冻结窗口、复盘任务和审计日志。

今日动作台执行场景操作流

每条 AI 动作卡都要完成证据核对、执行参数确认、人工决策、执行编排和复盘回写;以下 5 类场景覆盖首版 MVP 的核心动作。

P0 低耗高 ROI:复制计划副本
决策:多人贡献且单点大 R 占比低,说明媒体没有只学到异常尖峰,可以复制 2 个副本放量。动作边界:不改 ROI 目标,不改回传策略,副本预算为原计划 60%,冻结 110 分钟。
P0 临界大 R:价值平滑强确认
决策:ROI 高但单用户贡献 42%,直接扩量会让媒体误判目标人群。动作边界:只生成价值平滑草案,必须系统强确认,钉钉只允许跳转确认页。
P2 信号不足:行为价值补点草案
决策:素材母题有 S/A 高潜,但真实付费不足,先通过草案让媒体理解“推的人是对的”。动作边界:必须有 20% 对照组、第 7 天熔断、每用户最多一次。
P1 常规赚钱:预算 +20%
决策:边际 ROI 达标且素材疲劳低,可以小步加预算验证放量承接能力。动作边界:只加 20%,冻结 110 分钟,不同时改 ROI 目标和回传策略。
待复盘动作:110 分钟窗口
决策:执行动作到点后不继续叠加新动作,先判断消耗响应、CPA、边际 ROI 和素材疲劳。结论只能是继续、维持、回退、禁止复制或补证据。

今日待确认动作

全部 18 强确认 5 P0 6 P1 7 待复盘 11
18AI 动作卡
5强确认
+23%预计可放量空间
7冻结窗口中

AI 诊断记录

今日 跑不动 大 R 风险 缺字段
50今日诊断对象
17跑不动计划
5大 R 风险
3字段缺失

计划 83509:低耗高 ROI 但疑似单点大 R 扭曲

诊断结论:ROI 达成 146%,单用户贡献 42%,不建议直接复制或加预算,先进入价值平滑强确认。

confidence 0.82reason: single_big_r_spikeowner: 投放 A
强风险

素材母题 2107:S/A 高潜充足,付费信号稀疏

诊断结论:可以生成行为价值补点草案,但必须配置 20% 对照组和第 7 天熔断。

S/A 高潜 36control 20%day7 fuse
待草案

计划 84321:低耗高 ROI 且多人贡献稳定

诊断结论:可进入批量确认,复制 2 个副本小步放量,冻结 110 分钟后复盘。

ROI 128%S/A 1.8%多人贡献
可放量

复盘任务

全部 11 50m 到点 110m 到点 次日 ROI
11待复盘
4110m 到点
6等次日 ROI
2回滚候选

rv_84210_110m:预算 +20% 复盘

消耗响应 +31%,CPA 未失控,当前结论是维持观察,次日 08:00 再看新增预算边际 ROI。

action: budget_increasefreeze donenext_day pending
待次日

rv_84321_copy_50m:复制副本 50 分钟检查

展点消响应正常,副本未触发大 R 异常,继续观察到 110 分钟窗口。

replica 2spend response okbig R normal
通过

rv_83509_smooth:价值平滑次日复盘

非大 R 付费回传稳定性需要补数,若次日边际 ROI 不达标,禁止同类参数复制。

smooth draftnon-big-r checksample pending
需人工

回传策略草案

待确认 6 价值平滑 行为补点 对照组
6草案
3强确认
2含对照组
7d最长熔断

draft_83509:临界大 R 价值平滑

只处理复充尖峰,不影响普通付费回传;确认后进入 110 分钟冻结窗口和次日边际 ROI 复盘。

scope: critical_big_r_onlystrong_confirmidempotency required
强确认

draft_motif_2107:行为价值补点

基于 S/A 高潜行为生成草案,补点上限不超过真实付费笔数 30%,保留 20% 对照组。

control 20%max 30%day7 fuse
待实验
这里应该支持查看草案 diff、执行范围、对照组、熔断条件,以及跳转强确认页。

失败参数库

全部 28 禁止复制 回滚参数 媒体风险
28失败样本
9禁止复制
6需回滚
13媒体风险

参数组 fp_big_r_04:单用户贡献超过 45% 后复制失败

失败原因:复制后媒体学习偏向异常高价值用户,消耗未放大,次日边际 ROI 下滑。

禁止复制同类需要价值平滑样本 7
禁用

参数组 fp_signal_02:无对照组补点导致无法归因

失败原因:补点后消耗提升但真实付费不稳定,缺少对照组无法判断是否有效。

control requiredday7 fuse样本 5
限制

审计日志

今日 186 人工确认 执行回调 钉钉事件
186日志事件
42人工操作
31执行回调
0幂等冲突

10:21 act_84321_copy approved

投放 A 确认复制 2 个副本,系统写入 before/after 快照,创建执行任务和 50m/110m 复盘任务。

operator u123version 3idempotency ok
成功

10:08 ding_callback reject draft_motif_2107

钉钉卡片驳回回调,原因:业务负责人要求人工观察,已回写失败参数库。

reject_reason manual_holdsource dingaudit ok
驳回

09:50 executor callback act_84210_budget

预算 +20% 执行成功,冻结窗口到 11:40,复盘任务 rv_84210_110m 已创建。

execute successfreeze_until 11:40review linked
完成

四、钉钉互动卡片:通知什么、怎么确认、按钮触发什么

钉钉卡片不是完整执行系统,只做触达、摘要、轻量确认和跳转。高风险动作必须回到系统详情页完成强确认。

9:41钉钉
投放 AI 决策助手
强确认:P0 大 R 价值平滑 计划 83509 · 风险高 · 需 30 分钟内处理
AI 结论 低耗高 ROI 由单个大 R 拉高,建议生成价值平滑草案。
关键证据 消耗 620;ROI 达成 146%;单用户贡献 42%;置信度 0.82。
执行影响 仅影响临界大 R 复充尖峰;非大 R 用户正常回传。
复盘窗口 50 分钟看展点消,110 分钟看消耗响应,次日看边际 ROI。
安全边界 钉钉不直接执行,点击确认将打开系统强确认页。
查看详情
去确认
驳回
转主管

卡片必须展示

  • 动作类型、目标对象、风险等级、处理时限。
  • AI 结论和不超过 4 条关键证据。
  • 执行影响、复盘窗口、失败回滚条件。
  • 按钮:查看详情、去确认、驳回、转主管。

卡片不能做

  • 不能在 IM 内一键执行关停、回传策略变更、价值平滑。
  • 不能隐藏证据字段,只给“AI 建议”。
  • 不能绕过权限、审计日志和幂等校验。
  • 不能在字段缺失时仍发强执行建议。
动作等级 通知对象 钉钉动作 系统动作
auto_draftAI 自动草案 不强推,仅进入系统待办。 可不发卡片。 生成动作卡和复盘任务草案。
batch_confirm批量确认 计划负责人、当班投放。 卡片可点击“批量确认入口”。 打开系统批量确认页,支持多选执行。
strong_confirm强确认 计划负责人 + 主管。 只允许“去确认/驳回/转主管”。 跳系统详情页,完成二次确认和日志写入。
forbidden禁止执行 负责人 + 数据/系统 Owner。 发风险告警卡。 阻断执行,进入异常处理队列。

五、状态流:动作卡从生成到复盘的技术状态机

状态机是后端、前端、钉钉通知和审计日志的共同语言。每个状态都要可查询、可回放、可追责。

draftAI 生成动作草案,尚未进入通知。
pending_confirm待人工确认,已生成钉钉或系统待办。
approved确认通过,等待执行器处理。
executing执行中,写入 freeze_until 和执行日志。
reviewing执行完成,到点等待复盘数据。
closed复盘完成,输出继续/维持/回退/禁止复制。

状态保护

同一 target 在 freeze_until 之前不能重复生成冲突动作,只能追加观察或升级风险。

幂等执行

每次钉钉点击和系统确认必须携带 action_id、version、operator_id、idempotency_key。

失败回滚

执行接口失败进入 execute_failed,系统保留前置快照,不创建成功复盘任务。

六、接口契约:技术方案可直接按这些对象拆表和接口

这里不是最终数据库设计,但足够让技术团队拆后端实体、前端展示、钉钉 payload 和回调处理。

ActionCard 核心对象

{
  "action_id": "act_20260502_0001",
  "version": 3,
  "target": {
    "type": "plan",
    "plan_id": "83509",
    "account_id": "acc_12",
    "creative_id": "cr_2107"
  },
  "diagnosis": {
    "bucket": "P0",
    "reason_code": "single_big_r_spike",
    "confidence": 0.82,
    "risk_level": "high"
  },
  "evidence": [
    {"field": "spend_today", "value": 620},
    {"field": "roi_achievement", "value": "146%"},
    {"field": "single_user_pay_share", "value": "42%"}
  ],
  "action": {
    "type": "value_smooth_draft",
    "params": {"scope": "critical_big_r_only"}
  },
  "human_gate": "strong_confirm",
  "review_plan": ["50m", "110m", "next_day"],
  "freeze_until": "2026-05-02T10:20:00+08:00"
}

DingTalkCard 交互对象

{
  "card_id": "ding_act_0001",
  "action_id": "act_20260502_0001",
  "receiver": {
    "owner_user_id": "u123",
    "supervisor_user_id": "u456",
    "group_id": "ding_group_789"
  },
  "title": "强确认:P0 大 R 价值平滑",
  "summary_fields": [
    "计划 83509",
    "ROI 达成 146%",
    "单用户贡献 42%",
    "置信度 0.82"
  ],
  "buttons": [
    {"key": "view_detail", "type": "open_url"},
    {"key": "confirm", "type": "open_confirm_page"},
    {"key": "reject", "type": "callback"},
    {"key": "escalate", "type": "callback"}
  ],
  "expire_at": "2026-05-02T10:30:00+08:00"
}
GET /action-cards 前端工作台拉取待确认动作,支持 bucket、risk_level、owner、status、freeze 状态筛选。
POST /actions/:id/approve 系统确认页提交确认,校验权限、版本、幂等键,生成执行任务。
POST /dingtalk/callback 处理钉钉按钮回调;强确认动作只返回系统确认页,不直接调用执行器。
POST /review-tasks 执行成功后创建复盘任务,按 50m、110m、5h、next_day、day7 触发。

七、验收标准:首版不是功能堆满,而是闭环跑通

验收重点是动作不丢、证据可追、确认可控、执行可审、复盘可回写。

验收项 标准 失败判定
动作卡生成 每天 08:00 对试点计划生成 P0-P3 诊断和可解释证据。 出现无证据建议、字段缺失仍强推荐。
人工确认 强风险动作必须经过系统详情页二次确认,日志记录确认人和时间。 钉钉一键直接执行强风险动作。
钉钉通知 卡片包含动作、目标、证据、风险、影响、复盘窗口和确认入口。 只发“AI 建议”但没有证据和处理按钮。
系统执行 执行成功后写入 action_log、before/after 快照和 freeze_until。 执行成功但无日志,或冻结窗口内重复冲突动作。
复盘闭环 每个执行动作自动生成至少一个复盘任务,并回写结论。 动作执行后无人复盘、无状态流转。