超高标准 PRD 含系统原型 + 钉钉互动卡片供技术方案拆解

AI 人机协同投放决策执行系统 PRD

本文档把“投放算法对抗策略”产品化为自研投放系统中的 AI 决策执行模块。目标不是让 AI 全自动接管投放，而是让 AI 完成读数、诊断、动作卡生成、通知、复盘，人负责确认高风险动作，系统负责执行、冻结窗口、审计和学习沉淀。

一、模块地图：总纲跳转到每个详细设计

点击任一模块卡，会在浮窗里打开本地模块详细设计文档；技术方案稳定后，可再拆成独立文档。

系统设计

数据层、AI 决策层、动作编排、执行器、钉钉通知、复盘任务的职责边界。

系统原型

自研投放系统里的今日动作台、动作详情抽屉、证据区和确认区。

钉钉卡片

人工确认如何通知、展示什么信息、有哪些按钮、按钮触发什么事件。

状态流

动作卡从 draft 到 reviewed 的完整状态机，以及权限与冻结窗口。

接口契约

动作卡 schema、钉钉卡片 payload、回调事件和幂等字段。

复盘学习

复盘任务如何创建、到点拉数、判断成败、回写结论和触发下一动作。

二、系统设计：AI 决策不是孤立模型，而是执行闭环

架构目标是让技术团队能拆清楚：谁提供数据、谁生成动作、谁确认、谁执行、谁复盘、谁负责审计。

输入层

计划、素材、用户、订单、回传、预算、出价、历史动作日志。

数据契约

字段校验
缺失降级
指标口径
快照版本

AI 决策引擎

P0-P3 分池
跑不动诊断
大 R 判断
置信度/风险等级

动作编排

动作卡生成
人工确认等级
冻结窗口
回滚条件

执行与复盘

预算/复制计划
回传策略草案
复盘任务
审计日志

协同层

系统工作台 + 钉钉互动卡片。低风险批量确认，高风险跳回系统强确认。

定时读数

每日 08:00 拉取快照，动作后按窗口补拉增量。

AI 诊断

先跑卡点诊断，再跑分池和动作规则。

生成动作卡

输出证据、动作、风险、置信度、复盘计划。

通知人

工作台待办 + 钉钉卡片同步触达。

确认执行

低风险批量确认，高风险二次确认。

复盘任务

执行后自动创建 50/110 分钟等复盘任务。

结论回写

继续、维持、回退、禁止复制或沉淀失败参数。

三、系统原型：自研投放系统里的“今日动作台”

技术同学可以按这个原型拆页面、接口和组件。第一版只做一个核心工作台，不先做复杂多页面。

交互演示入口

点击不同场景可定位到对应操作流；每个操作流都包含证据、参数、确认项和人工处理动作。

复制副本强确认平滑补点草案预算扩量复盘任务

执行系统约束

动作台不是建议列表，而是 AI 决策进入人机协同执行前的最后控制台。

强风险动作必须勾选确认清单，不能被批量确认带走。驳回必须选择原因，原因会回写 AI 样本和失败参数库。每个确认动作必须生成执行任务、冻结窗口、复盘任务和审计日志。

18AI 动作卡

5强确认

+23%预计可放量空间

7冻结窗口中

50今日诊断对象

17跑不动计划

5大 R 风险

3字段缺失

计划 83509：低耗高 ROI 但疑似单点大 R 扭曲

诊断结论：ROI 达成 146%，单用户贡献 42%，不建议直接复制或加预算，先进入价值平滑强确认。

confidence 0.82reason: single_big_r_spikeowner: 投放 A

强风险

素材母题 2107：S/A 高潜充足，付费信号稀疏

诊断结论：可以生成行为价值补点草案，但必须配置 20% 对照组和第 7 天熔断。

S/A 高潜 36control 20%day7 fuse

待草案

计划 84321：低耗高 ROI 且多人贡献稳定

诊断结论：可进入批量确认，复制 2 个副本小步放量，冻结 110 分钟后复盘。

ROI 128%S/A 1.8%多人贡献

可放量

11待复盘

4110m 到点

6等次日 ROI

2回滚候选

rv_84210_110m：预算 +20% 复盘

消耗响应 +31%，CPA 未失控，当前结论是维持观察，次日 08:00 再看新增预算边际 ROI。

action: budget_increasefreeze donenext_day pending

待次日

rv_84321_copy_50m：复制副本 50 分钟检查

展点消响应正常，副本未触发大 R 异常，继续观察到 110 分钟窗口。

replica 2spend response okbig R normal

通过

rv_83509_smooth：价值平滑次日复盘

非大 R 付费回传稳定性需要补数，若次日边际 ROI 不达标，禁止同类参数复制。

smooth draftnon-big-r checksample pending

需人工

6草案

3强确认

2含对照组

7d最长熔断

draft_83509：临界大 R 价值平滑

只处理复充尖峰，不影响普通付费回传；确认后进入 110 分钟冻结窗口和次日边际 ROI 复盘。

scope: critical_big_r_onlystrong_confirmidempotency required

强确认

draft_motif_2107：行为价值补点

基于 S/A 高潜行为生成草案，补点上限不超过真实付费笔数 30%，保留 20% 对照组。

control 20%max 30%day7 fuse

待实验

这里应该支持查看草案 diff、执行范围、对照组、熔断条件，以及跳转强确认页。

28失败样本

9禁止复制

6需回滚

13媒体风险

参数组 fp_big_r_04：单用户贡献超过 45% 后复制失败

失败原因：复制后媒体学习偏向异常高价值用户，消耗未放大，次日边际 ROI 下滑。

禁止复制同类需要价值平滑样本 7

禁用

参数组 fp_signal_02：无对照组补点导致无法归因

失败原因：补点后消耗提升但真实付费不稳定，缺少对照组无法判断是否有效。

control requiredday7 fuse样本 5

限制

186日志事件

42人工操作

31执行回调

0幂等冲突

10:21 act_84321_copy approved

投放 A 确认复制 2 个副本，系统写入 before/after 快照，创建执行任务和 50m/110m 复盘任务。

operator u123version 3idempotency ok

成功

10:08 ding_callback reject draft_motif_2107

钉钉卡片驳回回调，原因：业务负责人要求人工观察，已回写失败参数库。

reject_reason manual_holdsource dingaudit ok

驳回

09:50 executor callback act_84210_budget

预算 +20% 执行成功，冻结窗口到 11:40，复盘任务 rv_84210_110m 已创建。

execute successfreeze_until 11:40review linked

完成

批量确认

复制计划副本确认

当前状态：pending_confirm · 可批量确认

目标对象 plan_id=84321，action_type=copy_plan_replica

AI 诊断 低耗高 ROI 由多人共同贡献，适合复制副本放量，不需要价值平滑。

关键证据 消耗 860；ROI 达成 128%；S/A 占比 1.8%；多人贡献；置信度 0.78。

执行参数 复制 2 个副本；预算为原计划 60%；冻结 110 分钟；次日看边际 ROI。

复盘计划 50 分钟看展点消，110 分钟看消耗响应，次日看新增预算边际 ROI。

执行前确认清单 证据字段完整，已核对是否存在单点大 R 扭曲。已确认冻结窗口和冲突动作限制。已确认复盘窗口、回滚条件和责任人。

驳回原因

执行 payload 预览 POST /actions/act_84321/approve action_type=copy_plan_replica freeze=110m review=50m,110m,next_day

操作提示：点击左侧动作卡查看详情，或使用确认按钮模拟状态变化。

四、钉钉互动卡片：通知什么、怎么确认、按钮触发什么

钉钉卡片不是完整执行系统，只做触达、摘要、轻量确认和跳转。高风险动作必须回到系统详情页完成强确认。

9:41钉钉

投放 AI 决策助手

强确认：P0 大 R 价值平滑 计划 83509 · 风险高 · 需 30 分钟内处理

AI 结论 低耗高 ROI 由单个大 R 拉高，建议生成价值平滑草案。

关键证据 消耗 620；ROI 达成 146%；单用户贡献 42%；置信度 0.82。

执行影响 仅影响临界大 R 复充尖峰；非大 R 用户正常回传。

复盘窗口 50 分钟看展点消，110 分钟看消耗响应，次日看边际 ROI。

安全边界 钉钉不直接执行，点击确认将打开系统强确认页。

查看详情

去确认

驳回

转主管

卡片必须展示

动作类型、目标对象、风险等级、处理时限。
AI 结论和不超过 4 条关键证据。
执行影响、复盘窗口、失败回滚条件。
按钮：查看详情、去确认、驳回、转主管。

卡片不能做

不能在 IM 内一键执行关停、回传策略变更、价值平滑。
不能隐藏证据字段，只给“AI 建议”。
不能绕过权限、审计日志和幂等校验。
不能在字段缺失时仍发强执行建议。

动作等级	通知对象	钉钉动作	系统动作
auto_draftAI 自动草案	不强推，仅进入系统待办。	可不发卡片。	生成动作卡和复盘任务草案。
batch_confirm批量确认	计划负责人、当班投放。	卡片可点击“批量确认入口”。	打开系统批量确认页，支持多选执行。
strong_confirm强确认	计划负责人 + 主管。	只允许“去确认/驳回/转主管”。	跳系统详情页，完成二次确认和日志写入。
forbidden禁止执行	负责人 + 数据/系统 Owner。	发风险告警卡。	阻断执行，进入异常处理队列。

五、状态流：动作卡从生成到复盘的技术状态机

状态机是后端、前端、钉钉通知和审计日志的共同语言。每个状态都要可查询、可回放、可追责。

draftAI 生成动作草案，尚未进入通知。

pending_confirm待人工确认，已生成钉钉或系统待办。

approved确认通过，等待执行器处理。

executing执行中，写入 freeze_until 和执行日志。

reviewing执行完成，到点等待复盘数据。

closed复盘完成，输出继续/维持/回退/禁止复制。

状态保护

同一 target 在 freeze_until 之前不能重复生成冲突动作，只能追加观察或升级风险。

幂等执行

每次钉钉点击和系统确认必须携带 action_id、version、operator_id、idempotency_key。

失败回滚

执行接口失败进入 execute_failed，系统保留前置快照，不创建成功复盘任务。

六、接口契约：技术方案可直接按这些对象拆表和接口

这里不是最终数据库设计，但足够让技术团队拆后端实体、前端展示、钉钉 payload 和回调处理。

ActionCard 核心对象

{
  "action_id": "act_20260502_0001",
  "version": 3,
  "target": {
    "type": "plan",
    "plan_id": "83509",
    "account_id": "acc_12",
    "creative_id": "cr_2107"
  },
  "diagnosis": {
    "bucket": "P0",
    "reason_code": "single_big_r_spike",
    "confidence": 0.82,
    "risk_level": "high"
  },
  "evidence": [
    {"field": "spend_today", "value": 620},
    {"field": "roi_achievement", "value": "146%"},
    {"field": "single_user_pay_share", "value": "42%"}
  ],
  "action": {
    "type": "value_smooth_draft",
    "params": {"scope": "critical_big_r_only"}
  },
  "human_gate": "strong_confirm",
  "review_plan": ["50m", "110m", "next_day"],
  "freeze_until": "2026-05-02T10:20:00+08:00"
}

DingTalkCard 交互对象

{
  "card_id": "ding_act_0001",
  "action_id": "act_20260502_0001",
  "receiver": {
    "owner_user_id": "u123",
    "supervisor_user_id": "u456",
    "group_id": "ding_group_789"
  },
  "title": "强确认：P0 大 R 价值平滑",
  "summary_fields": [
    "计划 83509",
    "ROI 达成 146%",
    "单用户贡献 42%",
    "置信度 0.82"
  ],
  "buttons": [
    {"key": "view_detail", "type": "open_url"},
    {"key": "confirm", "type": "open_confirm_page"},
    {"key": "reject", "type": "callback"},
    {"key": "escalate", "type": "callback"}
  ],
  "expire_at": "2026-05-02T10:30:00+08:00"
}

GET /action-cards 前端工作台拉取待确认动作，支持 bucket、risk_level、owner、status、freeze 状态筛选。

POST /actions/:id/approve 系统确认页提交确认，校验权限、版本、幂等键，生成执行任务。

POST /dingtalk/callback 处理钉钉按钮回调；强确认动作只返回系统确认页，不直接调用执行器。

POST /review-tasks 执行成功后创建复盘任务，按 50m、110m、5h、next_day、day7 触发。

七、验收标准：首版不是功能堆满，而是闭环跑通

验收重点是动作不丢、证据可追、确认可控、执行可审、复盘可回写。

验收项	标准	失败判定
动作卡生成	每天 08:00 对试点计划生成 P0-P3 诊断和可解释证据。	出现无证据建议、字段缺失仍强推荐。
人工确认	强风险动作必须经过系统详情页二次确认，日志记录确认人和时间。	钉钉一键直接执行强风险动作。
钉钉通知	卡片包含动作、目标、证据、风险、影响、复盘窗口和确认入口。	只发“AI 建议”但没有证据和处理按钮。
系统执行	执行成功后写入 action_log、before/after 快照和 freeze_until。	执行成功但无日志，或冻结窗口内重复冲突动作。
复盘闭环	每个执行动作自动生成至少一个复盘任务，并回写结论。	动作执行后无人复盘、无状态流转。

AI 人机协同投放决策执行系统 PRD

一、模块地图：总纲跳转到每个详细设计

系统设计

系统原型

钉钉卡片

状态流

接口契约

复盘学习

二、系统设计：AI 决策不是孤立模型，而是执行闭环

输入层

数据契约

AI 决策引擎

动作编排

执行与复盘

协同层

定时读数

AI 诊断

生成动作卡

通知人

确认执行

复盘任务

结论回写

三、系统原型：自研投放系统里的“今日动作台”

交互演示入口

执行系统约束

今日动作台执行场景操作流

今日待确认动作

P0 低耗高 ROI：计划 84321 建议复制 2 个副本

临界大 R：计划 83509 需要价值平滑强确认

P2 信号不足：素材母题 2107 建议行为价值补点草案

P1 常规赚钱：计划 84210 建议预算 +20%

待复盘：计划 84210 预算 +20% 已到 110 分钟窗口

AI 诊断记录

计划 83509：低耗高 ROI 但疑似单点大 R 扭曲

素材母题 2107：S/A 高潜充足，付费信号稀疏

计划 84321：低耗高 ROI 且多人贡献稳定

复盘任务

rv_84210_110m：预算 +20% 复盘

rv_84321_copy_50m：复制副本 50 分钟检查

rv_83509_smooth：价值平滑次日复盘

回传策略草案

draft_83509：临界大 R 价值平滑

draft_motif_2107：行为价值补点

失败参数库

参数组 fp_big_r_04：单用户贡献超过 45% 后复制失败

参数组 fp_signal_02：无对照组补点导致无法归因

审计日志

10:21 act_84321_copy approved

10:08 ding_callback reject draft_motif_2107

09:50 executor callback act_84210_budget

四、钉钉互动卡片：通知什么、怎么确认、按钮触发什么

卡片必须展示

卡片不能做

五、状态流：动作卡从生成到复盘的技术状态机

状态保护

幂等执行

失败回滚

六、接口契约：技术方案可直接按这些对象拆表和接口

ActionCard 核心对象

DingTalkCard 交互对象

七、验收标准：首版不是功能堆满，而是闭环跑通