KP Brief

鲸歌数据平台迭代方案

把实验判断周期从 1-2 天压到 2-4 小时；数据闭合当天完成可信判断，并同步到飞书协作流。

飞书多维表格提供实验管理看板Table

网页指标看板对齐行业实践，替代电子表格Web

飞书机器人主动推送摘要、告警和行动项Bot

命令行提供数据接口，随能力包发给全员CLI

系统架构

鲸歌数据平台架构总览

KP 可以一眼看到四个触点如何分工：飞书承接管理协作，网页承接实验判断，命令行承接数据能力，机器人承接主动提醒。

核心闭环

提问产品经理 / 分析师提出实验判断需求

取数调度刷新 + 结果复用

判断统计标注 + 人工确认

决策生成标准结论材料并写入鲸歌接口

跟踪飞书看板和机器人推动落地

▼

四项交付能力

命令行数据接口全员的人工智能助手都能拿到实验背景和最新数据结果

鲸歌在线版对齐行业产品分析实践，替代电子表格判断链路

飞书多维表格实验管理看板、负责人视图、版本数据检测

飞书机器人每日摘要、告警、行动项提醒

▼

应用层

实验报告留存、收入、漏斗、可信标注 · 首版

实验管理看板项目 / 个人视图 + 30% 灰度后版本检查 · 首版

结论生成标准摘要 + Copy as Markdown · 后置

指标与函数审核推荐指标、计算口径、人工确认 · 第二批

历史实验指标建议历史实验挖掘 + 指标建议 · 后置

▼

引擎层

调度引擎闲时计算 + 增量刷新 · 首版

看板标注服务分组比例、样本量、最小可识别效果、可信度 · 首版

结论草稿组装标准分析摘要自动生成 · 第二批

▼

数据层

数据仓库指标计算 + 底表查询

鲸歌接口元数据 + 实验状态（事实源）

数据结果快照按实验、日期范围和指标口径复用

▼

基座（已有）

鲸歌实验计划管理 · 分组标签 · 实验执行 · 底表导出 · 结论存储

竞品参考

可直接复用的产品做法

用成熟产品做法降低方案风险：实验报告参考 PostHog，命令行参考 lark-cli，协作参考飞书。

OpenAI Data Agent 架构

工具调用、过程记录、质量评估。

PostHog 网页分析界面

多指标实验详情、趋势、漏斗、可信标注同屏展示。

CLI

lark-cli 命令行工具

稳定命令封装，降低平台操作成本。

飞

飞书多维表格和飞书机器人

单表多视图、负责人看板、主动提醒。

助手数据能力 / 命令行工具

命令行数据接口

让每个助手一键拿齐实验材料。输入实验编号后，助手可直接拿到背景、最新结果、明细文件和回流入口，把分析前找材料和补口径压到一次命令内完成。

背景结果明细回流入口

命令行工作台

分析师在自己的人工智能助手里调用鲸歌数据接口，直接获得实验背景、最新结果和可回流文件，减少手工找材料。

可随能力包发布

实际助手界面实验编号 13871

用户: 帮我分析 AlarmKit 实验

助手: 读取实验背景
鲸歌: 已带上项目、分组、观察天数、计费项目和历史注意事项

助手: 获取最新留存结果
鲸歌: 首日留存提升 3.7 个百分点，分组比例正常

助手: 生成 summary.md、result.csv、query.sql 和回流链接。

指标与函数审核 · P2 后置需求：把推荐指标、函数标签和看板标注规则放进审核队列，首版先服务核心看板链路。

检查口径预览影响提交审核

指标与函数审核

分析师把新指标、函数标签和看板标注规则放进审核队列，减少口径漂移，确保后续实验引用同一套解释。

命令行触点人工审核

审核项	类型	证据	状态
提醒功能专项指标组主要指标、辅助指标、护栏指标	指标组	3 个历史实验验证	已通过
推送打开后收入指标来自推送打开事件	函数标签	实验详情页已核对	待审核
首日至第五日卸载标注规则必须和随机控制组比较	看板标注	历史分析回测通过	已通过
样本不足标灰规则分组用户数少于 100	看板标注	平台规则	已通过

审核说明

实验类型

Alarm 专项

函数标签

提醒打开、七日收入、三日卸载损失

看板标注规则

数据成熟、分组比例、最小可识别效果、样本不足

已知注意事项

交付边界

能力	包含什么	暂不处理	输出位置
指标组模板	主要指标、辅助指标、护栏指标	自动下判断	鲸歌在线版实验详情
函数标签审核	标签名称、使用原因、核对证据	直接改写鲸歌事实源	命令行创建入口
看板标注规则	可信度标注和统计解释	代替分析师做决策	鲸歌在线版
历史证据	来自历史案例的验证记录	维护指标计算引擎	审核队列

历史实验指标建议 · P2 后置需求：挖掘相似实验，给项目负责人提供指标建议和历史注意事项。

更新历史库查看命中原因加入指标建议

历史实验指标建议

项目负责人查看新实验时，直接看到相似历史案例、推荐指标和曾经踩过的坑，减少从零判断。

后置增强辅助判断

历史实验已导入

286

可继续补录

相似案例本实验

按项目和指标匹配

推荐指标待确认

给项目负责人选择

历史注意事项可复用

展示原因

找历史案例

同项目、同功能、同人群

历史结论和当时观察指标

曾经踩过的坑

生成指标建议

建议主要指标

建议护栏指标

建议拆分维度

给项目负责人确认

展示命中原因

一键加入实验看板

确认后进入鲸歌在线版

指标建议清单

建议指标	来自哪些历史实验	为什么建议看	项目负责人动作
首日留存	AlarmKit、Quotes、HomeCard	类似实验主要影响新用户回访	加入本次实验
七日收入	Audio、Bible、Wallpaper	历史上短期留存提升不一定带来收入提升	待确认
卸载率	AlarmKit、FocusMode	强提醒功能容易带来负向护栏	加入本次实验
地区拆分	Quotes、Bible	美国和全球历史表现差异明显	打开原因

问题定义

当前痛点

把问题和能力一一对应，优先解决项目实验管理、实验报告、飞书提醒和命令行取数四条主路径。

缺少实验全景，项目负责人和产品经理难管理自己的实验

项目里哪些实验在入组、哪些数据闭合、哪些等待决策、哪些影响同一指标，需要一个协作层统一看。

项目全景产品经理自管理30% 灰度检查

飞书多维表格提供实验管理看板

用单表多视图承接项目 / 个人看板、负责人、个人行动项、30% 灰度后版本检查和结论落地。预估每周节省 0.5-1 天项目同步和追状态时间。

飞书多维表格项目 / 个人看板每周节省 0.5-1 天

产品经理实验决策依赖电子表格，指标解释不稳定

多张表结果难以对齐留存、收入、漏斗、广告收入特殊情况和趋势判断，累计留存也不容易被固定查看。

电子表格分散趋势判断广告收入特殊情况

鲸歌在线版替代电子表格

统一展示美国和全球、累计留存、趋势性指标、广告收入特殊情况和人工判断区。预估每个实验节省 2-4 小时表格整理和反复解释时间。

鲸歌在线版美国 / 全球节省 2-4 小时

数据就绪、异常和行动项靠人主动盯

实验数据闭合、刷新失败、分区缺失、结论待填写和产品动作待落地，都需要相关人主动打开页面检查，容易漏掉当天可处理的实验。

主动盯状态异常容易漏行动项分散

飞书机器人主动推送摘要、告警和行动项

每天推送可处理实验、异常告警和下一步动作，让相关人直接从飞书进入处理。预估每天节省 30-60 分钟巡检和催办时间。

每日摘要异常告警每天节省 30-60 分钟

人工智能助手每次分析都要重新补实验背景

分析师和项目负责人反复补实验计划、分组、观察窗口、指标口径、历史注意事项和最新结果，真正判断前先花大量时间找材料。

背景反复补充查询和明细获取结果回流

命令行提供数据接口

把实验背景、最新结果、明细文件和结论草稿入口随能力包发给全员。预估每个实验节省 1-2 小时上下文装配时间，分析师把时间留给判断和复核。

命令行数据接口能力包全员发布节省 1-2 小时

流程说明

平台流程图

KP 可以看到实验从创建、取数、判断到飞书协作的完整流向，确认首版链路是否覆盖当天可决策的主路径。

实验配置已有

鲸歌负责创建实验、下发分组和导出底表。

鲸歌人工

上下文装配第二批

命令行工具读取实验元数据、指标模板、历史注意事项和计费项目。

命令行自动

指标与函数审核后置

合并函数审核和指标注册，产出可审查的查询、标签和模板。

命令行人工审核

定时刷新首版

闲时计算样本、指标、分组比例、最小可识别效果和闭合状态，高峰期只补增量。

网页自动

实验报告首版

展示美国和全球、累计留存、趋势判断、广告收入特殊情况和可信度标注。

网页自动展示

结论生成后置

按标准模板生成可复制的 Markdown 摘要，写入动作由现有流程承接。

网页 / 命令行标准输出

协作跟踪首版

飞书多维表格管理状态、产品动作、30% 灰度后版本检查和个人行动项。

飞书看板半自动

每日摘要第二批

飞书机器人在 08:30 推送可决策摘要，带发布、停止、转发和打开详情动作。

飞书机器人自动

异常路径

刷新失败：进入飞书机器人，转给分析师排查分区或查询。
样本不足：鲸歌在线版标灰，每日摘要不提供直接决策按钮。
分组比例或广告收入趋势异常：进入人工审核，再生成结论材料。

自动化边界

系统自动做取数、标准分析、摘要和同步。
人工保留审核、异常判断、最终决策和产品动作。

⌘K刷新数据

个人实验看板

产品经理早上打开看板，只看自己今天要处理的数据就绪、异常排查、结论生成和产品动作。

导出周报打开飞书视图

待分析today

2 个数据就绪超过 24h

运行中running

1 个样本量偏慢

待落地decision

CloudX 已 7 天未全量

本月建议发布率本月

62%

+8pp vs 上月

实验	状态	关键指标	下一步	操作
Oa 158 Quotes_III_UP 实验 13902 · 第七日成熟	数据就绪	第七日留存 +2.1pp	今天完成分析	打开鲸歌在线版生成结论
BFWa 079 老用户 MC_UP 实验 13888 · 同步待确认	待确认	缺少最新分区	排查导出	查看日志转分析师
Audio_Experience3 实验 13876 · 第五日	待分析	单用户收入 +4.8%	补漏斗	看漏斗打开分析记录
CloudX_SR_UP 实验 13765 · 已结论	待落地	灰度发布	推进全量	催办写回飞书

今天优先级

1. 先处理数据同步

BFWa 079 缺少最新分区，会影响 30% 灰度后的版本检查。

影响 BFW 079

2. 完成 Quotes 分析

第七日已成熟，样本量达标，可直接进入实验详情页看全套指标。

待分析

3. 推动 CloudX 全量

结论已超过 7 天，飞书提醒已发送。

发布跟进

项目看板个人看板同步飞书看板

项目实验看板

项目负责人按版本查看所有实验的目标样本量、当前入组、区域拆分和数据闭合状态，快速判断哪些实验可以推进。

首版数据管理3 个窗口待闭合

项目看板个人看板本周本月负责人：全部

运行中实验live

8 个仍在入组

今日新增入组US / Global

18.4k

US 36% · Global 64%

第七日已闭合就绪

可进入决策

预测完成日BFW 079

6/24

2 个实验等第七日

入组人数与数据闭合

实验	版本	区域	目标样本量	当前入组	观察窗口	状态
MC_UP	BFW 079	US + Global	40k	42.8k	第七日已闭合	可分析
HomeCard	BFW 079	Global	45k	31.2k	第七日等待中	入组中
FocusMode	BFW 079	US	30k	18.6k	第七日等待中	样本不足
Scroll_UP	BFW 079	Global	25k	24.4k	明日闭合	接近完成

实验	负责人	区域	入组进度	预测完成	数据状态
MC_UP	罗文泽	US + Global	42.8k / 40k	已完成	已闭合
HomeCard	辰洋	Global	31.2k / 45k	6/24	入组中
FocusMode	Chris	US	18.6k / 30k	6/26	等样本
Scroll_UP	罗文泽	Global	24.4k / 25k	6/20	明日闭合

负责人积压

罗文泽

7 个实验，3 个待分析，完成比 57%。

本周较忙

辰洋

4 个实验，主要负责广告收入特殊情况和趋势判断。

方法支持

项目节奏

上月平均周期 9d，本月 11d，趋势 +22%。

需复盘

打开分析记录同步飞书生成结论

实验报告

Bi AlarmKit 新 (#13871) · iOS · US / Global · 新用户 · contrast_days 7。产品经理在单个实验页同时看主指标、二级指标、护栏指标和趋势标注，替代电子表格来做实验判断。

数据已闭合分组比例正常第七日成熟

首日第三日第七日第十四日美国全球广告收入特殊情况

样本量两组对比

42.8k

预计完成日 6/16

首日留存主要指标

+3.7pp

显著提升

七日单用户收入主要指标

+5.2%

区间 +1.1% ~ +9.4%

广告收入特殊情况

+1.8%

趋势观察中

多指标实验结果 · 参考 PostHog 指标组

主指标 累计留存 美国 +3.7pp · 全球 +2.4pp

主指标 七日单用户收入 +5.2% · 区间稳定

二级指标 提醒打开率 +4.8% · 漏斗同步提升

护栏指标 崩溃率 / 退订率 正常 · 无负向告警

主指标 · 美国+3.7pp

主指标 · 全球+2.4pp

二级指标 · 打开率+4.8%

护栏指标 · 崩溃率正常

美国 A 组累计留存美国对照组全球 A 组全球对照组

鲸歌在线版标注

数据闭合	第七日成熟
样本量	各组用户数大于 100
分组比例	正常
累计留存趋势	美国持续正向
广告收入特殊情况	需看 14 日趋势

提升幅度与置信区间

首日留存提升 3.7 个百分点置信区间 +1.1 ~ +6.4 个百分点

自动装配上下文

历史实验	找到 4 个 Alarm 类似实验
历史基线	美国第七日累计留存 23.4%
注意事项	提醒展示需要和应用打开一起看
推荐决策	灰度发布

漏斗

show 100%allow 71%open 48%

A 组在 allow 后回流更高。

启动来源

alarmorganicpush

alarm_app_open 与 start_app_activities 对齐。

趋势说明

鲸歌在线版展示累计留存和趋势标注，并生成可复制的结论摘要。

等待结论生成

Esc 关闭

全局搜索

产品经理和分析师用一个入口查实验、指标、异常和快捷动作，减少在多个页面之间来回找。

后置效率能力

⌘K全局搜索与快捷动作↑↓ 选择Enter 打开

⌘Kalarm

全部实验指标动作最近

Bi AlarmKit 新 (#13871)运行中 · 第七日已成熟 · 首日留存 +3.7pp

打开详情

Bi AlarmKit 老 (#13872)数据就绪 · 需要产品经理分析

待分析

BFW alarm 回流率北极星指标 · 过去 7 天 +4.1%

指标

AlarmKit 分组比例检查警告 · 样本比例连续 2 天偏离

待复核

刷新 BFW 项目数据执行定时查询并同步飞书多维表格

快捷操作

最近打开：Quotes_III_UP昨天打开 · 第七日留存 +2.1pp

闲时计算调度

数据负责人查看哪些实验已刷新、哪些指标在排队、哪些任务失败，保证高峰期看板仍能及时出数。

首版 · 每晚 02:30

实验状态同步每小时

鲸歌接口 → 鲸歌在线版

闲时计算02:30

进行中实验优先

结果复用率结果快照

73%

高峰期少排队

任务	来源	频率	状态
实验执行状态	鲸歌接口	每小时	成功
样本量进度	数据仓库	每日	成功
核心指标值	数据仓库	闲时计算	排队中
分组比例检查	数据仓库	每日	成功
鲸歌在线版标注	标注规则	数据就绪触发	已生成
标准分析摘要	摘要模板	数据就绪触发	已生成
飞书通知	机器人流程	实时/每日	2 条待确认

标准分析输出

结论摘要
  建议：灰度发布
  主要指标：首日留存提升 3.7 个百分点，结果显著
  护栏指标：卸载率稳定
  注意事项：广告收入需要继续观察第十四日趋势

结果快照 = 实验编号 + 指标集合 + 日期范围
新鲜度 = 最新可用分区
格式 = 内部存储明细

running: 每日刷新
concluded: 停止刷新
archived: 冻结快照

结论生成 · P2 后置需求：标准模板生成摘要，支持 Copy as Markdown，暂时不作为首版主链路。

复制 Markdown生成摘要

结论生成

分析师一键生成标准 Markdown 摘要，把指标变化、可信标注、注意事项和建议动作复制到鲸歌、飞书或分析记录。

Copy as Markdown

标准摘要模板

建议动作

灰度发布

核心指标变化

首日留存 +3.7pp · 置信区间 +1.1pp ~ +6.4pp · 七日单用户收入 +5.2%

Markdown 摘要

产品动作

灰度发布 → 观察 7 天 → 全量

回看计划

2026-06-23 自动提醒，检查提醒回流率与广告收入第十四日趋势

复制与回流

Copy as Markdown

粘贴到鲸歌结论字段

同步到飞书多维表格状态

计算过程回流实验记录

订阅提醒：7 天后检查是否全量

审计记录

Chris Chen · 2026-06-16 20:45 · changed status from 待分析 to 已结论

交付规划

交付路线图

KP 可以区分首版必须交付和后置讨论范围，避免把指标审核、历史建议和自动化编排挤进首版主链路。

首版

命令行数据能力全员发布

随团队能力包发给全员，提供实验背景、最新结果、明细文件和回流入口。

首版

实验报告

对齐行业实践，提供留存、收入、漏斗、趋势和可信标注，用鲸歌在线版替代电子表格。

首版

飞书多维表格

提供实验管理看板，承接项目 / 个人视图、入组人数、数据闭合和 30% 灰度后版本检查。

第二批

飞书机器人

提供每日摘要、异常告警和行动项提醒，把待处理实验主动推给相关人。

范围收敛

需求	阶段	原因
历史实验指标建议	后置	增强判断质量，但不阻塞当天完成实验判断。
指标与函数审核	后置	把经过验证的口径固化到鲸歌在线版的实验看板里，首版先保留人工整理。
全局搜索	后置	提升效率，首版可用侧边栏和飞书视图覆盖主路径。
结论生成	后置	标准摘要支持 Copy as Markdown，首版先把数据和看板跑通。

四个触点怎么落地

能力	命令行工具	鲸歌在线版	飞书看板	飞书机器人
查看实验详情	读取背景	详情页	记录详情	摘要推送
执行数据分析	获取查询结果	查看结果	同步摘要	提醒入口
查看数据图表	导出链接	趋势/漏斗	简单仪表盘	每日摘要
结论生成	生成 Markdown	复制摘要	字段同步	提醒处理
团队协作	审计记录	权限共享	飞书协作	主动通知

待讨论问题

思考如何把 Agent loop / automation cron job 融入现有系统中

讨论鲸歌是否提供类似 Zapier 的编排能力；涉及人工智能助手分析时，明确如何做评估、质量回看和避坑机制。

全部实验我的行动项

个人实验看板

产品经理在飞书多维表格里按负责人、状态和行动项筛选实验，减少项目同步和追状态时间。

鲸歌接口同步成功最近同步 08:30

规划中 3

Audio 新手引导

假设：提升试听转化

产品经理填写

配置中 2

HomeCard_Interaction

鲸歌草稿已创建

自动映射

运行中 6

FocusMode_NEW

开始日期 ≤ 今天 < 结束日期

自动推断

数据就绪 4

Quotes_III_UP

鲸歌执行完毕

需分析

已结论 8

MC_UP

结论：建议发布，产品动作：灰度

待落地

状态机

规划中产品经理提出假设

配置中创建实验计划

运行中自动入组

数据就绪触发摘要

已结论写入鲸歌

已落地灰度/全量

分支：排队中计划时间未到

分支：失败导出或分区异常

分支：待复盘版本后回看

终态：已归档30 天后归档

复制到飞书生成全量或撤版建议

版本数据检测

BFW 079 发布到 30% 灰度后，检查绑定实验的核心指标、护栏指标、异常告警和用户反馈，用来判断版本全量、继续观察或撤版。

灰度覆盖BFW 079

30%

等待全量 / 撤版判断

绑定实验	灰度后信号	风险	版本判断
MC_UP	留存稳定提升	风险低	支持全量
HomeCard_Interaction	打开率下降	影响首页入口	撤版候选
Scroll_UP	收入持平	风险低	支持全量
FocusMode_NEW	第七日未闭合	继续观察	暂缓全量
FocusMode_OLD	护栏异常	卸载率上升	暂缓或撤版

全量 / 撤版建议

30% 灰度数据稳定的实验进入全量候选；护栏异常或核心指标回落的实验进入撤版候选。

核心指标

护栏指标

用户反馈

支持全量继续观察撤版风险

每日汇总设置严重 2

飞书机器人：每日摘要

产品经理每天 08:30 在飞书收到可处理实验、异常告警和下一步动作，减少主动巡检。

08:30 已发送4 张行动卡片

鲸歌实验每日摘要2026-06-16 08:30

今日 3 个实验数据就绪Quotes_III_UP · AlarmKit 新 · Audio_Experience3

打开优先级

Quotes 第七日留存 +2.1pp结果显著 · 置信区间 +0.6pp ~ +3.8pp · 建议灰度发布

回复发布

BFWa 079 缺少最新分区影响 30% 灰度后版本检查，建议转给分析师排查

@分析师

CloudX 已 7 天未全量灰度数据稳定，可提醒工程推进

@工程

交互按钮

回复发布 / 停止 / 继续观察

明确实验可以直接在飞书内写入草稿结论。

低摩擦

打开鲸歌在线版

数据模糊时跳转到累计留存、广告收入趋势和置信区间图。

深看

转发给分析师

数据异常、分区缺失和分组比例复核进入分析师队列。

协作

鲸歌数据平台迭代方案

鲸歌数据平台架构总览

可直接复用的产品做法

OpenAI Data Agent 架构

PostHog 网页分析界面

lark-cli 命令行工具

飞书多维表格和飞书机器人

命令行数据接口

命令行工作台

指标与函数审核

审核说明

交付边界

历史实验指标建议

找历史案例

生成指标建议

给项目负责人确认

指标建议清单

当前痛点

缺少实验全景，项目负责人和产品经理难管理自己的实验

飞书多维表格提供实验管理看板

产品经理实验决策依赖电子表格，指标解释不稳定

鲸歌在线版替代电子表格

数据就绪、异常和行动项靠人主动盯

飞书机器人主动推送摘要、告警和行动项

人工智能助手每次分析都要重新补实验背景

命令行提供数据接口

平台流程图

实验配置 已有

上下文装配 第二批

指标与函数审核 后置

定时刷新 首版

实验报告 首版

结论生成 后置

协作跟踪 首版

每日摘要 第二批

异常路径

自动化边界

个人实验看板

今天优先级

项目实验看板

入组人数与数据闭合

负责人积压

实验报告

多指标实验结果 · 参考 PostHog 指标组

鲸歌在线版标注

提升幅度与置信区间

自动装配上下文

漏斗

启动来源

趋势说明

全局搜索

闲时计算调度

标准分析输出

结论生成

标准摘要模板

复制与回流

审计记录

交付路线图

命令行数据能力全员发布

实验报告

飞书多维表格

飞书机器人

范围收敛

四个触点怎么落地

思考如何把 Agent loop / automation cron job 融入现有系统中

个人实验看板

状态机

版本数据检测

全量 / 撤版建议

飞书机器人：每日摘要

交互按钮

实验配置已有

上下文装配第二批

指标与函数审核后置

定时刷新首版

实验报告首版

结论生成后置

协作跟踪首版

每日摘要第二批