KP Brief

鲸歌数据平台迭代方案

把实验判断周期从 1-2 天压到 2-4 小时;数据闭合当天完成可信判断,并同步到飞书协作流。

飞书多维表格提供实验管理看板Table
网页指标看板对齐行业实践,替代电子表格Web
飞书机器人主动推送摘要、告警和行动项Bot
命令行提供数据接口,随能力包发给全员CLI
系统架构

鲸歌数据平台架构总览

KP 可以一眼看到四个触点如何分工:飞书承接管理协作,网页承接实验判断,命令行承接数据能力,机器人承接主动提醒。

核心闭环
提问产品经理 / 分析师提出实验判断需求
取数调度刷新 + 结果复用
判断统计标注 + 人工确认
决策生成标准结论材料并写入鲸歌接口
跟踪飞书看板和机器人推动落地
四项交付能力
命令行数据接口全员的人工智能助手都能拿到实验背景和最新数据结果
鲸歌在线版对齐行业产品分析实践,替代电子表格判断链路
飞书多维表格实验管理看板、负责人视图、版本数据检测
飞书机器人每日摘要、告警、行动项提醒
应用层
实验报告留存、收入、漏斗、可信标注 · 首版
实验管理看板项目 / 个人视图 + 30% 灰度后版本检查 · 首版
结论生成标准摘要 + Copy as Markdown · 后置
指标与函数审核推荐指标、计算口径、人工确认 · 第二批
历史实验指标建议历史实验挖掘 + 指标建议 · 后置
引擎层
调度引擎闲时计算 + 增量刷新 · 首版
看板标注服务分组比例、样本量、最小可识别效果、可信度 · 首版
结论草稿组装标准分析摘要自动生成 · 第二批
数据层
数据仓库指标计算 + 底表查询
鲸歌接口元数据 + 实验状态(事实源)
数据结果快照按实验、日期范围和指标口径复用
基座(已有)
鲸歌实验计划管理 · 分组标签 · 实验执行 · 底表导出 · 结论存储
竞品参考

可直接复用的产品做法

用成熟产品做法降低方案风险:实验报告参考 PostHog,命令行参考 lark-cli,协作参考飞书。

AI

OpenAI Data Agent 架构

工具调用、过程记录、质量评估。

PH

PostHog 网页分析界面

多指标实验详情、趋势、漏斗、可信标注同屏展示。

CLI

lark-cli 命令行工具

稳定命令封装,降低平台操作成本。

飞书多维表格和飞书机器人

单表多视图、负责人看板、主动提醒。

助手数据能力 / 命令行工具

命令行数据接口

让每个助手一键拿齐实验材料。输入实验编号后,助手可直接拿到背景、最新结果、明细文件和回流入口,把分析前找材料和补口径压到一次命令内完成。

背景 结果 明细 回流入口

命令行工作台

分析师在自己的人工智能助手里调用鲸歌数据接口,直接获得实验背景、最新结果和可回流文件,减少手工找材料。

可随能力包发布
实际助手界面实验编号 13871
用户: 帮我分析 AlarmKit 实验

助手: 读取实验背景
鲸歌: 已带上项目、分组、观察天数、计费项目和历史注意事项

助手: 获取最新留存结果
鲸歌: 首日留存提升 3.7 个百分点,分组比例正常

助手: 生成 summary.md、result.csv、query.sql 和回流链接。
指标与函数审核 · P2 后置需求:把推荐指标、函数标签和看板标注规则放进审核队列,首版先服务核心看板链路。
检查口径预览影响提交审核

指标与函数审核

分析师把新指标、函数标签和看板标注规则放进审核队列,减少口径漂移,确保后续实验引用同一套解释。

命令行触点人工审核
审核项类型证据状态
提醒功能专项指标组
主要指标、辅助指标、护栏指标
指标组3 个历史实验验证已通过
推送打开后收入指标
来自推送打开事件
函数标签实验详情页已核对待审核
首日至第五日卸载标注规则
必须和随机控制组比较
看板标注历史分析回测通过已通过
样本不足标灰规则
分组用户数少于 100
看板标注平台规则已通过

审核说明

Alarm 专项
提醒打开、七日收入、三日卸载损失
数据成熟、分组比例、最小可识别效果、样本不足

交付边界

能力包含什么暂不处理输出位置
指标组模板主要指标、辅助指标、护栏指标自动下判断鲸歌在线版实验详情
函数标签审核标签名称、使用原因、核对证据直接改写鲸歌事实源命令行创建入口
看板标注规则可信度标注和统计解释代替分析师做决策鲸歌在线版
历史证据来自历史案例的验证记录维护指标计算引擎审核队列
历史实验指标建议 · P2 后置需求:挖掘相似实验,给项目负责人提供指标建议和历史注意事项。
更新历史库查看命中原因加入指标建议

历史实验指标建议

项目负责人查看新实验时,直接看到相似历史案例、推荐指标和曾经踩过的坑,减少从零判断。

后置增强辅助判断
历史实验已导入
286
可继续补录
相似案例本实验
42
按项目和指标匹配
推荐指标待确认
8
给项目负责人选择
历史注意事项可复用
12
展示原因

找历史案例

同项目、同功能、同人群
历史结论和当时观察指标
曾经踩过的坑

生成指标建议

建议主要指标
建议护栏指标
建议拆分维度

给项目负责人确认

展示命中原因
一键加入实验看板
确认后进入鲸歌在线版

指标建议清单

建议指标来自哪些历史实验为什么建议看项目负责人动作
首日留存AlarmKit、Quotes、HomeCard类似实验主要影响新用户回访加入本次实验
七日收入Audio、Bible、Wallpaper历史上短期留存提升不一定带来收入提升待确认
卸载率AlarmKit、FocusMode强提醒功能容易带来负向护栏加入本次实验
地区拆分Quotes、Bible美国和全球历史表现差异明显打开原因
问题定义

当前痛点

把问题和能力一一对应,优先解决项目实验管理、实验报告、飞书提醒和命令行取数四条主路径。

缺少实验全景,项目负责人和产品经理难管理自己的实验

项目里哪些实验在入组、哪些数据闭合、哪些等待决策、哪些影响同一指标,需要一个协作层统一看。

项目全景产品经理自管理30% 灰度检查

飞书多维表格提供实验管理看板

用单表多视图承接项目 / 个人看板、负责人、个人行动项、30% 灰度后版本检查和结论落地。预估每周节省 0.5-1 天项目同步和追状态时间。

飞书多维表格项目 / 个人看板每周节省 0.5-1 天
P0

产品经理实验决策依赖电子表格,指标解释不稳定

多张表结果难以对齐留存、收入、漏斗、广告收入特殊情况和趋势判断,累计留存也不容易被固定查看。

电子表格分散趋势判断广告收入特殊情况

鲸歌在线版替代电子表格

统一展示美国和全球、累计留存、趋势性指标、广告收入特殊情况和人工判断区。预估每个实验节省 2-4 小时表格整理和反复解释时间。

鲸歌在线版美国 / 全球节省 2-4 小时
P0

数据就绪、异常和行动项靠人主动盯

实验数据闭合、刷新失败、分区缺失、结论待填写和产品动作待落地,都需要相关人主动打开页面检查,容易漏掉当天可处理的实验。

主动盯状态异常容易漏行动项分散

飞书机器人主动推送摘要、告警和行动项

每天推送可处理实验、异常告警和下一步动作,让相关人直接从飞书进入处理。预估每天节省 30-60 分钟巡检和催办时间。

每日摘要异常告警每天节省 30-60 分钟
P1

人工智能助手每次分析都要重新补实验背景

分析师和项目负责人反复补实验计划、分组、观察窗口、指标口径、历史注意事项和最新结果,真正判断前先花大量时间找材料。

背景反复补充查询和明细获取结果回流

命令行提供数据接口

把实验背景、最新结果、明细文件和结论草稿入口随能力包发给全员。预估每个实验节省 1-2 小时上下文装配时间,分析师把时间留给判断和复核。

命令行数据接口能力包全员发布节省 1-2 小时
P0
流程说明

平台流程图

KP 可以看到实验从创建、取数、判断到飞书协作的完整流向,确认首版链路是否覆盖当天可决策的主路径。

实验配置 已有

鲸歌负责创建实验、下发分组和导出底表。

鲸歌人工

上下文装配 第二批

命令行工具读取实验元数据、指标模板、历史注意事项和计费项目。

命令行自动

指标与函数审核 后置

合并函数审核和指标注册,产出可审查的查询、标签和模板。

命令行人工审核

定时刷新 首版

闲时计算样本、指标、分组比例、最小可识别效果和闭合状态,高峰期只补增量。

网页自动

实验报告 首版

展示美国和全球、累计留存、趋势判断、广告收入特殊情况和可信度标注。

网页自动展示

结论生成 后置

按标准模板生成可复制的 Markdown 摘要,写入动作由现有流程承接。

网页 / 命令行标准输出

协作跟踪 首版

飞书多维表格管理状态、产品动作、30% 灰度后版本检查和个人行动项。

飞书看板半自动

每日摘要 第二批

飞书机器人在 08:30 推送可决策摘要,带发布、停止、转发和打开详情动作。

飞书机器人自动

异常路径

  • 刷新失败:进入飞书机器人,转给分析师排查分区或查询。
  • 样本不足:鲸歌在线版标灰,每日摘要不提供直接决策按钮。
  • 分组比例或广告收入趋势异常:进入人工审核,再生成结论材料。

自动化边界

  • 系统自动做取数、标准分析、摘要和同步。
  • 人工保留审核、异常判断、最终决策和产品动作。
项目看板个人看板同步飞书看板

项目实验看板

项目负责人按版本查看所有实验的目标样本量、当前入组、区域拆分和数据闭合状态,快速判断哪些实验可以推进。

首版数据管理3 个窗口待闭合
项目看板个人看板本周本月负责人:全部
运行中实验live
12
8 个仍在入组
今日新增入组US / Global
18.4k
US 36% · Global 64%
第七日已闭合就绪
7
可进入决策
预测完成日BFW 079
6/24
2 个实验等第七日

入组人数与数据闭合

实验版本区域目标样本量当前入组观察窗口状态
MC_UPBFW 079US + Global40k42.8k第七日已闭合可分析
HomeCardBFW 079Global45k31.2k第七日等待中入组中
FocusModeBFW 079US30k18.6k第七日等待中样本不足
Scroll_UPBFW 079Global25k24.4k明日闭合接近完成
实验负责人区域入组进度预测完成数据状态
MC_UP罗文泽US + Global42.8k / 40k已完成已闭合
HomeCard辰洋Global31.2k / 45k6/24入组中
FocusModeChrisUS18.6k / 30k6/26等样本
Scroll_UP罗文泽Global24.4k / 25k6/20明日闭合

负责人积压

罗文泽

7 个实验,3 个待分析,完成比 57%。

本周较忙
辰洋

4 个实验,主要负责广告收入特殊情况和趋势判断。

方法支持
项目节奏

上月平均周期 9d,本月 11d,趋势 +22%。

需复盘
打开分析记录同步飞书生成结论

实验报告

Bi AlarmKit 新 (#13871) · iOS · US / Global · 新用户 · contrast_days 7。产品经理在单个实验页同时看主指标、二级指标、护栏指标和趋势标注,替代电子表格来做实验判断。

数据已闭合分组比例正常第七日成熟
首日第三日第七日第十四日美国全球广告收入特殊情况
样本量两组对比
42.8k
预计完成日 6/16
首日留存主要指标
+3.7pp
显著提升
七日单用户收入主要指标
+5.2%
区间 +1.1% ~ +9.4%
广告收入特殊情况
+1.8%
趋势观察中

多指标实验结果 · 参考 PostHog 指标组

主指标 累计留存 美国 +3.7pp · 全球 +2.4pp
主指标 七日单用户收入 +5.2% · 区间稳定
二级指标 提醒打开率 +4.8% · 漏斗同步提升
护栏指标 崩溃率 / 退订率 正常 · 无负向告警
主指标 · 美国+3.7pp
主指标 · 全球+2.4pp
二级指标 · 打开率+4.8%
护栏指标 · 崩溃率正常
美国 A 组累计留存美国对照组全球 A 组全球对照组

鲸歌在线版标注

数据闭合第七日成熟
样本量各组用户数大于 100
分组比例正常
累计留存趋势美国持续正向
广告收入特殊情况需看 14 日趋势

提升幅度与置信区间

首日留存提升 3.7 个百分点置信区间 +1.1 ~ +6.4 个百分点

自动装配上下文

历史实验找到 4 个 Alarm 类似实验
历史基线美国第七日累计留存 23.4%
注意事项提醒展示需要和应用打开一起看
推荐决策灰度发布

漏斗

show 100%allow 71%open 48%

A 组在 allow 后回流更高。

启动来源

alarmorganicpush

alarm_app_open 与 start_app_activities 对齐。

趋势说明

鲸歌在线版展示累计留存和趋势标注,并生成可复制的结论摘要。

等待结论生成
Esc 关闭

全局搜索

产品经理和分析师用一个入口查实验、指标、异常和快捷动作,减少在多个页面之间来回找。

后置效率能力
全部实验指标动作最近
E
Bi AlarmKit 新 (#13871)运行中 · 第七日已成熟 · 首日留存 +3.7pp
打开详情
E
Bi AlarmKit 老 (#13872)数据就绪 · 需要产品经理分析
待分析
M
BFW alarm 回流率北极星指标 · 过去 7 天 +4.1%
指标
!
AlarmKit 分组比例检查警告 · 样本比例连续 2 天偏离
待复核
>
刷新 BFW 项目数据执行定时查询并同步飞书多维表格
快捷操作
R
最近打开:Quotes_III_UP昨天打开 · 第七日留存 +2.1pp
最近
填写发布结论使用标准分析摘要预填结论表单
动作
查看缓存手动触发

闲时计算调度

数据负责人查看哪些实验已刷新、哪些指标在排队、哪些任务失败,保证高峰期看板仍能及时出数。

首版 · 每晚 02:30
实验状态同步每小时
42
鲸歌接口 → 鲸歌在线版
闲时计算02:30
18
进行中实验优先
结果复用率结果快照
73%
高峰期少排队
任务来源频率状态
实验执行状态鲸歌接口每小时成功
样本量进度数据仓库每日成功
核心指标值数据仓库闲时计算排队中
分组比例检查数据仓库每日成功
鲸歌在线版标注标注规则数据就绪触发已生成
标准分析摘要摘要模板数据就绪触发已生成
飞书通知机器人流程实时/每日2 条待确认

标准分析输出

结论摘要
  建议:灰度发布
  主要指标:首日留存提升 3.7 个百分点,结果显著
  护栏指标:卸载率稳定
  注意事项:广告收入需要继续观察第十四日趋势

结果快照 = 实验编号 + 指标集合 + 日期范围
新鲜度 = 最新可用分区
格式 = 内部存储明细

running: 每日刷新
concluded: 停止刷新
archived: 冻结快照
结论生成 · P2 后置需求:标准模板生成摘要,支持 Copy as Markdown,暂时不作为首版主链路。
复制 Markdown生成摘要

结论生成

分析师一键生成标准 Markdown 摘要,把指标变化、可信标注、注意事项和建议动作复制到鲸歌、飞书或分析记录。

Copy as Markdown

标准摘要模板

灰度发布
首日留存 +3.7pp · 置信区间 +1.1pp ~ +6.4pp · 七日单用户收入 +5.2%
灰度发布 → 观察 7 天 → 全量
2026-06-23 自动提醒,检查提醒回流率与广告收入第十四日趋势

复制与回流

Copy as Markdown
粘贴到鲸歌结论字段
同步到飞书多维表格状态
计算过程回流实验记录
订阅提醒:7 天后检查是否全量

审计记录

Chris Chen · 2026-06-16 20:45 · changed status from 待分析 to 已结论

交付规划

交付路线图

KP 可以区分首版必须交付和后置讨论范围,避免把指标审核、历史建议和自动化编排挤进首版主链路。

首版

命令行数据能力全员发布

随团队能力包发给全员,提供实验背景、最新结果、明细文件和回流入口。

首版

实验报告

对齐行业实践,提供留存、收入、漏斗、趋势和可信标注,用鲸歌在线版替代电子表格。

首版

飞书多维表格

提供实验管理看板,承接项目 / 个人视图、入组人数、数据闭合和 30% 灰度后版本检查。

第二批

飞书机器人

提供每日摘要、异常告警和行动项提醒,把待处理实验主动推给相关人。

范围收敛

需求阶段原因
历史实验指标建议后置增强判断质量,但不阻塞当天完成实验判断。
指标与函数审核后置把经过验证的口径固化到鲸歌在线版的实验看板里,首版先保留人工整理。
全局搜索后置提升效率,首版可用侧边栏和飞书视图覆盖主路径。
结论生成后置标准摘要支持 Copy as Markdown,首版先把数据和看板跑通。

四个触点怎么落地

能力命令行工具鲸歌在线版飞书看板飞书机器人
查看实验详情读取背景详情页记录详情摘要推送
执行数据分析获取查询结果查看结果同步摘要提醒入口
查看数据图表导出链接趋势/漏斗简单仪表盘每日摘要
结论生成生成 Markdown复制摘要字段同步提醒处理
团队协作审计记录权限共享飞书协作主动通知
待讨论问题

思考如何把 Agent loop / automation cron job 融入现有系统中

讨论鲸歌是否提供类似 Zapier 的编排能力;涉及人工智能助手分析时,明确如何做评估、质量回看和避坑机制。

全部实验我的行动项

个人实验看板

产品经理在飞书多维表格里按负责人、状态和行动项筛选实验,减少项目同步和追状态时间。

鲸歌接口同步成功最近同步 08:30
规划中 3
Audio 新手引导

假设:提升试听转化

产品经理填写
配置中 2
HomeCard_Interaction

鲸歌草稿已创建

自动映射
运行中 6
FocusMode_NEW

开始日期 ≤ 今天 < 结束日期

自动推断
数据就绪 4
Quotes_III_UP

鲸歌执行完毕

需分析
已结论 8
MC_UP

结论:建议发布,产品动作:灰度

待落地

状态机

规划中产品经理提出假设
配置中创建实验计划
运行中自动入组
数据就绪触发摘要
已结论写入鲸歌
已落地灰度/全量
分支:排队中计划时间未到
分支:失败导出或分区异常
分支:待复盘版本后回看
终态:已归档30 天后归档
复制到飞书生成全量或撤版建议

版本数据检测

BFW 079 发布到 30% 灰度后,检查绑定实验的核心指标、护栏指标、异常告警和用户反馈,用来判断版本全量、继续观察或撤版。

灰度覆盖BFW 079
30%
等待全量 / 撤版判断
绑定实验灰度后信号风险版本判断
MC_UP留存稳定提升风险低支持全量
HomeCard_Interaction打开率下降影响首页入口撤版候选
Scroll_UP收入持平风险低支持全量
FocusMode_NEW第七日未闭合继续观察暂缓全量
FocusMode_OLD护栏异常卸载率上升暂缓或撤版

全量 / 撤版建议

30% 灰度数据稳定的实验进入全量候选;护栏异常或核心指标回落的实验进入撤版候选。

核心指标
护栏指标
用户反馈
支持全量继续观察撤版风险
每日汇总设置严重 2

飞书机器人:每日摘要

产品经理每天 08:30 在飞书收到可处理实验、异常告警和下一步动作,减少主动巡检。

08:30 已发送4 张行动卡片
鲸歌实验每日摘要2026-06-16 08:30
今日 3 个实验数据就绪Quotes_III_UP · AlarmKit 新 · Audio_Experience3
打开优先级
Quotes 第七日留存 +2.1pp结果显著 · 置信区间 +0.6pp ~ +3.8pp · 建议灰度发布
回复发布
BFWa 079 缺少最新分区影响 30% 灰度后版本检查,建议转给分析师排查
@分析师
CloudX 已 7 天未全量灰度数据稳定,可提醒工程推进
@工程

交互按钮

回复发布 / 停止 / 继续观察

明确实验可以直接在飞书内写入草稿结论。

低摩擦
打开鲸歌在线版

数据模糊时跳转到累计留存、广告收入趋势和置信区间图。

深看
转发给分析师

数据异常、分区缺失和分组比例复核进入分析师队列。

协作