命令行工作台
分析师在自己的人工智能助手里调用鲸歌数据接口,直接获得实验背景、最新结果和可回流文件,减少手工找材料。
用户: 帮我分析 AlarmKit 实验 助手: 读取实验背景 鲸歌: 已带上项目、分组、观察天数、计费项目和历史注意事项 助手: 获取最新留存结果 鲸歌: 首日留存提升 3.7 个百分点,分组比例正常 助手: 生成 summary.md、result.csv、query.sql 和回流链接。
把实验判断周期从 1-2 天压到 2-4 小时;数据闭合当天完成可信判断,并同步到飞书协作流。
KP 可以一眼看到四个触点如何分工:飞书承接管理协作,网页承接实验判断,命令行承接数据能力,机器人承接主动提醒。
用成熟产品做法降低方案风险:实验报告参考 PostHog,命令行参考 lark-cli,协作参考飞书。
工具调用、过程记录、质量评估。
多指标实验详情、趋势、漏斗、可信标注同屏展示。
稳定命令封装,降低平台操作成本。
单表多视图、负责人看板、主动提醒。
让每个助手一键拿齐实验材料。输入实验编号后,助手可直接拿到背景、最新结果、明细文件和回流入口,把分析前找材料和补口径压到一次命令内完成。
分析师在自己的人工智能助手里调用鲸歌数据接口,直接获得实验背景、最新结果和可回流文件,减少手工找材料。
用户: 帮我分析 AlarmKit 实验 助手: 读取实验背景 鲸歌: 已带上项目、分组、观察天数、计费项目和历史注意事项 助手: 获取最新留存结果 鲸歌: 首日留存提升 3.7 个百分点,分组比例正常 助手: 生成 summary.md、result.csv、query.sql 和回流链接。
分析师把新指标、函数标签和看板标注规则放进审核队列,减少口径漂移,确保后续实验引用同一套解释。
| 审核项 | 类型 | 证据 | 状态 |
|---|---|---|---|
| 提醒功能专项指标组 主要指标、辅助指标、护栏指标 | 指标组 | 3 个历史实验验证 | 已通过 |
| 推送打开后收入指标 来自推送打开事件 | 函数标签 | 实验详情页已核对 | 待审核 |
| 首日至第五日卸载标注规则 必须和随机控制组比较 | 看板标注 | 历史分析回测通过 | 已通过 |
| 样本不足标灰规则 分组用户数少于 100 | 看板标注 | 平台规则 | 已通过 |
| 能力 | 包含什么 | 暂不处理 | 输出位置 |
|---|---|---|---|
| 指标组模板 | 主要指标、辅助指标、护栏指标 | 自动下判断 | 鲸歌在线版实验详情 |
| 函数标签审核 | 标签名称、使用原因、核对证据 | 直接改写鲸歌事实源 | 命令行创建入口 |
| 看板标注规则 | 可信度标注和统计解释 | 代替分析师做决策 | 鲸歌在线版 |
| 历史证据 | 来自历史案例的验证记录 | 维护指标计算引擎 | 审核队列 |
项目负责人查看新实验时,直接看到相似历史案例、推荐指标和曾经踩过的坑,减少从零判断。
| 建议指标 | 来自哪些历史实验 | 为什么建议看 | 项目负责人动作 |
|---|---|---|---|
| 首日留存 | AlarmKit、Quotes、HomeCard | 类似实验主要影响新用户回访 | 加入本次实验 |
| 七日收入 | Audio、Bible、Wallpaper | 历史上短期留存提升不一定带来收入提升 | 待确认 |
| 卸载率 | AlarmKit、FocusMode | 强提醒功能容易带来负向护栏 | 加入本次实验 |
| 地区拆分 | Quotes、Bible | 美国和全球历史表现差异明显 | 打开原因 |
把问题和能力一一对应,优先解决项目实验管理、实验报告、飞书提醒和命令行取数四条主路径。
项目里哪些实验在入组、哪些数据闭合、哪些等待决策、哪些影响同一指标,需要一个协作层统一看。
用单表多视图承接项目 / 个人看板、负责人、个人行动项、30% 灰度后版本检查和结论落地。预估每周节省 0.5-1 天项目同步和追状态时间。
多张表结果难以对齐留存、收入、漏斗、广告收入特殊情况和趋势判断,累计留存也不容易被固定查看。
统一展示美国和全球、累计留存、趋势性指标、广告收入特殊情况和人工判断区。预估每个实验节省 2-4 小时表格整理和反复解释时间。
实验数据闭合、刷新失败、分区缺失、结论待填写和产品动作待落地,都需要相关人主动打开页面检查,容易漏掉当天可处理的实验。
每天推送可处理实验、异常告警和下一步动作,让相关人直接从飞书进入处理。预估每天节省 30-60 分钟巡检和催办时间。
分析师和项目负责人反复补实验计划、分组、观察窗口、指标口径、历史注意事项和最新结果,真正判断前先花大量时间找材料。
把实验背景、最新结果、明细文件和结论草稿入口随能力包发给全员。预估每个实验节省 1-2 小时上下文装配时间,分析师把时间留给判断和复核。
KP 可以看到实验从创建、取数、判断到飞书协作的完整流向,确认首版链路是否覆盖当天可决策的主路径。
鲸歌负责创建实验、下发分组和导出底表。
鲸歌人工命令行工具读取实验元数据、指标模板、历史注意事项和计费项目。
命令行自动合并函数审核和指标注册,产出可审查的查询、标签和模板。
命令行人工审核闲时计算样本、指标、分组比例、最小可识别效果和闭合状态,高峰期只补增量。
网页自动展示美国和全球、累计留存、趋势判断、广告收入特殊情况和可信度标注。
网页自动展示按标准模板生成可复制的 Markdown 摘要,写入动作由现有流程承接。
网页 / 命令行标准输出飞书多维表格管理状态、产品动作、30% 灰度后版本检查和个人行动项。
飞书看板半自动飞书机器人在 08:30 推送可决策摘要,带发布、停止、转发和打开详情动作。
飞书机器人自动产品经理早上打开看板,只看自己今天要处理的数据就绪、异常排查、结论生成和产品动作。
| 实验 | 状态 | 关键指标 | 下一步 | 操作 |
|---|---|---|---|---|
| Oa 158 Quotes_III_UP 实验 13902 · 第七日成熟 | 数据就绪 | 第七日留存 +2.1pp | 今天完成分析 | 打开鲸歌在线版生成结论 |
| BFWa 079 老用户 MC_UP 实验 13888 · 同步待确认 | 待确认 | 缺少最新分区 | 排查导出 | 查看日志转分析师 |
| Audio_Experience3 实验 13876 · 第五日 | 待分析 | 单用户收入 +4.8% | 补漏斗 | 看漏斗打开分析记录 |
| CloudX_SR_UP 实验 13765 · 已结论 | 待落地 | 灰度发布 | 推进全量 | 催办写回飞书 |
BFWa 079 缺少最新分区,会影响 30% 灰度后的版本检查。
影响 BFW 079第七日已成熟,样本量达标,可直接进入实验详情页看全套指标。
待分析结论已超过 7 天,飞书提醒已发送。
发布跟进项目负责人按版本查看所有实验的目标样本量、当前入组、区域拆分和数据闭合状态,快速判断哪些实验可以推进。
| 实验 | 版本 | 区域 | 目标样本量 | 当前入组 | 观察窗口 | 状态 |
|---|---|---|---|---|---|---|
| MC_UP | BFW 079 | US + Global | 40k | 42.8k | 第七日已闭合 | 可分析 |
| HomeCard | BFW 079 | Global | 45k | 31.2k | 第七日等待中 | 入组中 |
| FocusMode | BFW 079 | US | 30k | 18.6k | 第七日等待中 | 样本不足 |
| Scroll_UP | BFW 079 | Global | 25k | 24.4k | 明日闭合 | 接近完成 |
| 实验 | 负责人 | 区域 | 入组进度 | 预测完成 | 数据状态 |
|---|---|---|---|---|---|
| MC_UP | 罗文泽 | US + Global | 42.8k / 40k | 已完成 | 已闭合 |
| HomeCard | 辰洋 | Global | 31.2k / 45k | 6/24 | 入组中 |
| FocusMode | Chris | US | 18.6k / 30k | 6/26 | 等样本 |
| Scroll_UP | 罗文泽 | Global | 24.4k / 25k | 6/20 | 明日闭合 |
7 个实验,3 个待分析,完成比 57%。
本周较忙4 个实验,主要负责广告收入特殊情况和趋势判断。
方法支持上月平均周期 9d,本月 11d,趋势 +22%。
需复盘Bi AlarmKit 新 (#13871) · iOS · US / Global · 新用户 · contrast_days 7。产品经理在单个实验页同时看主指标、二级指标、护栏指标和趋势标注,替代电子表格来做实验判断。
| 数据闭合 | 第七日成熟 |
| 样本量 | 各组用户数大于 100 |
| 分组比例 | 正常 |
| 累计留存趋势 | 美国持续正向 |
| 广告收入特殊情况 | 需看 14 日趋势 |
| 历史实验 | 找到 4 个 Alarm 类似实验 |
| 历史基线 | 美国第七日累计留存 23.4% |
| 注意事项 | 提醒展示需要和应用打开一起看 |
| 推荐决策 | 灰度发布 |
A 组在 allow 后回流更高。
alarm_app_open 与 start_app_activities 对齐。
鲸歌在线版展示累计留存和趋势标注,并生成可复制的结论摘要。
等待结论生成产品经理和分析师用一个入口查实验、指标、异常和快捷动作,减少在多个页面之间来回找。
数据负责人查看哪些实验已刷新、哪些指标在排队、哪些任务失败,保证高峰期看板仍能及时出数。
| 任务 | 来源 | 频率 | 状态 |
|---|---|---|---|
| 实验执行状态 | 鲸歌接口 | 每小时 | 成功 |
| 样本量进度 | 数据仓库 | 每日 | 成功 |
| 核心指标值 | 数据仓库 | 闲时计算 | 排队中 |
| 分组比例检查 | 数据仓库 | 每日 | 成功 |
| 鲸歌在线版标注 | 标注规则 | 数据就绪触发 | 已生成 |
| 标准分析摘要 | 摘要模板 | 数据就绪触发 | 已生成 |
| 飞书通知 | 机器人流程 | 实时/每日 | 2 条待确认 |
结论摘要 建议:灰度发布 主要指标:首日留存提升 3.7 个百分点,结果显著 护栏指标:卸载率稳定 注意事项:广告收入需要继续观察第十四日趋势 结果快照 = 实验编号 + 指标集合 + 日期范围 新鲜度 = 最新可用分区 格式 = 内部存储明细 running: 每日刷新 concluded: 停止刷新 archived: 冻结快照
分析师一键生成标准 Markdown 摘要,把指标变化、可信标注、注意事项和建议动作复制到鲸歌、飞书或分析记录。
Chris Chen · 2026-06-16 20:45 · changed status from 待分析 to 已结论
KP 可以区分首版必须交付和后置讨论范围,避免把指标审核、历史建议和自动化编排挤进首版主链路。
随团队能力包发给全员,提供实验背景、最新结果、明细文件和回流入口。
对齐行业实践,提供留存、收入、漏斗、趋势和可信标注,用鲸歌在线版替代电子表格。
提供实验管理看板,承接项目 / 个人视图、入组人数、数据闭合和 30% 灰度后版本检查。
提供每日摘要、异常告警和行动项提醒,把待处理实验主动推给相关人。
| 需求 | 阶段 | 原因 |
|---|---|---|
| 历史实验指标建议 | 后置 | 增强判断质量,但不阻塞当天完成实验判断。 |
| 指标与函数审核 | 后置 | 把经过验证的口径固化到鲸歌在线版的实验看板里,首版先保留人工整理。 |
| 全局搜索 | 后置 | 提升效率,首版可用侧边栏和飞书视图覆盖主路径。 |
| 结论生成 | 后置 | 标准摘要支持 Copy as Markdown,首版先把数据和看板跑通。 |
| 能力 | 命令行工具 | 鲸歌在线版 | 飞书看板 | 飞书机器人 |
|---|---|---|---|---|
| 查看实验详情 | 读取背景 | 详情页 | 记录详情 | 摘要推送 |
| 执行数据分析 | 获取查询结果 | 查看结果 | 同步摘要 | 提醒入口 |
| 查看数据图表 | 导出链接 | 趋势/漏斗 | 简单仪表盘 | 每日摘要 |
| 结论生成 | 生成 Markdown | 复制摘要 | 字段同步 | 提醒处理 |
| 团队协作 | 审计记录 | 权限共享 | 飞书协作 | 主动通知 |
讨论鲸歌是否提供类似 Zapier 的编排能力;涉及人工智能助手分析时,明确如何做评估、质量回看和避坑机制。
产品经理在飞书多维表格里按负责人、状态和行动项筛选实验,减少项目同步和追状态时间。
假设:提升试听转化
产品经理填写鲸歌草稿已创建
自动映射开始日期 ≤ 今天 < 结束日期
自动推断鲸歌执行完毕
需分析结论:建议发布,产品动作:灰度
待落地BFW 079 发布到 30% 灰度后,检查绑定实验的核心指标、护栏指标、异常告警和用户反馈,用来判断版本全量、继续观察或撤版。
| 绑定实验 | 灰度后信号 | 风险 | 版本判断 |
|---|---|---|---|
| MC_UP | 留存稳定提升 | 风险低 | 支持全量 |
| HomeCard_Interaction | 打开率下降 | 影响首页入口 | 撤版候选 |
| Scroll_UP | 收入持平 | 风险低 | 支持全量 |
| FocusMode_NEW | 第七日未闭合 | 继续观察 | 暂缓全量 |
| FocusMode_OLD | 护栏异常 | 卸载率上升 | 暂缓或撤版 |
30% 灰度数据稳定的实验进入全量候选;护栏异常或核心指标回落的实验进入撤版候选。
产品经理每天 08:30 在飞书收到可处理实验、异常告警和下一步动作,减少主动巡检。
明确实验可以直接在飞书内写入草稿结论。
低摩擦数据模糊时跳转到累计留存、广告收入趋势和置信区间图。
深看数据异常、分区缺失和分组比例复核进入分析师队列。
协作