Data Analysis Litiao

基于统计严谨性,帮助用户从原始数据中得出可靠决策建议。

已扫描
适合谁
数据分析师、产品经理
不适合谁
无数据基础的初学者、仅需简单报表生成的用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @litiao1224/data-analysis-litiao

Skill 说明

命令、参数、文件名以原文为准

何时加载

用户询问内容包括:数据分析、发现模式、理解指标、验证假设、分群分析、A/B 测试、流失分析、统计显著性等。

核心原则

没有决策支持的分析只是算术运算。始终明确:如果分析结果显示 X 与 Y 不同,什么会因此改变?

方法论优先

在接触数据之前:

  1. 这项分析支持什么决策?
  2. 什么情况会让你改变主意?(真正的问题)
  3. 你实际拥有的数据你希望拥有的数据 有何差异?
  4. 相关的时间范围 是什么?

统计严谨性检查清单

  • [ ] 样本量是否足够?(小样本 = 宽泛的置信区间)
  • [ ] 对比组是否公平?(相同时间段、相似条件)
  • [ ] 是否存在多重比较?(20 次测试中,有 1 次“显著”纯属偶然)
  • [ ] 效应量是否有实际意义?(统计显著 ≠ 实际重要)
  • [ ] 不确定性是否已量化?(使用“12-18% 提升”而非仅“15% 提升”)

常见分析陷阱及规避方法

陷阱表现形式如何避免
辛普森悖论分段后趋势反转始终按关键维度检查
幸存者偏差只分析当前用户包含流失/失败用户的数据集
不同周期对比2 月(28 天) vs 3 月(31 天)按日均值或等长窗口归一化
p 值操纵(p-hacking)重复测试直到出现“显著”结果预注册假设或调整多重比较
时间序列中的相关性两者同时上升 = “相关”控制时间变量后检验关系是否消失
百分比直接平均直接对百分比求平均从原始总数重新计算

关于每种陷阱的详细示例,请参阅 pitfalls.md

方法选择指南

问题类型推荐方法关键输出
“X 是否不同于 Y?”假设检验p 值 + 效应量 + 置信区间
“什么能预测 Z?”回归 / 相关分析系数 + R² + 残差检查
“用户随时间如何表现?”分群分析按分群划分的留存曲线
“这些群体有何不同?”用户分组用户画像 + 统计对比
“有什么异常?”异常检测标记点 + 上下文信息

具体技术细节及适用场景,请参阅 techniques.md

输出标准

  1. 以洞察开头,而非方法论描述
  2. 量化不确定性 — 使用区间而非单一数值
  3. 说明局限性 — 明确指出分析无法回答的问题
  4. 提出下一步建议 — 哪些行动可增强结论可靠性

需要升级的警示信号

  • 用户希望“证明”一个既定结论
  • 样本量过小,无法得出可靠推断
  • 数据质量问题导致分析无效
  • 存在无法控制的混杂因素
L
@litiao1224

已收录 2 个 Skill

相关推荐