Data Analysis Litiao

基于统计严谨性，帮助用户从原始数据中得出可靠决策建议。

已扫描

项目

内容

适合谁

数据分析师、产品经理

不适合谁

无数据基础的初学者、仅需简单报表生成的用户

国内可用性

需网络配置。可能需要网络配置或第三方服务可访问。

安装难度

新手友好（★☆☆）。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

复制命令安装

openclaw skills install @litiao1224/data-analysis-litiao

官方 ZIP下载官方 ZIP

Skill 说明

命令、参数、文件名以原文为准

何时加载

用户询问内容包括：数据分析、发现模式、理解指标、验证假设、分群分析、A/B 测试、流失分析、统计显著性等。

核心原则

没有决策支持的分析只是算术运算。始终明确：如果分析结果显示 X 与 Y 不同，什么会因此改变？

方法论优先

在接触数据之前：

这项分析支持什么决策？
什么情况会让你改变主意？（真正的问题）
你实际拥有的数据 与 你希望拥有的数据 有何差异？
相关的时间范围 是什么？

统计严谨性检查清单

[ ] 样本量是否足够？（小样本 = 宽泛的置信区间）
[ ] 对比组是否公平？（相同时间段、相似条件）
[ ] 是否存在多重比较？（20 次测试中，有 1 次“显著”纯属偶然）
[ ] 效应量是否有实际意义？（统计显著 ≠ 实际重要）
[ ] 不确定性是否已量化？（使用“12-18% 提升”而非仅“15% 提升”）

常见分析陷阱及规避方法

陷阱	表现形式	如何避免
辛普森悖论	分段后趋势反转	始终按关键维度检查
幸存者偏差	只分析当前用户	包含流失/失败用户的数据集
不同周期对比	2 月（28 天） vs 3 月（31 天）	按日均值或等长窗口归一化
p 值操纵（p-hacking）	重复测试直到出现“显著”结果	预注册假设或调整多重比较
时间序列中的相关性	两者同时上升 = “相关”	控制时间变量后检验关系是否消失
百分比直接平均	直接对百分比求平均	从原始总数重新计算

关于每种陷阱的详细示例，请参阅 pitfalls.md。

方法选择指南

问题类型	推荐方法	关键输出
“X 是否不同于 Y？”	假设检验	p 值 + 效应量 + 置信区间
“什么能预测 Z？”	回归 / 相关分析	系数 + R² + 残差检查
“用户随时间如何表现？”	分群分析	按分群划分的留存曲线
“这些群体有何不同？”	用户分组	用户画像 + 统计对比
“有什么异常？”	异常检测	标记点 + 上下文信息

具体技术细节及适用场景，请参阅 techniques.md。

输出标准

以洞察开头，而非方法论描述
量化不确定性 — 使用区间而非单一数值
说明局限性 — 明确指出分析无法回答的问题
提出下一步建议 — 哪些行动可增强结论可靠性

需要升级的警示信号

用户希望“证明”一个既定结论
样本量过小，无法得出可靠推断
数据质量问题导致分析无效
存在无法控制的混杂因素

@litiao1224

已收录 2 个 Skill