Full-Link Data Analysis

基于七层架构的自动化数据报告生成,支持飞书文档输出。

已扫描
适合谁
企业分析师、产品经理
不适合谁
无数据基础的初学者、无需结构化报告的简单查询用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @openlark/full-link-data-analysis

Skill 说明

命令、参数、文件名以原文为准

全链路数据分析

概述

七层架构自动将业务议题转化为结构化分析报告:

L1 用户角色理解 → L2 数据范围获取 → L3 分析数据范围界定 → L4 问题分解 → L5 方法选择 → L6 执行与计算 → L7 结果输出

该 Agent 根据需要编写 Python 分析代码,无需预置代码库。每一层均作为下一层的质量检查关卡。

触发场景

  • 用户请求进行数据或业务指标分析
  • 用户希望了解数据中的原因、趋势或模式
  • 用户需要一份数据分析报告
  • 用户提及“分析”“归因”“预测”“聚类”“趋势”“数据报告”等关键词
  • 用户提出需要数据驱动洞察的业务议题

核心原则

  • 按需生成代码:根据实际数据使用 pandas/numpy/scipy/sklearn/statsmodels 编写定制化分析脚本。
  • 数据感知路由:方法选择综合考虑议题语义、数据结构和问题类型。
  • 质量门控:所有结论输出必须包含置信度标注和交叉验证说明。

七层流程

L1 — 用户角色理解

识别提问者的角色、决策场景及成功标准。

关键问题:

  • 角色:高管、分析师、产品经理、运营人员?
  • 决策场景:战略规划、运营复盘、专项调查?
  • 成功标准:哪些指标/目标定义为“良好”?
  • 数据素养:报告的技术深度应如何设定?

输出:结构化的用户角色摘要(角色、决策场景、成功标准)。

L2 — 数据范围获取

发现并验证可用的数据源。

步骤:

  1. 向用户询问提供的数据(文件、数据库、API)
  2. 收到文件后,检查数据模式、样本数据,审查字段类型和缺失值
  3. 确定相关字段/表
  4. 确认数据时效性(更新频率)

输出:数据清单(来源、模式、质量备注)。

L3 — 分析数据范围界定

从“所有可用数据”缩小到“与议题相关的数据”。

步骤:

  1. 将业务问题关键词映射到所需的数据维度
  2. 仅保留必要字段/记录
  3. 定义时间窗口、聚合粒度、筛选条件
  4. 识别潜在混杂因素

输出:数据范围说明(维度、时间窗口、筛选条件、聚合粒度)。

L4 — 问题分解

将业务问题拆解为可分析的子问题。

框架选择:

  • MECE原则(相互独立,完全穷尽):收入 = 交易金额 × 用户流量
  • 逐层钻取:按区域 → 渠道 → 产品层级逐步分解
  • 前后对比:变化前 vs 变化后
  • 群体分组:按时间/属性分组,比较轨迹差异
  • 漏斗分析:按步骤转化率分析
  • 假设树:结构化假设检验

输出:问题树(分解结构,含明确假设陈述)。

L5 — 方法选择

基于数据感知路由选择分析方法。详见 references/routing.md

三维路由:

  1. 议题语义:增长、流失、转化、风险、归因等
  2. 数据结构:时间序列、截面数据、面板数据、层次结构等
  3. 问题类型:描述性、诊断性、预测性、决策性

详见 references/methods.md(15种方法详细说明)。

输出:方法计划(主方法 + 替代交叉验证方法)。

L6 — 执行与计算

使用 Python 执行分析。处理流程:

  1. 环境检查:运行 pip list 确认 pandasnumpy 是否存在;缺失则安装
  2. 数据加载:根据 L3 范围说明加载数据
  3. 数据清洗:处理缺失值、异常值、类型转换
  4. 分析执行:编写并运行所选方法的 Python 脚本
  5. 交叉验证:使用替代方法进行对比验证(见 references/quality.md
  6. 结果解读:提取关键数值、统计量、效应大小

编码规范:

  • 使用 pandas 进行数据操作,scipy.stats 进行统计检验,statsmodels/sklearn 进行建模
  • 输出结果需带清晰标签;脚本输出直接构成报告内容
  • 处理边界情况(空数据、全为空列、单类别变量)
  • 输出结构化文本,而非原始数字

L7 — 结果输出

以飞书文档格式输出分析报告。详见 references/feishu-report.md

报告结构:

  1. 分析概要 — 高管摘要(1段)
  2. 核心发现 — 基于数据的关键洞察
  3. 分析过程 — 方法、数据范围、关键假设
  4. 详细结果 — 图表说明、统计结果、效应大小
  5. 结论与建议 — 可操作建议,附置信度标注
  6. 附录 — 方法细节、注意事项、数据质量说明

快速参考

层级动作参考
L1 用户角色识别角色与决策背景内置问题集
L2 数据发现并验证数据源内置检查流程
L3 范围缩小至相关数据内置映射逻辑
L4 分解拆解为子问题内置框架
L5 方法选择分析方法references/methods.md + references/routing.md
L6 执行编写 Python 分析内置编码规范
L7 输出生成报告references/feishu-report.md + references/quality.md

检查清单

  • [ ] L1:在访问数据前确认用户角色
  • [ ] L2:始终在分析前检查数据模式和样本
  • [ ] L3:明确说明数据范围(时间、筛选条件、维度)
  • [ ] L4:必须先分解问题,不得跳过直接进入方法
  • [ ] L5:查阅路由表,记录方法选择依据
  • [ ] L6:至少执行一次交叉验证
  • [ ] L7:每个结论必须包含置信度标注
O
@openlark

已收录 15 个 Skill

相关推荐