Full-Link Data Analysis

基于七层架构的自动化数据报告生成，支持飞书文档输出。

已扫描

项目

内容

适合谁

企业分析师、产品经理

不适合谁

无数据基础的初学者、无需结构化报告的简单查询用户

国内可用性

需网络配置。可能需要网络配置或第三方服务可访问。

安装难度

新手友好（★☆☆）。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

复制命令安装

openclaw skills install @openlark/full-link-data-analysis

官方 ZIP下载官方 ZIP

Skill 说明

命令、参数、文件名以原文为准

全链路数据分析

概述

七层架构自动将业务议题转化为结构化分析报告：

L1 用户角色理解 → L2 数据范围获取 → L3 分析数据范围界定 → L4 问题分解 → L5 方法选择 → L6 执行与计算 → L7 结果输出

该 Agent 根据需要编写 Python 分析代码，无需预置代码库。每一层均作为下一层的质量检查关卡。

触发场景

用户请求进行数据或业务指标分析
用户希望了解数据中的原因、趋势或模式
用户需要一份数据分析报告
用户提及“分析”“归因”“预测”“聚类”“趋势”“数据报告”等关键词
用户提出需要数据驱动洞察的业务议题

核心原则

按需生成代码：根据实际数据使用 pandas/numpy/scipy/sklearn/statsmodels 编写定制化分析脚本。
数据感知路由：方法选择综合考虑议题语义、数据结构和问题类型。
质量门控：所有结论输出必须包含置信度标注和交叉验证说明。

七层流程

L1 — 用户角色理解

识别提问者的角色、决策场景及成功标准。

关键问题：

角色：高管、分析师、产品经理、运营人员？
决策场景：战略规划、运营复盘、专项调查？
成功标准：哪些指标/目标定义为“良好”？
数据素养：报告的技术深度应如何设定？

输出：结构化的用户角色摘要（角色、决策场景、成功标准）。

L2 — 数据范围获取

发现并验证可用的数据源。

步骤：

向用户询问提供的数据（文件、数据库、API）
收到文件后，检查数据模式、样本数据，审查字段类型和缺失值
确定相关字段/表
确认数据时效性（更新频率）

输出：数据清单（来源、模式、质量备注）。

L3 — 分析数据范围界定

从“所有可用数据”缩小到“与议题相关的数据”。

步骤：

将业务问题关键词映射到所需的数据维度
仅保留必要字段/记录
定义时间窗口、聚合粒度、筛选条件
识别潜在混杂因素

输出：数据范围说明（维度、时间窗口、筛选条件、聚合粒度）。

L4 — 问题分解

将业务问题拆解为可分析的子问题。

框架选择：

MECE原则（相互独立，完全穷尽）：收入 = 交易金额 × 用户流量
逐层钻取：按区域 → 渠道 → 产品层级逐步分解
前后对比：变化前 vs 变化后
群体分组：按时间/属性分组，比较轨迹差异
漏斗分析：按步骤转化率分析
假设树：结构化假设检验

输出：问题树（分解结构，含明确假设陈述）。

L5 — 方法选择

基于数据感知路由选择分析方法。详见 references/routing.md。

三维路由：

议题语义：增长、流失、转化、风险、归因等
数据结构：时间序列、截面数据、面板数据、层次结构等
问题类型：描述性、诊断性、预测性、决策性

详见 references/methods.md（15种方法详细说明）。

输出：方法计划（主方法 + 替代交叉验证方法）。

L6 — 执行与计算

使用 Python 执行分析。处理流程：

环境检查：运行 pip list 确认 pandas、numpy 是否存在；缺失则安装
数据加载：根据 L3 范围说明加载数据
数据清洗：处理缺失值、异常值、类型转换
分析执行：编写并运行所选方法的 Python 脚本
交叉验证：使用替代方法进行对比验证（见 references/quality.md）
结果解读：提取关键数值、统计量、效应大小

编码规范：

使用 pandas 进行数据操作，scipy.stats 进行统计检验，statsmodels/sklearn 进行建模
输出结果需带清晰标签；脚本输出直接构成报告内容
处理边界情况（空数据、全为空列、单类别变量）
输出结构化文本，而非原始数字

L7 — 结果输出

以飞书文档格式输出分析报告。详见 references/feishu-report.md。

报告结构：

分析概要 — 高管摘要（1段）
核心发现 — 基于数据的关键洞察
分析过程 — 方法、数据范围、关键假设
详细结果 — 图表说明、统计结果、效应大小
结论与建议 — 可操作建议，附置信度标注
附录 — 方法细节、注意事项、数据质量说明

快速参考

层级	动作	参考
L1 用户角色	识别角色与决策背景	内置问题集
L2 数据	发现并验证数据源	内置检查流程
L3 范围	缩小至相关数据	内置映射逻辑
L4 分解	拆解为子问题	内置框架
L5 方法	选择分析方法	`references/methods.md` + `references/routing.md`
L6 执行	编写 Python 分析	内置编码规范
L7 输出	生成报告	`references/feishu-report.md` + `references/quality.md`

检查清单

[ ] L1：在访问数据前确认用户角色
[ ] L2：始终在分析前检查数据模式和样本
[ ] L3：明确说明数据范围（时间、筛选条件、维度）
[ ] L4：必须先分解问题，不得跳过直接进入方法
[ ] L5：查阅路由表，记录方法选择依据
[ ] L6：至少执行一次交叉验证
[ ] L7：每个结论必须包含置信度标注

@openlark

已收录 15 个 Skill