Data

支持数据提取、清洗、分析、可视化与报告的全流程自动化。

已扫描
适合谁
数据分析师、业务运营人员
不适合谁
无数据源或权限的用户、需要直接操作数据库的高级开发人员
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @ivangdavila/data

Skill 说明

命令、参数、文件名以原文为准

何时使用

用户需要:从数据源(数据库、API、文件)中提取数据,清洗和转换混乱的数据集,分析并发现模式,可视化结果,或自动化重复性的数据任务。Agent 将处理完整的数据工作流。

快速参考

领域文件重点
查询与提取querying.mdSQL 生成、API 获取、多源数据
清洗与转换cleaning.md缺失值、重复项、标准化、关联操作
分析与统计analysis.md探索性数据分析(EDA)、统计检验、洞察发现
可视化与报告visualization.md图表生成、仪表板、导出格式
质量与验证quality.md数据检查、异常检测、数据漂移
工作流模式patterns.md常见数据工作流、自动化流程

核心操作

查询生成: 用户描述所需数据 → Agent 生成 SQL 或查询语句,处理连接、过滤、聚合 → 返回结果或解释执行计划。

数据清洗: 加载混乱的数据集 → 检测问题(缺失值、重复项、离群点、格式不一致)→ 应用合适的修复方法 → 记录所有转换操作。

探索性分析: 新数据集到达 → 生成描述性统计、分布情况、相关性分析 → 发现有趣模式与异常 → 输出包含关键发现的总结报告。

可视化: 分析完成后 → 生成合适的图表类型 → 按要求导出格式(PNG、SVG、交互式 HTML)→ 准备交付给利益相关方。

定期报告: 定义一次报告模板 → Agent 按预定时间运行 → 更新图表与指标 → 生成包含亮点的摘要报告。

关键规则

  • 在应用转换前始终预览变化内容 —— 展示将被修改的数据样本
  • 每次数据转换都需记录来源、操作内容及理由
  • 分析前验证数据类型与取值范围 —— 输入脏数据,输出必然错误
  • 使用适当的统计检验 —— 先检查前提假设
  • 生成可复现的输出 —— 包含随机种子、版本号、时间戳
  • 明确处理缺失数据 —— 记录所选策略(删除、填补、标记)
  • 根据数据类型选择合适的图表类型 —— 分类数据、连续数据、时间序列

用户模式

模式重点触发语句
分析师SQL 查询、探索分析、洞察发现“这些数据告诉我们什么?”
工程师数据管道、转换逻辑、质量控制“把这部分数据清理后加载到那里”
业务人员KPI 指标、仪表板、通俗语言“我们和上个季度相比如何?”
研究者统计严谨性、结果可复现“这个差异是否显著?”
开发者模式设计、API 数据、类型定义“根据这个 JSON 生成类型定义”

详见 patterns.md 查看各模式下的典型工作流。

首次使用指南

  1. 确定数据源(数据库、文件、API)
  2. 建立连接或加载文件
  3. 初步探索性分析(EDA)——查看数据形状、字段类型、质量问题
  4. 根据需求进行清洗与转换
  5. 按照用户目标执行分析或可视化
I
@ivangdavila

已收录 18 个 Skill

相关推荐