Knowledge Base Skill
支持图片附件与OCR的文字提取,按业务类型管理问答知识库。
下载 719
支持Excel/CSV/JSON的数据清洗、分析与可视化,自动生成报告。
openclaw skills install @wuyandong8/smart-data-insights命令、参数、文件名以原文为准
自动清洗、分析并可视化企业数据。
| 功能 | 描述 | 参考文档 |
|---|---|---|
| 数据清洗 | 去除重复项,处理缺失值,统一格式 | references/data_cleaning.md |
| 数据分析 | 统计分析、趋势识别、相关性分析 | references/data_analysis.md |
| 可视化 | 图表、图形、仪表板 | references/visualization.md |
| 报告生成 | 自动生成洞察与建议 | references/report_generation.md |
将你的数据文件(Excel/CSV/JSON)放置在已知位置。
# 基础分析
{baseDir}/tools/analyze.py data.csv
# 指定选项进行分析
{baseDir}/tools/analyze.py data.xlsx --clean --visualize --report输出包含:
| 工具 | 功能 | 输入 | 输出 |
|---|---|---|---|
analyze.py | 主要分析入口 | 数据文件 | 摘要 + 选项 |
clean.py | 数据清洗 | 原始数据 | 清洗后数据 |
visualize.py | 生成图表 | 数据 | PNG/PDF 图表 |
report.py | 生成报告 | 分析结果 | Markdown 报告 |
“帮我分析这个销售数据”
# 将文件命名为 sales_data.csv
{baseDir}/tools/analyze.py sales_data.csv输出:
✅ 数据已加载:1,234 行,8 列
📊 已生成统计摘要
📈 可视化:sales_trend.png
💡 发现 3 个关键洞察“清洗并分析客户数据”
{baseDir}/tools/analyze.py customer_data.xlsx --clean --visualize“生成完整的数据报告”
{baseDir}/tools/analyze.py data.csv --report --output report.md| 格式 | 读取 | 写入 | 说明 |
|---|---|---|---|
| CSV | ✅ | ✅ | 通用格式 |
| Excel (.xlsx) | ✅ | ✅ | 需要 openpyxl |
| JSON | ✅ | ✅ | 结构化数据 |
| TSV | ✅ | ✅ | 制表符分隔 |
| 文件 | 描述 |
|---|---|
*_cleaned.csv | 清洗后的数据 |
*_summary.txt | 统计摘要 |
*_chart_*.png | 可视化图表 |
*_report.md | 完整分析报告 |
# 仅指定列
{baseDir}/tools/analyze.py data.csv --columns "sales,date,region"
# 时间序列分析
{baseDir}/tools/analyze.py data.csv --timeseries --date-column "date"
# 按类别分组
{baseDir}/tools/analyze.py data.csv --group-by "region" --aggregate "sum,mean"# 图表类型
{baseDir}/tools/visualize.py data.csv --type bar
{baseDir}/tools/visualize.py data.csv --type line
{baseDir}/tools/visualize.py data.csv --type scatter
{baseDir}/tools/visualize.py data.csv --type pie
# 样式设置
{baseDir}/tools/visualize.py data.csv --style professional
{baseDir}/tools/visualize.py data.csv --colors "blue,green,red"# 安装依赖
pip3 install pandas openpyxl matplotlib seaborn
# 验证安装
python3 -c "import pandas, matplotlib; print('Dependencies OK')"“模块未找到”
pip3 install pandas openpyxl matplotlib“文件编码错误”
--encoding gbk“大文件内存不足”
--chunk-size 10000--sample 0.1已收录 1 个 Skill