data-preprocessing

Community

Clean, explore, and ready your data for modeling.

AuthorBest6668
Version1.0.0
Installs0

System Documentation

What problem does it solve?

数据预处理在数据科学和建模工作流中常常耗时且易出错。本 Skill 提供端到端的数据清洗、缺失值处理、异常值检测、分布与相关性分析等能力,帮助用户快速从原始数据获得可直接用于建模的高质量数据和可解释的质量评估结果。

Core Features & Use Cases

  • 数据加载与编码检测:自动识别数据文件和编码,稳定进入分析管线。
  • 缺失值分析与处理策略:统计缺失率,区分 MCAR/MAR/MNAR,并给出数值型/分类型的填充建议和处理工作流。
  • 异常值检测与治理:同时使用 Z-score 与 IQR 标准识别强弱异常,给出分类与保留/修正的决策指引。
  • 分布与相关性分析:绘制分布、计算偏度/峰度、得到 Pearson/Spearman 相关性矩阵并标注高相关对。
  • 数据清洗输出:生成数据清洗日志、 cleaned 数据集与质量报告,便于后续建模使用。

Quick Start

将数据集放置在 data/ 目录后,执行数据预处理技能以生成清洗后的数据和质量分析报告。

Dependency Matrix

Required Modules

None required

Components

Standard package

💻 Claude Code Installation

Recommended: Let Claude install automatically. Simply copy and paste the text below to Claude Code.

Please help me install this Skill:
Name: data-preprocessing
Download link: https://github.com/Best6668/AMIS/archive/main.zip#data-preprocessing

Please download this .zip file, extract it, and install it in the .claude/skills/ directory.
View Source Repository

Agent Skills Search Helper

Install a tiny helper to your Agent, search and equip skill from 471,000+ vetted skills library on demand.