Name: dw-skill-eval-run
Availability: InStock
Author: xurik

System Documentation

What problem does it solve?

自动化端到端的 Skill 评测流程，通过统一的 testset、跨模型执行、 transcripts 收集、评分与报告生成，帮助团队快速验证新技能的质量与对比不同实现。

Core Features & Use Cases

跨模型执行测试并收集 transcripts（包括 Claude 类模型和非 Claude 模型）
执行隔离：Subagent 隔离执行，确保测试的可重复性与安全性
生成执行计划、汇总结果并输出 execution_summary.yaml
使用场景包括：新技能验证、回归测试、模型对比评估

Quick Start

运行 /dw-skill-eval-run 来对当前技能执行完整的测试评估流程。

Please help me install this Skill: Name: dw-skill-eval-run Download link: https://github.com/xurik/dataworks-skill-evaluator/archive/main.zip#dw-skill-eval-run Please download this .zip file, extract it, and install it in the .claude/skills/ directory.

dw-skill-eval-run

System Documentation

What problem does it solve?

Core Features & Use Cases

Quick Start

Dependency Matrix

Required Modules

Components

💻 Claude Code Installation

Agent Skills Search Helper