Name: agent-evaluation
Availability: InStock
Author: abdullah1854

System Documentation

What problem does it solve?

Evaluates agent outputs using multi-dimensional rubrics, providing scalable, objective assessments beyond single metrics.

Core Features & Use Cases

Rubrics-Based Scoring: Factual accuracy, completeness, citation quality, sources, and tool efficiency.
LLM-as-Judge Support: Scales evaluation across large test sets.
Continuous Improvement: Stores evaluation history for trend analysis.

Quick Start

Evaluate an agent's output by providing an aspect (rubrics, methodology, testset, continuous, pitfalls).

Please help me install this Skill: Name: agent-evaluation Download link: https://github.com/abdullah1854/ClaudeSuperSkills/archive/main.zip#agent-evaluation Please download this .zip file, extract it, and install it in the .claude/skills/ directory.

agent-evaluation

System Documentation

What problem does it solve?

Core Features & Use Cases

Quick Start

Dependency Matrix

Required Modules

Components

💻 Claude Code Installation

Agent Skills Search Helper