LLM Evaluation Harness

Run evals as part of CI — measure LLM output quality on every change

5 packages · Health-checked and current

RolePackageHealthScoreAlternatives

Evaluation

Inactive

Hero Score 57

, ,

LLM Orchestration