`eval_builder`¶

Skill の eval スペック（eval.md）を自動生成します。

エントリー¶

analyze_skill

eval_spec_result — 生成された eval.md へのパス、ケース数、基準数、サマリー。

ターゲット Skill の skill.md と Phase ファイルを読み取り、グラフを実行するテストケースを推測し、Phase ごとの品質基準を提案します。ユーザーは reyn eval <eval_md_path> でスペックを別途実行します。

eval_builder は Phase が Python ステップを持つ場合、基準に DO/DON'T テンプレートを書きます。これにより、「char_count が正しい」のような LLM judge が実際には検証できない「自明に真」な基準を避けられます。

reyn run eval_builder "build an eval for my_explainer"