Agent エンジニアリング — 7 つのレンズ¶

Reyn は 7 つのエンジニアリング視点を通じて読み解けます。各レンズは「このシステムは何を正しく実現しているか、そしてどこがまだ薄いか？」という問いに対する異なる見方です。同じドキュメントが複数のレンズから参照されており、このインデックスがその地図です。

全体像¶

              ┌──────────────────────────────────────────────────┐
              │                                                  │
              │    User                                          │
              │     │                                            │
              │     ▼                                            │
              │    Agent ── selects a Skill ─────► Skill         │   ← System Design
              │                                     │            │   ← Tool Contract
              │                                     ▼            │
              │             OS ◄──── runtime loop ──┤            │   ← Reliability
              │              │                      ▼            │
              │              │                    Phase          │   ← Retrieval
              │              │             (input + instructions)│       (preprocessor)
              │              │                      │            │
              │              │                      ▼            │
              │              │                  Workspace        │   ← Security
              │              │                                   │       (permissions)
              │              ▼                                   │
              │         ┌────────┐                               │   ← Evaluation
              │         │ Events │ ─────► JSONL replay log       │       Observability
              │         └────────┘                               │
              │                                                  │
              └──────────────────────────────────────────────────┘
                                                                       ← Product Think
                                                                          (CLI, cost, UX)

各レイヤーには対応するエンジニアリングレンズがあります。レンズはシステムを分割するのではなく、意図的に重なり合います。

7 つのレンズ¶

1. System Design ¶

マクロ構造: 制御フロー、状態、責任をレイヤーを横断してどのように分散させるか。Reyn ではこれが Phase / Skill / OS の分割として現れます。Phase はステートレスで再利用可能、Skill は構造を所有し、OS は実行を所有します。

2. Tool Contract Design ¶

LLM がどのように世界に作用するか: 副作用を運ぶ型付きエンベロープ（Control IR）、決定を運ぶ型付きエンベロープ（candidate_outputs）、そして決定論的なエンリッチメントフック（preprocessor）。

3. Retrieval Engineering ¶

適切なコンテキストを適切なタイミングで agent に渡すこと。Reyn にはプロジェクトスコープおよびユーザースコープのファクトに対する recall_memory があり、preprocessor ステップとして統合されています。これはシステムの中でも薄い領域の 1 つです。詳細はそのページを参照してください。

4. Reliability Engineering ¶

障害からの回復: 検証、再プロンプト、ループ上限、タイムアウト。Reyn はすべての LLM 出力を次のターゲットのスキーマに対して検証し、拒否時には再プロンプトを行います。長いループは limits.phase.max_visits とフェーズごとのウォールクロックバジェットで制限されます。より豊富なリトライポリシーとチェックポイント/再開はロードマップに残っています。

5. Security ¶

ケイパビリティのゲーティング、サンドボックス境界、トラストスコーピング。三層の Permission モデル + 純粋な Python ステップの AST サンドボックス + Skill スコープの承認が核心です。

6. Evaluation and Observability ¶

agent が機能しているかどうかを知り、その理由を把握すること。イベントログが「なぜ？」に答え、eval Skill が「機能しているか？」に答えます。どちらも第一級です。同じチャネルがデバッグレンダリング、リプレイ、eval アナリティクスを動かします。

7. Product Think ¶

製品としての agent: CLI の使い勝手、コスト規律、予測可能な UX。モデルクラス（light/standard/strong）、ラン単位のコストレポート、output_language によるローカライゼーションが、Reyn が現在提供するレバーです。

このセクションの読み方¶

agent エンジニアリング一般が初めてですか? 順に読んでください。レンズは語彙を積み上げていきます。
別のフレームワークから来ていますか? 最も興味のあるレンズにスキップしてください。クロスリンクが必要に応じて他のレンズに引き戻します。
自分のシステムの自己評価をしていますか? Retrieval と Reliability の「まだ薄い部分」の記述が率直な箇所です。

Agent エンジニアリング — 7 つのレンズ¶

全体像¶

7 つのレンズ¶

1. System Design¶

2. Tool Contract Design¶

3. Retrieval Engineering¶

4. Reliability Engineering¶

5. Security¶

6. Evaluation and Observability¶

7. Product Think¶