Built-in model catalog¶
Reyn は標準的な model 設定を built-in catalog として ship、 model namespace に
pre-load しています。 これらの entry を使うと、 reyn.yaml で再宣言せずに短い
class 名で代表的な model を reference できます。
これらは example であり推奨ではありません。 built-in catalog は便利な starting point を提供するもので、 真の source of truth は常に
reyn.yamlです。 同名の entry をmodels:配下で declare すれば override 可能。
Catalog entries¶
claude-sonnet¶
汎用 Claude Sonnet。 大半の instruction-following task に適している。
claude-sonnet-thinking¶
model: anthropic/claude-3-7-sonnet
max_completion_tokens: 16000
extra_body:
thinking:
type: enabled
budget_tokens: 8000
extended thinking 有効化済 (budget_tokens: 8000) の Claude Sonnet。 reasoning が
重い task に使う。 cost は同 output 長で claude-sonnet のおよそ 2〜3 倍。
cost variant を作るには extends を使う:
models:
reasoning-light:
extends: claude-sonnet-thinking
extra_body:
thinking:
budget_tokens: 4000 # 8000 を override; type: enabled は base から carry
claude-haiku¶
高速で cost-efficient な Claude Haiku。 単純な抽出 / 分類 task に最適。
gpt-4o-mini¶
OpenAI GPT-4o mini。 低 cost + 高速。
gpt-4o¶
OpenAI GPT-4o。 強力な汎用 model。
gemini-flash-lite¶
Google Gemini 2.5 Flash Lite (= OpenAI 互換 shim 経由)。 非常に低 cost。
gemini-3.1-flash-preview¶
Google Gemini 3.1 Flash Preview (= OpenAI 互換 shim 経由)。
gemini-2.0-flash¶
thinking 無効化 (= thinking_budget: 0) で cost 削減した Google Gemini 2.0 Flash。
LiteLLM / Gemini API note:
thinking_config.thinking_budgetパラメタは LiteLLM の OpenAI 互換 shim 経由で Gemini の thinking mode を無効化する。 将来 Gemini / LiteLLM がこのパラメタ名を変更したら、reyn.yamlの override を update し LiteLLM release notes を確認すること。 この syntax は provider API version 跨ぎで stable と保証されない。
Vendor-specific quirks¶
max_completion_tokens vs max_tokens¶
built-in catalog は Anthropic model で max_completion_tokens を使い、
max_tokens は使わない:
max_completion_tokens: OpenAI o1+ と Anthropic の API level で enforce される。 provider が制限を超えて出力しないことを保証するので、 hard cost control に effectivemax_tokens: legacy の soft hint。 多くの provider が ignore する、 OpenAI o1+ や Anthropic では矯正力なし
hard output cap が必要なときは常に max_completion_tokens を優先する。
Anthropic thinking model¶
claude-sonnet-thinking は extra_body.thinking.{type, budget_tokens} を LiteLLM
経由で Anthropic API に送る。 budget_tokens は reasoning token の上限値で、
実際の使用は少ないこともある。 複雑な task で budget_tokens を低く設定すると
answer 品質が落ちる可能性あり。
Namespace + override semantics¶
built-in catalog は user entry の 前に model namespace に merge されるので、 user-declared entry が常に勝つ:
# reyn.yaml
models:
# built-in claude-sonnet を project 固有 variant で override
claude-sonnet:
model: anthropic/claude-3-7-sonnet
max_completion_tokens: 4096 # この project では tighter な budget
See also¶
reference/config/reyn-yaml.md—models:block、extendssyntax、 deep merge