本番でAIが「たまに落ちる」を許す設計 — LLM呼び出しの信頼性エンジニアリング(リトライ・タイムアウト・フォールバック)実践ガイド
Hiroba による自動要約
LLM API呼び出しは1~5%の失敗率を持つため、本番環境では必ず落ちることを前提とした設計が必須。リトライ・タイムアウト・冪等性・フォールバック・サーキットブレーカーの5つの防御パターンを、HTTPステータスコード別の判定と実装可能なコード例を交えて解説。
読んで良かったら、シェアしてみてください。
同じタグの記事が他に 1718 件あります。
関連する記事
同じタグの記事

2026年6月のLLM提供停止ラッシュ:GPT-5・o3スナップショット非推奨とClaude 4退役、本番コードで今すぐ直すこと
Qiita2026年6月、OpenAI と Anthropic が相次いでモデルの非推奨化・退役を発表した。OpenAI は GPT-5・o3 スナップショットを7月23日に停止、Anthropic は Claude Sonnet 4・Opus 4 を既に退役させ、さらに Opus 4.1 も8月5日の退役が予定されている。本番環境でモデルIDをハードコードしているコードは緊急対応が必要で、パラメータの非推奨化による 400 エラーの落とし穴にも注意すべき。

Claude Code Managed Agents 入門 — スケジュール実行と CLI 統合の実装ガイド
Qiita2026年6月に Anthropic が Claude Code Managed Agents をパブリックベータリリース。cron ベースのスケジュール実行、CLI Tools の安全統合、Vault 管理の環境変数が組み込まれたエージェント自動化基盤の実装方法を、日次レポート生成を例に API 設定から本番運用まで解説。


Claude Opus 4.8の品質低下検証v2:Fable/Mythos停止後の多層的な実効劣化分析
Zenn2026年6月中旬以降、Claude Opus 4.8がClaude Codeで言語能力低下や過剰な先回りを示す事例が報告されている。モデル本体の重み差し替えではなく、serving infrastructure・製品層・tool/agent層など複数レイヤーの合成による実効品質のnerfである可能性を、状況証拠から多層的に検証。2026年4月の同様事例(effort変更やprompt副作用)と比較し、層別の影響を明確化。