Dynamic Workflows のトークン実測分析 — キャッシュ読込比率とコスト削減率は『並列度』とともに上がる(15実行)
Hiroba による自動要約
Claude Code の Dynamic Workflows を15回実運用した際のトークンログを分析。キャッシュ読込比率は44~90%、コスト削減率は23~77%の範囲で分布し、両者は強く連動。最大の知見は「並列度(サブエージェント数)が高いほどキャッシュ読込比率・削減率も上昇する」こと。31~52体規模では読込比率79~90%・削減率65~77%を達成し、1エージェント当たり$0.68~$0.98に抑制。多数のサブエージェントが共有プレフィックス(システムプロンプト・ツール定義・親指示)を再利用するメカニズムが機能。
読んで良かったら、シェアしてみてください。
同じタグの記事が他に 1825 件あります。
関連する記事
同じタグの記事

Claude Code Managed Agents 入門 — スケジュール実行と CLI 統合の実装ガイド
Qiita2026年6月に Anthropic が Claude Code Managed Agents をパブリックベータリリース。cron ベースのスケジュール実行、CLI Tools の安全統合、Vault 管理の環境変数が組み込まれたエージェント自動化基盤の実装方法を、日次レポート生成を例に API 設定から本番運用まで解説。

Claude Opus 4.8の品質低下検証v2:Fable/Mythos停止後の多層的な実効劣化分析
Zenn2026年6月中旬以降、Claude Opus 4.8がClaude Codeで言語能力低下や過剰な先回りを示す事例が報告されている。モデル本体の重み差し替えではなく、serving infrastructure・製品層・tool/agent層など複数レイヤーの合成による実効品質のnerfである可能性を、状況証拠から多層的に検証。2026年4月の同様事例(effort変更やprompt副作用)と比較し、層別の影響を明確化。

AppleがGoogleに転換?WWDC 2026 Siri AIがGemini 1.2Tベースになった理由
QiitaWWDC 2026でAppleが発表した次世代Siri AIは、Google Geminiをベースにした約1.2兆パラメータのカスタムモデルを採用。デバイス内処理(Tier 1)→Private Cloud Compute(Tier 2)→Google Cloud(Tier 3)の3層アーキテクチャで、プライバシーを保ちながら重い推論処理をクラウドに委譲する設計に。Apple公式リリースでは「Gemini」の名称を明記せず、年間10億ドルの契約とも報じられている。

Claude Fable 5が消えた日 ─ 2026年6月のLLMベンチマーク調査と代替モデル選択ガイド
QiitaFable 5が輸出管理指令対応で提供停止され、代替LLMの選択が急務となった。SWE-bench Verifiedなどベンチマーク数値の「公認記録」と「参考記録」の区別や、標準化ハーネスとベンダー独自ハーネスの差(10~30ポイント)を踏まえ、用途別に最適なモデルを選ぶ判断軸を解説。最強とコスパは別種目だ。