Claude Code のトークン、95% は cache read — セッション肥大化をフックで検知し /compact を提案させる
Hiroba による自動要約
Claude Code の1日の実測でトークン消費の約95%が cache read(キャッシュ済みコンテキストの再読)であることが判明。セッションの肥大化に伴い毎ターンの再読量が雪だるま式に増える構造が明らかになり、output 削減より「セッションの切り時を早める」方が効果的。requestId 重複排除と subagents/ ディレクトリ集計の落とし穴を回避し、モデル自身に切り時を提案させる session-health プラグインを公開。
読んで良かったら、シェアしてみてください。
同じタグの記事が他に 2071 件あります。
関連する記事
同じタグの記事

AI Daily Digest: 2026年7月3日 — Claude Sonnet 5、Claude Science、AIインフラブーム
QiitaAnthropicは6月30日にClaude Sonnet 5をリリース。Opusクラスの自律的なエージェント機能を大幅に低価格で実現し、セキュリティ評価も優れている。同時にClaude Scienceをベータ公開。60以上の科学データベースを統合し、研究時間を10分の1に短縮する事例も報告された。一方OpenAIのGPT-5.6シリーズは全モデルが「ハイリスク」分類となり、米国政府の要請で限定公開となった。

ニュース動画を全自動生成するパイプラインを作った話 ― TTS と LLM でハマった罠
ZennClaude Code を使い約 8.5 ヶ月かけて、ニュース収集からYouTube投稿まで全自動で行うマルチチャンネル動画生成パイプラインを構築。Python で実装し、ステップごとにサブプロセス化してタイムアウト制御・個別リトライを実現。実運用で TTS・LLM API との試行錯誤で踏んだ地雷と回避策を技術者向けに詳解。

Claude Fable 5復活で作る3層モデルルーティング設計
ZennClaude Fable 5が輸出管理の解除により7月1日にグローバルで再提供されたが、復活版は安全classifierの強化と提供条件の制限が施されている。本番運用ではモデル選定を入口(plan/region)、実行中(requestedModel/servedModel/routeReason)、出口(品質スコア)の3層に分けて監視し、fallback発生やタスクごとの経路変更をログに記録すべき。

Claude Agent SDKを読んで分かったこと〜Claude Codeがライブラリになった〜
QiitaAnthropic公開のClaude Agent SDKはClaude Codeをライブラリとして利用可能にし、Agent Loopを自動化するSDK。従来の開発者実装のLLM→Tool実行ループが不要になり、query()呼び出しで判断・実行・確認・コンテキスト管理を自律実行。Sub Agent構文とHooks機能により複雑なマルチエージェントワークフローが管理しやすくなった。