
Claude Opus 4.8 / Gemini 3.5 Pro 時代の「長文コンテキスト活用」実装パターン
Zenn200万トークンのコンテキストウィンドウを備えた新世代モデルが登場したが、全文を投じるのはコスト効率とLost in the middle問題を招く。RAG で関連チャンク抽出するハイブリッド構成と、全体把握タスク向け長文コンテキスト活用を使い分けることで、精度を保ちながらコストを削減する実装パターンをコード例付きで解説。
全 2065 件 · 38 / 104 ページ

200万トークンのコンテキストウィンドウを備えた新世代モデルが登場したが、全文を投じるのはコスト効率とLost in the middle問題を招く。RAG で関連チャンク抽出するハイブリッド構成と、全体把握タスク向け長文コンテキスト活用を使い分けることで、精度を保ちながらコストを削減する実装パターンをコード例付きで解説。


Claude Code は CLI・Cursor・Claude アプリの 3 つの環境で動作し、各々でできることが異なる。CLI はコスト重視・自動化向け、Cursor は VS Code 既存ユーザー向け、Claude アプリはマルチエージェント・コンピュータ操作・非コード作業を含む業務全体をカバーする唯一の環境。コーディング以上の活用を目指すなら Claude アプリ一択となる。



6月15日より Claude の有料プランに「プログラム利用専用の月次クレジット」が導入される。これまで対話 UI と同一レート枠で動いていた Agent SDK や claude -p が、専用クレジット枠に移行される。同時に AI 業務では「何を読ませるか」の最適化が重要になり、ソフトバンクグループの純利益推移を Web 検索・PDF 全文・構造化 API の 3 経路で質問した結果、入力トークン量が約 1,200 倍差となった。



CodeGraph はプロジェクトのコードを知識グラフとしてインデックス化し、Agent が grep による探索なしに必要な情報を直接取得できるツール。VS Code での実測で Claude Code のトークン消費 64% 削減、ツール呼び出し 81% 削減を達成し、月数千円〜数万円の API コスト削減が可能。

エンジニアチームが Claude Code 導入時に GitHub・Slack・Box・Figma・Backlog など外部ツールとの MCP 連携安全性を調査した記録。ツール公式 MCP か第三者 MCP かで安全性が大きく変わること、各ツール別の接続可否と必須対策(API キー管理、権限最小化、データ経由元確認等)をまとめている。

Anthropic が提供する Claude 関連のサービスを包括的にまとめた記事。Claude Opus / Sonnet / Haiku などのモデル、Artifacts / Projects / Claude Code / Claude Design などの機能、API / MCP / Connectors などの開発者向けツールまで、単なるチャット AI ではなく AI 作業環境として拡張しているエコシステム全体を解説。
Claude Code を使用して、本番環境で運用可能な品質の Lottie アニメーション(JSON ベースのベクターアニメーション形式)を自動生成する方法が紹介されている。開発者が手動でアニメーション JSON を作成する手間を削減し、迅速にプロダクション対応のビジュアル資産を生成できる点が特徴。

Claude Code v2.1.166~v2.1.168 では、プライマリモデル過負荷時に自動切り替えする fallbackModel 設定が追加され、可用性が向上。deny ルールの glob パターン対応やセッション間メッセージング堅牢化により権限制御が強化され、処理できない画像でのトークン浪費やリモートセッションの永久スタックなど 14 件の不具合が修正された。

Claude Desktopに対してLinux版の要望がGitHubで522スコアを記録し、開発者コミュニティから大きな反響を呼んでいる。技術的には実現可能だが優先度の問題により実装されておらず、Linux開発者の約47%が恩恵を受けられない現状が指摘されている。競合ツールの進化やApple-Googleの統合戦略が進む中、公式Linux対応のロードマップ公開やAPI・MCP強化が求められている。

Claude Code で生成されたコードが完全に動作する状態に見えても、実際には細かなバグや不完全な実装が残っている場合が多いという指摘。ユーザーが生成されたコードを盲信せず、十分なテストとレビューが必要であることが論じられている。

Mineflayer を使用して Minecraft にプレイヤーと協力できる AI コンパニオンを実装した事例。LLM を game loop に直接組み込まず、反射層・スキル層・思考層の3層構造に分離し、速度と安全性を両立させた設計を詳解。Claude CLI と Ollama のハイブリッド構成で会話品質とコスト効率を実現。

Opus 4.8 と GPT-5.5 を GitHub Copilot CLI で effort パラメータを 4 段階に変えて検証した結果、同じ effort 上昇でもモデルで内部動作が異なることが判明。GPT-5.5 は思考量(reasoning token)を 18 倍に増やし出力の 2/3 が内部思考になるのに対し、Opus 4.8 は思考回数とツール呼出回数を増やして複数回の試行で対応。