
Anthropic が 2026年6月9日に Mythos クラス初の一般公開モデル Claude Fable 5 を発表。長時間・複雑なタスクで Opus を上回る性能を持つ一方、サイバー・生物化学・蒸留関連クエリで安全分類器が Opus 4.8 にフォールバックする。分類器が過度に広く設定されており良性クエリの誤検知が多発中で、運用設計での吸収が必須。

Anthropic が新モデル Claude Fable 5 を 6 月 9 日リリース。Opus 4.8 を上回る「Mythos クラス」(一般提供初)で、SWE-Bench Pro 80.3% を達成し GPT-5.5 を 20 ポイント引き離した。Pro/Max/Team/Enterprise ユーザーは 6 月 22 日まで無料利用でき、その後は $10/$50(百万トークン当たり入力/出力)の従量課金。

Claude Code の 4 バージョンで、モデル選択の抜け道を塞ぐ enforceAvailableModels 設定、会話言語に合わせたセッションタイトル生成、/usage での 24h/7d ごとのトークン内訳表示(cache miss・subagent・skill 別)が追加。Remote Control とバックグラウンド実行周りのバグも多数修正。

Claude Code の 2026-06-11〜06-12 における 3 バージョン分のアップデート(新機能 3 件・修正 13 件)をまとめたもの。enforceAvailableModels 管理設定によるモデルガバナンス強化、/usage ダイアログへの使用量内訳表示(Skills/Agents/Plugins/MCP ごと)、バックグラウンドセッションの環境変数引き継ぎやモデルピッカーの表示不具合など複数の安定性修正が含まれている。

Claude Fable 5(トークン単価 Opus 4.8 の約2倍)を自動売買システム開発で実機評価した結果、実装タスクでは速度向上のみで単価分の価値が薄い一方、レビュアー役では実装側モデルが生成した存在しない API フィールド(ハルシネーション)を公式仕様の自走取得で検出し本番事故を防いだ。高性能モデルは「実装の置き換え」ではなく「独立検証者」として配置したときに価値が最大化される。

複数リポジトリにまたがる開発で親ディレクトリから Claude Code を起動すると、プロジェクトメモリのスコープが分散し、関連のないコードがコンテキストに含まれるため、生成コードの精度が低下する傾向が見られた。現在は作業対象リポジトリから起動し、共通ルールと repository 固有ルールをメモリで分離管理する運用に変更。情報の粒度を意識したコンテキスト設計の重要性を報告。
オープンソース開発者 Jos Dehaes が Rust で一から開発した新しい X11 サーバー「Yserver」を発表。Claude Code の支援を受けており、X.Org との 1:1 置き換えではなく、モダンな機能に特化し従来の仕様を削除した設計。MATE、Xfce、Cinnamon などのフルデスクトップ環境を実行でき、RandR、DRI3、GLX などの主要拡張に対応。MIT ライセンスでオープンソース公開。
Claude Code や Codex CLI など複数の AI コーディングエージェントのセッション履歴を一元管理・検索できるローカルツール。エージェントが実行した全コマンド・ファイル操作・トークン消費を記録し、`vaportrail show`で再生、`vaportrail search`で全文検索、`vaportrail stats`で統計表示が可能。依存関係なし、データはマシン内に留まる。

Claude Codeに、エージェントが別のエージェントを起動できるネストされたサブエージェント機能が追加されました。深さ5まで対応し、コンテキスト管理を改善する実験的機能です。同時に、Opusを長時間自律稼働させるための5つのTips(autoモード・ダイナミックワークフロー等)が公開されています。

Claude Opus 4.8 でツール呼び出しの開始マーカーが court / count などの実在英単語に変換され、コマンドが実行されずツール出力が画面に漏れる現象が報告されている。長文脈・日本語引数を含むセッションで踏みやすく、一度発生すると履歴が汚染され自己修復しない。Opus 4.7 への降格か /compact / /rewind での回避が推奨。

個人開発の株式情報サービス dow-japan.jp が、毎日約4,400銘柄を処理する12体のAIエージェント・リサーチチームを本番システムに統合し無人運用している。全銘柄スクリーニング → 絞り込み → 深掘り → レッドチームによる必須反証 → PM最終判定というフローで、コスト最適化と幻覚対策を実装。ローカルLLMと高性能モデルの使い分け、既存データベース(Laravel 12 / Nuxt 3 / MySQL / J-Quants API)への統合、振り返りループなど、本番運用に必要な地味で実用的な設計を詳述。