
AIエージェントが自律的に自己改善する self-improvement スキルが良い
ZennClaude Code でセッションをまたぐと学習が失われる課題を解決する Agent Skill「self-improvement」を紹介。エージェントが訂正・エラー・知識ギャップを検知すると .learnings/ ディレクトリに構造化して記録し、コミットでチーム全員に共有できる仕組み。繰り返し学びは恒久ルールへ昇格させることで、個人の経験がチーム資産になる。
150 件の記事
このタグの RSS
Claude Code でセッションをまたぐと学習が失われる課題を解決する Agent Skill「self-improvement」を紹介。エージェントが訂正・エラー・知識ギャップを検知すると .learnings/ ディレクトリに構造化して記録し、コミットでチーム全員に共有できる仕組み。繰り返し学びは恒久ルールへ昇格させることで、個人の経験がチーム資産になる。



Claude Code の Agent Teams と Dynamic Workflows は、どちらも複数エージェントを扱う機能だが本質が異なる。Agent Teams は対等な独立セッション同士が双方向通信で協働する「チーム」であり、Dynamic Workflows は親セッションがサブエージェントをコードで束ねて並列実行する「実行エンジン」。両者の構造・制御方法・用途を具体的に比較し、使い分けを整理。


Loopy は Claude Code/Codex のセッションを監視し、繰り返しパターンを自動検出して自動化ループを提案するローカルメタエージェント。手動プロンプティングから脱却し、ループエンジニアリングへの移行により、ユーザーは月間 50~200 回のプロンプトを削減でき、1 日 15~30 分の時間短縮が期待できる。

Claude Code のサブエージェントには Explore(読み取り専用)、general-purpose(汎用)、Plan など複数のタイプがあり、タイプごとに使用可能なツール権限が異なる。メインエージェントが「Explore は read-only でした。general-purpose に切り替えて再起動します」と出力するのは、委任先の選定が読み違えられ、軌道修正が行われた正常な動作。v2.1.172 以降はサブエージェント自身が最大5階層まで下位のサブエージェントを生成でき、委任の柔軟性が大幅に拡張された。

Harness Starter Kit が Codex と Claude Code をサポート。Agent Skills / plugin を通じて /harness doctor や /harness review といったワークフローが利用でき、AI coding agent が安定して作業しやすいリポジトリ環境を構築できる。Python、TypeScript、Node.js など複数の技術スタック向けプロファイルも提供。




Loop Engineering は AI へのプロンプト入力を自動化し、エージェント自身がループ内で判断・実行する設計方法論。本記事では bash ループから GitHub Actions 常駐まで 6 つの実装例を示し、各段階での動作コード・制限・コスト目安を解説。L1(報告のみ)から L3(完全自律)への段階的な自律度向上を、実際の検証結果をもとに比較しており、手動プロンプトからの脱却を図るエンジニア向け。

Claude Code v2.1.172 からサブエージェントが自身のサブエージェント(ネストされたエージェント)を生成できるようになった。メインエージェント直下から複数段階のエージェント階層を構成でき、複雑なタスクを取りまとめ役・実作業役に分割・再分割できる。フォアグラウンド実行は無制限、バックグラウンド実行はメイン直下5段までの制限。

GitHub Copilot CLI が委譲ロジックを改善して単純なコマンドは直接処理するように、Copilot app はエージェント常駐型デスクトップアプリとして IDE の外で動くように進化。Claude のモデルを設計フェーズは上位、実装フェーズは Sonnet で使い分けると API コストが 35~40% 削減。Go 1.25 の Green Tea GC 試験版は GC ポーズタイムを 60% 削減し、API サーバーのレイテンシばらつき改善に有効。

Claude Code の /loop コマンドを使い、個人開発の Webアプリ(Next.js / Supabase / Vercel)で「要件定義から要件定義、テスト、デプロイまで」を自動実行させた実験結果。ループ用プロンプトを運用契約書として品質ゲートや終了条件まで記述し、BACKLOG.md をタスク共有ファイルとすることで、人間は優先順位決定とレビューに集中できる体制を実現した。16項目のバックログを半日で完走させた具体的なノウハウを報告。


Claude Codeに、エージェントが別のエージェントを起動できるネストされたサブエージェント機能が追加されました。深さ5まで対応し、コンテキスト管理を改善する実験的機能です。同時に、Opusを長時間自律稼働させるための5つのTips(autoモード・ダイナミックワークフロー等)が公開されています。

個人開発の株式情報サービス dow-japan.jp が、毎日約4,400銘柄を処理する12体のAIエージェント・リサーチチームを本番システムに統合し無人運用している。全銘柄スクリーニング → 絞り込み → 深掘り → レッドチームによる必須反証 → PM最終判定というフローで、コスト最適化と幻覚対策を実装。ローカルLLMと高性能モデルの使い分け、既存データベース(Laravel 12 / Nuxt 3 / MySQL / J-Quants API)への統合、振り返りループなど、本番運用に必要な地味で実用的な設計を詳述。

Anthropic が Fable 5 / Mythos 5 をリリース。コーディング性能、長時間自律性、コード読解力で業界最高水準を実現。Claude Managed Agents、Claude Code の新機能(Agent View、Dynamic Workflows GA、Auto Mode、Routines 等)も発表。楽天・Canva・Spotify・メルカリ等の導入事例で生産性向上を実証。

5dive は複数の Claude Code エージェントを単一ホストで管理・連携させるオープンソースツール。Telegram や Discord 経由でチームを操作でき、各エージェントは独立した Linux ユーザーで動作し、共有ファイルシステムと CLI で通信。自前運用またはマネージドサービスで利用可能。

Claude Code v2.1.172では、サブエージェントが最大5階層までネスト可能になり、1Mコンテキストフリーズ・availableModels制約漏れ・Amazon Bedrockリージョン問題など、開発者が実際に直面していた多数のバグを修正した。v2.1.173はFable 5モデル名正規化とWindows警告修正のホットフィックス。

6ヶ月間の Claude Code 運用から得られた 10 個の設定パターン集。CLAUDE.md を 8,000 文字以下に絞る、settings.json で Bash 操作の権限管理、acceptEdits の選択的有効化、Hooks によるガードレールなどを実装することで、エージェントの誤り改善に月 10~15 時間の工数削減を実現。すぐにコピー可能な設定コードを掲載。


Claude Managed Agents に Scheduled Deployments(cron スケジュール実行)と Vault への environment variable credentials 注入機能が追加された。これまで外部スケジューラやシークレット管理基盤が必要だったが、Anthropic のインフラで統合対応されるため、エージェント開発者の運用負荷が大幅に削減される。

Claude Code v2.1.172 で、サブエージェントが最大 5 階層まで再帰的にサブエージェントを起動できるようになった。1M コンテキスト使用時の固まりを自動復帰、WebFetch のワイルドカードドメイン許可ルールの不具合修正、/plugin 検索バーなど多数の改善を含む。

Mac 上で動作するオープンソースの音声駆動型エージェントシステム OpenYabby が発表された。ユーザーが音声で指示すると、複数の AI エージェントが自動的に計画・実行・レビューを行い、Claude Code や外部ツール連携で実際のローカルタスク (bash、Python、AppleScript 等) を実行。WhatsApp 等のメッセージング機能も備え、単一の音声インターフェースから多段階プロジェクト管理が可能。

Claude Codeをベースに構築した OpenClaw フレームワークでは、CEO・CFO・CMO・COO・CTOの役職エージェントと秘書・ナレッジ管理・プロダクト管理・クライアント管理の4つのオペレーションエージェント計9体が、CLAUDE.md による役割定義と skills ディレクトリでの実装、settings.json のフック設定により自律稼働する経営システムを実現。具体的な設定方法と各エージェントの使用例を解説。



Claude Code の Agent-based hook を使い、サブエージェントがツール検証でメインエージェントの作業をチェックする方法。Stop hook で settings.json に "type": "agent" を指定し、ユニットテスト実行や検証を AI に委譲でき、NG 時の修正も自動化可能。サブエージェントは最大 50 ターンの制約あり。





ローカル LLM (Ollama) でマルチエージェントシステムの構築を試みたが、VRAM 不足と文脈処理能力の限界に直面。Claude Pro プランの Artifacts を活用し、構造化プロンプトのみでノーコード・エージェント・アーキテクチャを実装。複数の AI ディレクターが自律的に議論・収束するシステムを実現した。

Claude Code で長時間実行するエージェントタスクを管理する際、tmux のセッション継続性・並列可視化・プロセス隔離が有効。/bg コマンドでの管理、tmux セッション内でのインタラクティブ実行、--teammate-mode tmux による複数エージェントの並列配置の 3 パターンがあり、「タスクを投げて離席」する運用に対応できる。



Claude Agent SDK を使ったPythonコードの実装例を紹介。Windows では一部モジュールが未対応のため AWS CloudShell (Linux) で検証し、API キー取得・環境構築・実行までの手順と動作確認結果を共有。Claude Certified Architect–Foundations 試験対策としても有用。



Markdownで運用中のClaude Codeマルチエージェント設計がLangGraphの設計思想と対応していることに気づき、Claude OpusとCodexによる設計レビューで10個のギャップを発見した。リトライカウンタ永続化、ハンドオフスキーマ定義、CEO無限ループ防止などの高深刻度の問題を修正し、5つのADRを生成してアーキテクチャを改善した事例。


Claude Code や Cursor などのAIコーディングエージェントで長期的なタスク実行時に発生するコンテキスト肥大化とトークンコスト急騰に対し、プロンプト圧縮の限界を指摘。MemoryLake のような専用記憶層を導入することで、毎ターン再注入されるコンテキストを動的に抑制し、最大約90%のInputトークン削減を実現するアーキテクチャ設計を提案。
ユーザーが Claude Code を用いたエージェントを、24時間連続稼働するオフィスシミュレーション環境に統合した事例。エージェントが仮想オフィス内で自律的にタスク実行・相互作用する様子を実装・検証。AI エージェントの実環境連携とスケーラビリティの可能性を示唆。

フリーランスエンジニアが Claude Code のプラグイン機構を使い、CEO・CFO・CTO・COO・CMO の 5 つの CxO エージェント + 4 つの補助エージェント計 9 体で経営 OS を実装。YAML フラットファイル + freee API・GA4 などの外部サービス連携により、19 プロダクトを並行運用する法人の経営ダッシュボード・財務管理・タスク管理を自動化。







ユーザーが Claude Code に「ultracode モード」での深い検索を指示したところ、Claude Code が自動的に 4 段階のパイプラインを構築し、約 70 個のエージェントを並行実行した。システムが複雑なタスクに対して自発的にマルチエージェントアーキテクチャで対応する事例。



Claude Opus 4.8に搭載されたDynamic Workflowsは、JavaScriptスクリプトがAIサブエージェントをオーケストレーションする機能です。中間結果がコンテキストを通さずスクリプト変数に保持されるため大規模タスクに向いており、数万行のTypeScriptコードベースのセキュリティ監査を66個のエージェントで約15分で実行した事例を紹介します。

Anthropic は Claude Code の Dynamic Workflows で最大 1,000 並列サブエージェントが複雑なコード移行を高速化できることを実証。同時に Microsoft は Build 2026 で自社開発の MAI コーディングモデルを GitHub Copilot に搭載すると発表し、エンタープライズ開発環境の争奪戦が激化。セキュリティ領域では Claude Mythos が数週間以内に一般公開予定で、自律脆弱性スキャンが業界全体に波及する。

Claude Code と Gemini Antigravity を用いてバイブコーディング(自然言語指示のみでコード生成)で同一LPを制作し、5プロンプト以内での完成度、品質ルーブリック、自己評価の信頼性を化学実験の手法で比較検証。AIの自己申告完成度%が実際の成果物品質と一致しない「過信現象」の有無を相互レビューで確認した記録。

Claude Opus 4.8の登場により、AIが自律的にタスクをこなす「エージェント時代」が現実化。性能・速度・自律性の三層進化に加え、Dynamic WorkflowsでAIがツール呼び出し・結果確認・次のアクション選択を自律実行できるようになった。Anthropicの企業価値がOpenAIを超えた背景には、エンタープライズ向け安全性と信頼性への集中投資がある。

AWS の Strands Agents SDK と Amazon Bedrock で構築したAIエージェントに対し、Microsoft の agent-sre パッケージを統合して SLO・サーキットブレーカー・コストガードなどの SRE 機能を実装する方法を解説。Strands 向けカスタムアダプタを BaseAdapter から継承して構築し、Hooks システムを経由してデータを連携させる具体的な実装アプローチを紹介している。

Claude Opus 4.8 に搭載された動的ワークフロー(Dynamic Workflows)は、単一セッション内で数十~数百のサブエージェントを並列実行し、成果物を検証してからユーザーに報告する機能。横長動画1本から縦型ショート動画11本を同時生成する実例を通じて、オーケストレーション機能の仕組み・トークン消費量・起動方法・向いているタスクを解説。


Claude Opus 4.8 リリースに伴い Claude Code に ultracode と dynamic workflows が追加された。ultracode は API の effort レベルではなく、effort(5段階のトークン予算制御)、dynamic workflows(サブエージェントをスクリプトでオーケストレーション)、ultracode(両者を束ねた Claude Code 側の設定)は別概念。公式仕様に基づき 3 つを切り分け、コスト見積もりの誤りを防ぐ。


Claude Code の新バージョンで Opus 4.8 が既定モデルになり、high effort が標準、最難関向け xhigh が追加。dynamic workflows により数十〜数百のエージェントをバックグラウンドで束ねて大規模タスクを処理可能に。/model の選択が新規セッション既定として保存される仕様へ変更。

Anthropic が Claude Opus 4.8 をリリース。コーディング、Agent タスク、プロフェッショナルワークにおけるパフォーマンスが強化され、長時間実行タスクの安定性も向上。


Claude Agent SDKを使い、スマホから自宅PCのClaude Codeを遠隔操作する claude-remote というツールを自作した事例を紹介。Agent SDKがツール実行ループを自動で処理する仕組みと、Firestoreを通信ハブにした構成により、Claude Codeそのものをカスタマイズできることを実装例で解説。

Claude Code の Agent View は複数のバックグラウンドセッションを一覧監視・管理できる機能(2026年5月11日 Research Preview 追加)。本記事は公式機能説明ではなく、実運用で必須の使い方に絞った解説。/bg でセッションをバックグラウンド化、ctrl+r でセッション名変更(worktree 名を prefix に)、shift+↑/↓ で並び替え、@project-name で特定ディレクトリからの起動、space で中身を覗き見。tmux 的な操作感で複数プロジェクト運用が効率化される。

Anthropic が Claude Opus 4.8 を発表し、数百の並列サブエージェントを協調させる Dynamic Workflows を実装。同時に Ping Identity と TrustLogix がエージェント向けのキルスイッチを含むガバナンス機能を展開し、KPMG が 27.6 万人の従業員に Claude を導入。エンタープライズ AI の競争軸は「モデル性能」から「展開・統治の能力」へシフト中。

2026年5月11日に GA した Claude Platform on AWS と Claude Managed Agents (beta) を使用し、Slack で GitHub Organization メンバー追加の Terraform PR を自動生成する Bot を実装した。従来は手作業で数分かかっていた .tf ファイル編集・フォーマット・PR 作成が、Slack メンション一行で完全自動化され、AWS Lambda 2段構成と Git 管理されたエージェントプロンプトで実現されている。







Claude Codeで構築した複数エージェントチームを「回す」ための実践的なノウハウを記録。組織設計・品質管理・改善サイクルの3部構成で、Playbookや委任プロトコル、三層品質ゲート、実際の事故事例などを解説。既にAIチームを構築したが運用に課題がある開発者向け。


Codex と Claude Code を同じリポジトリで併用する際、作業引き継ぎの曖昧さから予期しない修正範囲拡大や権限超過が発生する問題に直面。これを防ぐため、handoff を単なる依頼文ではなく「目的契約」「範囲契約」「権限契約」「完成契約」「検証契約」「失敗契約」の6層に分けた多層契約チェックリストを実装した。

ソニックガーデンのエンジニアが Claude Code で毎日の日報レビューと週次 KPT 準備を自動化するエコシステムを構築。実際の親方のコミュニケーションスタイルを反映した oyakata エージェントが日々フィードバックを提供することで、ふりかえりが週 1 回のイベントから継続的なプロセスに変わり、準備不足でのミーティング参加が解消された。



Claude Code でマルチエージェント型の仮想組織(秘書・マーケ・開発部門)を 13 日間運用した結果、サブエージェント内の Task ツール非動作、クロスレビューの独立性汚染、ID 採番衝突など 5 つの設計上の問題が明らかになった。各地雷への対応(オーケストレーション方式の変更、review-mode フラグ導入、/id-assign スキル追加など)と教訓をまとめた実践記録。


OpenClaw(思考・記憶・指示レイヤー)と Claude Code(開発・実行レイヤー)を組み合わせた開発ワークフローの実装例を紹介。コンテンツ自動生成パイプライン、X 投稿自動化など、フリーランスエンジニアが実務で活用できる具体的なコマンドと設計思想を共有。単体ツールの限界を補い、記憶の永続化と実行能力を両立させる運用方法。

ViralMint は 5 プラットフォームのトレンド動画を検出・分析し、AI でスクリプト生成、字幕付きビデオレンダリング、YouTube・TikTok へのアップロードを自動化するツール。Scout・Analyzer・Generator・Uploader など 6 つのエージェントが MCP で連携し、Claude Code で制御可能。ローカル Whisper・FFmpeg・SQLite を使用し、100% プライベートで動作。


Anthropic は 2026 年 6 月 15 日から、Claude 有料プランに Agent SDK クレジット という月次枠を追加します。これは通常チャット枠とは別に、Claude Agent SDK・claude -p・Claude Code GitHub Actions・サードパーティーアプリで使用する専用クレジットで、OpenAI / Codex との料金体系の違いを反映した設計です。


Claude Cowork 運用で初期段階の無制限なサブエージェント利用により月次コストが2.4倍に跳ね上がった著者が、3ヶ月の試行錯誤を経て確立した実践的な判定基準。並列性または孤立性を取りに行く時だけサブエージェントを使用し、それ以外は親の文脈で直接処理する運用ルール、トークン重複計上・同一作業の重複実行・判断の丸投げといった落とし穴への対処法を具体的なチェックリストと共に提示。

Claude Opus 4.7、GPT-5.5、Grok 4、Gemini 3.1 Proを同一のAgent Workflowで実測比較し、Reasoning・Tool Use・Long Context・Coding・コストの5軸で評価した結果をまとめた記事。Research Agent、Code Generation、Long Context検証の3つのテストで各モデルの強弱が明確になり、「全部で最強」のモデルは存在せず、ユースケース別の使い分けが現実解となることを実証。








Claude Code の Agent で永続メモリを有効にする際、エージェントごとに記録の積極度を「積極的に記録」「控えめに記録」「ユーザ指示時のみ記録」の 3 段階に分けて管理する方針を紹介。各レベルでの MEMORY.md の記述例、記録対象・非対象の具体例、記録言語を日本語に統一するメリットを解説。


Claude Code v0.128.0 で実装された /goal コマンドは、設定した完了条件を満たすまで自動的にターンを繰り返す自立駆動型 Agent 機能。Codex に先行実装されていたこのコマンドは、Claude Haiku による高速判定と信頼済みワークスペース限定のセキュリティ機構を備えており、開発のみならずサーバー管理やデータ分析にも応用可能。




Claude Code の Agent Teams はトークンコスト が高いため、著者が opencode と tmux を組み合わせて同じ開発体験を無料で再現。architect・implementer・tester・reviewer の 4 つのエージェントで TODO アプリを実装し、単一エージェント版との所要時間・トークン数・成果物品質を比較検証した。

Claude Code の 2 バージョンで Fast mode のデフォルトモデルが Opus 4.6 から Opus 4.7 に昇格し、プラグイン依存関係の自動検証、worktree を使えないリポジトリ向けの bgIsolation 設定、MCP タイムアウト範囲の拡張が実装された。CI など決定論寄りの用途では環境変数でピン留めが可能。




Claude Managed Agents にメモリ機能がパブリックベータで利用可能になった。エージェントがセッション間で学習でき、ファイルベースで管理され、API経由でエクスポート・操作可能。Netflix や Rakuten など複数企業が既に導入し、エラー削減や検証速度の向上を実現している。





Anthropic が 2026 年 5 月に発表した Claude for Small Business は、QuickBooks・PayPal・HubSpot など 7 ツールと統合し、財務・営業・マーケティング業務の自動化を提供する。Claude Cowork からセットアップでき、15 のワークフローと再利用可能なスキルで定型業務を委任可能。同時に 2026 年 6 月 15 日から Agent SDK クレジットが分離され、プランごとに月次クレジットが付与される仕組みに変更。

multi-agent-shogun というOSSを6週間以上運用し、Claude Code でマルチエージェント(将軍・家老・足軽・軍師)によるホワイトカラー作業自動化を実装。投資note生成・ファクトチェック・仮想通貨Botバックテスト・YouTube制作など複数業務での活用から得た Claude.md カスタマイズの知見と実装パターンを共有。

Claude Code と Google Antigravity IDE 向けの permission-first 設定キット。CLAUDE.md / GEMINI.md + 10 個の specialist agents + 28 個の skills を 1 コマンドでインストール可能。AI agents に明示的な承認ワークフローを強制し、予測不可能な動作を防止する MIT ライセンス構成。


Claude Code や Cursor などのAIエージェント実用化が進む中、筆者が24時間自動化システムを運用して見えた課題は、AIは「実行」を無限スケールできるが「熱狂」や創意は人間にしかできないということ。エンジニアが今すべき仕事の最適な分業について検討。

Claude Code などのコーディングエージェントの長期使用時に、過去の設計判断やプロジェクト固有のルールが失われる問題を指摘。RAG のみではエージェントの記憶が不十分であり、Claude Code 時代に対応したメモリアーキテクチャの再設計が必要。



Claude Code に複数のエージェントを一括管理できる「Agent View」機能が追加された。この新機能により、複数エージェントの実行状況をリアルタイムで監視し、効率的に制御することが可能になる。開発者は単一インターフェースから複雑なマルチエージェント構成を運用できるようになった。


CoDD v2.17 では、要件定義書を記述してコマンド実行後、AI が自動的にアプリケーション開発を行い、朝起きた時点で完成したアプリが利用可能になる仕組みを実現。起床後にアプリを触れて改善点を指摘するだけで、設計書・ソースコード・テストが自動修正される完全自動開発サイクルを実装。



Claude Code を用いて 10 の部署にエージェントを配置し OSS 開発を自律運営する実験が GitHub・Hacker News・Reddit で BANされた。この実経験から、AI に任せて効果的だった業務と失敗した領域を分析し、人間が担うべき判断領域を考察する。



Claude Code に新しい Agent View が追加された。この機能により、AI エージェントの動作を視覚的に確認・管理できるようになり、複雑なコード生成タスクの透明性と制御性が向上する。