Agent — Hiroba

タグ: Agent

Maccha — 複数の AI コーディングアシスタント向け統合メモリシステム

Maccha は Antigravity、Claude Code、OpenCode など複数の AI コーディングエージェント間で永続的なコンテキストを共有するファイルベースのメモリアーキテクチャ。ベクトル埋め込みと信頼度減衰を備えた作業メモリエンジン (Memanto) により、エージェントは開始時にゼロからの説明が不要になり、ユーザーの技術的嗜好やプロジェクトルールを記憶した状態で動作。24/7 デーモンやクラウド依存なしで軽量環境でも動作。

2026/06/20Claude-Code MCP Agent

LoopFlow – Claude Code 向けループエンジニアリング

LoopFlow は Claude Code を自動実行システムに変える YAML ベースのツール。目標・エージェントパイプライン・検証ゲートを定義すると、ゲート通過・予算消費・試行回数上限までループが自動繰り返される。自己採点防止・コスト管理・ループ間メモリ保持を実装し、プロンプト手書き時代から脱却できる。

2026/06/20Claude-Code 開発上級

自己成長するサブエージェントを「評価」してみた——本当の戦いは作った後だった

Zenn

Claude Code のサブエージェント機能を使い、レビューを支援する自己成長エージェントを構築・評価した実践記。ゴールデンタスクとルーブリックで測定した結果、プロンプトの具体性、呼び出し時の明確な指示、KB の原則化が挙動に与える影響が全く異なることが判明。未知の漏れを検出する真の「賢さ」を測るには、KB に記録されていない題材での評価が必須。

2026/06/20Claude-Code Agent 上級

ローカル LLM で AI エージェントを自作する全 8 回の軌跡｜Code Maintenance Agent を 13 ステップで完成させるまで

Qiita

Claude Code の仕組みを理解するため、Ollama によるローカル LLM と Claude API を切り替えられる「Code Maintenance Agent」をゼロから 13 ステップで実装した全 8 回シリーズの総集編。土台・ツール化・書き込み・統合の 4 フェーズで段階的に進め、自然言語指示でコード探索・改善計画・差分確認・パッチ適用を自動実行するエージェントを完成させた軌跡を一気に俯瞰できる構成。

2026/06/20Agent 上級開発

Claude Code を相棒にして休日で 16 本の記事と AI エージェントを作った方法

Qiita

働きながら学びを両立させるエンジニア向けに、Claude と Claude Code を「丸投げ」ではなく「自己拡張」の相棒として使い分ける実践法を紹介。CLAUDE.md・実装指示書・PROGRESS.md の 3 つの仕組みにより、限られた休日の時間で agent01 開発と執筆を並行したプロセスを解説。

2026/06/20Claude-Code Agent 開発

GitHub Copilot CLI が委譲ロジックを改善して単純なコマンドは直接処理するように、Copilot app はエージェント常駐型デスクトップアプリとして IDE の外で動くように進化。Claude のモデルを設計フェーズは上位、実装フェーズは Sonnet で使い分けると API コストが 35～40% 削減。Go 1.25 の Green Tea GC 試験版は GC ポーズタイムを 60% 削減し、API サーバーのレイテンシばらつき改善に有効。

2026/06/13Claude Agent 開発

Zenn

13ステップで構築した「Code Maintenance Agent」の全体像を振り返る記事。LLM抽象化による Ollama / Claude API の切り替え、tool_use サイクルの仕組み、読み取り系ツールの自動実行と書き込み系ツールの確認要求の設計思想を解説。エージェント実装における LLM 選定、システムプロンプトの重要性、Windows エンコーディング対応などの知見を共有。

2026/06/11Agent 上級開発

Zenn

Claude Pro や ChatGPT Plus は月額据え置きながら性能が指数関数的に向上している。多くのユーザーが「対話モード」の手動トリガーにとどまっているが、トリガー層・処理層・出力層のアーキテクチャで自動化モードへ移行すれば、1つのテーマから複数プラットフォーム向けコンテンツを生成する作業を3～5時間から15～30分に短縮できる。先行者利益の窓は今後半年～1年で閉じるため、今が始めるべきタイミング。

2026/06/10Claude Agent 中級

Qiita

Claude Code や Cursor などのAIコーディングエージェントで長期的なタスク実行時に発生するコンテキスト肥大化とトークンコスト急騰に対し、プロンプト圧縮の限界を指摘。MemoryLake のような専用記憶層を導入することで、毎ターン再注入されるコンテキストを動的に抑制し、最大約90%のInputトークン削減を実現するアーキテクチャ設計を提案。

2026/06/05Claude-Code Agent 上級

Zenn

マルチエージェント組織でエージェントを disable 時に cron.md のエントリが自動削除されず、存在しないエージェントが継続的に API を呼び出し、月額数十〜数百ドルの無駄コストが発生する問題を実例紹介。disable 前後の cron リスト確認・手動削除・検査スクリプト実行の 3 ステップで対策できる。

2026/05/31Agent API 開発

Zenn

2026年5月11日に GA した Claude Platform on AWS と Claude Managed Agents (beta) を使用し、Slack で GitHub Organization メンバー追加の Terraform PR を自動生成する Bot を実装した。従来は手作業で数分かかっていた .tf ファイル編集・フォーマット・PR 作成が、Slack メンション一行で完全自動化され、AWS Lambda 2段構成と Git 管理されたエージェントプロンプトで実現されている。

2026/05/27Claude Agent AWS

Anthropic が非コーディング AI Agent が本番環境で失敗する理由を確認

Anthropic が AI Agent の本番運用における失敗の主要原因を明らかにした。非コーディング型 Agent の約 90% が実運用で機能しない背景には、設計・実装・監視の根本的な課題があることが示唆されている。

2026/05/27Agent 開発上級

X自動投稿AIエージェントの全体設計 — Research Agent → Claude → HITL承認 → 投稿

Zenn

X（Twitter）への毎日の投稿業務を自動化するため、Research Agentが収集したAI情報をもとにClaude Sonnet + Haikuで投稿案3本を生成し、Slackで承認・修正・スキップをワンクリック操作。承認されたものは自動でX APIで投稿される仕組みをAWS Step Functions + Lambda + DynamoDB + Slackで構築した事例。

2026/05/27Claude Agent 中級

X投稿の品質を上げるために入れた3つの改善 — テーマ重複防止・投稿タイプ多様化・AI的文体排除

Zenn

Content Agent で生成する X 投稿で、テーマ重複・タイプ単調性・AI 的文体が問題となった。S3 で過去 14 日のテーマを参照して重複を防ぎ、投稿タイプを動的選択 (LRU アルゴリズム) に変更し、プロンプトで禁止フレーズを指定することで品質を向上させた実装テクニック。

2026/05/27Claude Agent 開発

AWS Lambda で AI 先輩を作った — 毎朝 5 時に話しかけてくれて、@メンションで相談にも乗る Senpai Agent

Zenn

AWS Lambda と EventBridge を使い、毎朝 5 時に Slack で話しかけるキャラクター性を持った AI エージェント「さつき」を実装。Slack 履歴と Tavily で毎日異なるメッセージを生成し、@メンション時は Claude Sonnet で相談対応・Notion タスク更新を実行。Boss Agent との役割分担で複数エージェント設計を実現。

2026/05/27Agent API 開発

AWS Lambda + Claude APIで「AI上司」を作った — NotionタスクをSlackに届けるBoss Agent

Zenn

AWS Lambda と Claude API を組み合わせ、Notion で管理するタスクを毎朝 Slack に通知する「AI上司」エージェントを実装。停滞タスクの検知やキャラクター設定（システムプロンプト）を通じた自然な指導メッセージ生成、Slack の 3 秒タイムアウト制限への対応などを具体的なコード例で解説。

2026/05/27API 開発 Agent

LiteLLM と LangMem の prompt_optimizer でエージェントをオンライン学習・自己改善させる

DevIO

LangMem の create_prompt_optimizer を使い、エージェントがフィードバックから system prompt を継続的に書き換えるオンライン学習の実装方法を解説。prompt_memory / metaprompt / gradient の 3 種類の最適化アルゴリズムと、会話履歴・スコア・自由文フィードバックを組み合わせた 4 つのサンプルを紹介。デプロイ後の振る舞い更新を可能にする運用上の利点を備える。

2026/05/26API Agent 中級

マルチエージェント、「忖度」して精度が下がる

Zenn

複数のAIエージェントを協調させるマルチエージェントシステムでは、他のエージェントからの情報（たとえ誤った情報）に同調し、自らの正しい推論を放棄する「Alignment Hallucination（忖度ハルシネーション）」が発生し、精度が低下することが判明。Claude Sonnet 4.6は社会的圧力への耐性があるが、GPT-5.4やGemini 3.1 Proは大幅に精度が崩壊することが確認され、エージェント設計によって脆弱性は防げることが示唆された。

2026/05/26Agent API 中級

AI Agent に「学び方」を教えるとは何か — Code with Claude 2026 London

Zenn

Anthropic 主催のカンファレンス『Code with Claude 2026』で、Warp の Petra Donka 氏が登壇したセッションの分析記事。「ほぼ動くが信頼できない」というエージェント開発の中間地帯から脱する方法を、社内エージェント Buzz の実装例を通じて解説。プロンプト最適化から脱し、フィードバックループとチーム学習の仕組みを設計することの重要性を指摘している。

2026/05/25Agent 中級開発

Claude Codeで9体のAIエージェント編集部を運用する方法

Zenn

Claude Codeで構築した複数エージェントチームを「回す」ための実践的なノウハウを記録。組織設計・品質管理・改善サイクルの3部構成で、Playbookや委任プロトコル、三層品質ゲート、実際の事故事例などを解説。既にAIチームを構築したが運用に課題がある開発者向け。

2026/05/25Claude-Code Agent ビジネス

Anthropic最新研究まとめ: Project Glasswing・AIの内部思考可視化・エージェント安全性

Qiita

Anthropicが2026年5月にリサーチページをリニューアルし、Natural Language Autoencoders（Claude の内部思考を人間が読めるテキストに変換する技術）、Teaching Claude why（エージェント利用時のミスアラインメント低減）、Project Glasswing（新重点プロジェクト）を公開。エージェント開発者と安全性研究者向けに、モデルの解釈性と信頼性を高める複数の技術進展を発表。

2026/05/25Agent API 安全性

Qiita

Discord 上で 9 体の AI エージェント（Claude 8 体、GPT-5.5 1 体）を同時稼働させる「AI 会社」システムを構築した事例。人格定義ファイル (CLAUDE.md) のインジェクション、非同期キューによるメッセージ重複排除、typing indicator の keep-alive による Rate Limit 対策、自律ループの停止化など、実装時の技術的課題と解決策を記録。

2026/05/23Claude Agent 開発

LiteLLM × LangGraph で GPT と Claude を混在させた A2A エージェント連携を構築する

DevIO

Google が提唱した A2A (Agent-to-Agent) プロトコルを使い、LiteLLM × LangGraph で複数の LLM プロバイダー (GPT と Claude) を混在させたエージェント協調システムを実装する手法を紹介。HTTP + JSON-RPC をベースに、エージェント同士が自律的に対話・協調するオープンプロトコルの活用方法を具体的なコード例で解説。

2026/05/22Claude API Agent

OpenClaw × Claude Code 連携を徹底解説【2026年最新】AIエージェント実践ガイド

Qiita

OpenClaw（思考・記憶・指示レイヤー）と Claude Code（開発・実行レイヤー）を組み合わせた開発ワークフローの実装例を紹介。コンテンツ自動生成パイプライン、X 投稿自動化など、フリーランスエンジニアが実務で活用できる具体的なコマンドと設計思想を共有。単体ツールの限界を補い、記憶の永続化と実行能力を両立させる運用方法。

2026/05/22Claude-Code Agent 開発

LLM agent に誤前提が 17 連鎖した話 — typo 1 文字が生む指摘の連鎖と、その断ち方

Zenn

設計書の typo 1 文字が起点となり、存在しないテーブル名が 4 層を通り抜け、最終的に 17 件の誤前提が連鎖したインシデント。AI がユーザー入力を無条件に正とみなし、自社コードベースへの「知っているはず」という慢心により実機確認を省略したことが根因。タスク着手前の必須手順 8 件を示唆。

2026/05/22Agent 上級開発

Zenn

26Mパラメータの小型モデル Needle が Gemini の蒸留に成功し、ツール呼び出しなどのエージェント機能を低コスト・低遅延で実現。プライバシー重視の企業やエッジ環境でのオフライン運用が可能になり、MCP との組み合わせで Claude Code のような自動編集機能をローカルで実行できる時代が到来しつつある。

2026/05/18Agent MCP 開発

LiteLLM と DeepEval で LangGraph エージェントの応答品質を自動評価する

DevIO

LiteLLM と DeepEval を組み合わせることで、LangGraph エージェントの応答関連性・忠実性・ハルシネーション検出を自動評価できる。DeepEval は LLM-as-a-judge 型の複数メトリクスを提供し、Python コードで LLMTestCase を定義して evaluate() 関数で一括評価が可能。

2026/05/17Agent 開発上級

opencode で Claude Code の Agent Teams 機能を再現・比較検証した

Zenn

Claude Code の Agent Teams はトークンコストが高いため、著者が opencode と tmux を組み合わせて同じ開発体験を無料で再現。architect・implementer・tester・reviewer の 4 つのエージェントで TODO アプリを実装し、単一エージェント版との所要時間・トークン数・成果物品質を比較検証した。

2026/05/17Claude-Code Agent 開発

Claude Code v2.1.142～v2.1.143 リリース

Qiita

Claude Code の 2 バージョンで Fast mode のデフォルトモデルが Opus 4.6 から Opus 4.7 に昇格し、プラグイン依存関係の自動検証、worktree を使えないリポジトリ向けの bgIsolation 設定、MCP タイムアウト範囲の拡張が実装された。CI など決定論寄りの用途では環境変数でピン留めが可能。

2026/05/16Claude-Code Agent 開発

26Mパラメータの衝撃——エージェント蒸留と信頼性の壁

multi-agent-shogun というOSSを6週間以上運用し、Claude Code でマルチエージェント（将軍・家老・足軽・軍師）によるホワイトカラー作業自動化を実装。投資note生成・ファクトチェック・仮想通貨Botバックテスト・YouTube制作など複数業務での活用から得た Claude.md カスタマイズの知見と実装パターンを共有。

2026/05/14Claude-Code Agent 開発

24時間稼働のエージェントワークフローでの過度な利用がAPI制限の原因に

Reddit のコミュニティユーザーが、継続的に動作するAgent パターンでの過度な Claude 利用が、Anthropic による全体的な制限強化につながっていると指摘。個人の使用方法が他ユーザーの利用体験に影響を与える構造についての議論。

2026/05/14Agent API 上級

Claude エージェントを複数同時実行！ターミナルタブ不要の新機能

Zenn

Claude に複数のエージェントセッションを同時に管理・実行できる新機能が追加された。単一のコマンド実行で複数エージェントをディスパッチでき、スケーラビリティが向上。ターミナルタブを分割する手間が不要になる。

2026/05/14Agent API 開発

Full Stack HQ – Claude Code と Agent Stack for Google Antigravity IDE

Claude Code と Google Antigravity IDE 向けの permission-first 設定キット。CLAUDE.md / GEMINI.md + 10 個の specialist agents + 28 個の skills を 1 コマンドでインストール可能。AI agents に明示的な承認ワークフローを強制し、予測不可能な動作を防止する MIT ライセンス構成。

2026/05/14Claude-Code Agent Skills

エージェント運用のコスト削減を実現する Advisor Strategy ― Anthropic が提示した Opus × Sonnet / Haiku の役割分担パターン

Qiita

Anthropic が提示したエージェント運用の最適化戦略 Advisor Strategy は、Claude Opus / Sonnet / Haiku を段階的に役割分担させることでコスト削減と性能を両立させる。複数モデルの特性を活かした実装パターンにより、エージェント運用における API 利用料の効率化が可能になる。

2026/05/14Agent API 開発

AIエージェントは24時間働く。でも「熱狂」を生むのは人間だけだ──エンジニアが今考えるべき分業の最適解

Zenn

Claude Code や Cursor などのAIエージェント実用化が進む中、筆者が24時間自動化システムを運用して見えた課題は、AIは「実行」を無限スケールできるが「熱狂」や創意は人間にしかできないということ。エンジニアが今すべき仕事の最適な分業について検討。

2026/05/14Claude-Code Agent 開発

RAG だけでは Agent は「記憶」できない。Claude Code 時代のMemory アーキテクチャ再考

Zenn

Claude Code などのコーディングエージェントの長期使用時に、過去の設計判断やプロジェクト固有のルールが失われる問題を指摘。RAG のみではエージェントの記憶が不十分であり、Claude Code 時代に対応したメモリアーキテクチャの再設計が必要。

2026/05/14Claude-Code Agent 開発

Shepherd——エージェント実行の Git 管理、形式化の時代へ

Zenn

Lean 言語で形式化されたエージェント操作モデルと Git 風の実行トレースにより、エージェントの行動理由を完全に再現・デバッグできるランタイム基盤 Shepherd が登場。定理証明を用いた検証により、エージェント開発における「なぜその行動を取ったか分からない」という根本課題を解決。

2026/05/14Agent 開発上級

Claude Agent Skills 入門

Qiita

Claude Agent Skills の基本概念と実装方法を解説。Agent が外部ツールやサービスと連携する際のスキル定義の仕組みを学べます。実装例を通じて初心者向けに Skillsの活用法を紹介。

2026/05/14Skills Agent 初心者

複数のエージェントを 1 画面で管理する Claude Code の新機能「Agent View」を試してみた

DevIO

Claude Code に複数のエージェントを一括管理できる「Agent View」機能が追加された。この新機能により、複数エージェントの実行状況をリアルタイムで監視し、効率的に制御することが可能になる。開発者は単一インターフェースから複雑なマルチエージェント構成を運用できるようになった。

2026/05/13Claude-Code Agent 開発

Claude Managed Agents Memory 入門 — セッションを超えて学習する AI エージェントを Python で実装する

Qiita

Claude Managed Agents の Memory 機能を使い、複数のセッション間で学習・記憶を保持する AI エージェントを Python で構築する方法を解説。会話履歴をセッション横断で保存・活用することで、コンテキストを維持したエージェント開発が可能になる。

2026/05/13Agent API 開発

要件定義書を書いて寝ている間にアプリが完成する開発フロー - CoDD v2.17 マイルストーン

Zenn

CoDD v2.17 では、要件定義書を記述してコマンド実行後、AI が自動的にアプリケーション開発を行い、朝起きた時点で完成したアプリが利用可能になる仕組みを実現。起床後にアプリを触れて改善点を指摘するだけで、設計書・ソースコード・テストが自動修正される完全自動開発サイクルを実装。

2026/05/13Claude-Code Agent 開発

Shepherd: メタエージェント操作を形式化するランタイム基盤

Zenn

Lean言語による形式的なエージェント操作モデルと Git 風の実行トレースを組み合わせ、AIエージェントの再現性とデバッグ性を根本から改善するランタイム基盤 Shepherd が発表された。エージェントの行動選択が不透明な問題に対し、定理証明支援系による形式化で解決を目指す。

2026/05/13Agent 開発上級

Claude プランに月次 Agent SDK クレジットが新たに付与

Claude の有料プランに毎月 Agent SDK の利用クレジットが新たに追加される。既存ユーザーと新規ユーザー双方が対象で、Agent ベースのアプリケーション開発がより容易になる。

2026/05/13Agent API 開発

Claude Managed Agents「Dreaming」と AgentCore Optimization の違い

Qiita

Claude Managed Agents の「Dreaming」機能と AgentCore Optimization の設計思想・実装方法を徹底比較。推論深度、メモリ効率、タスク適用範囲の違いを具体例で解説し、各手法の使い分けポイントを示す。

2026/05/13Agent 中級開発

Claude Code で仮想会社を運営してわかった、人間がやるべきこと

Zenn

Claude Code を用いて 10 の部署にエージェントを配置し OSS 開発を自律運営する実験が GitHub・Hacker News・Reddit で BANされた。この実経験から、AI に任せて効果的だった業務と失敗した領域を分析し、人間が担うべき判断領域を考察する。

2026/05/13Claude-Code Agent 開発

LLMは「考える」から「動く」へ——AIエージェント進化の最前線

Zenn

LLMが質問応答から行動主体へ進化し、ブラウザ操作・コード生成・API呼び出し・自己改善を実行する「行動する知性」へ変容している。企業導入事例を通じて、メール処理から社内システム更新までを自動実行するエージェント化の実用化段階を解説。思考と行動の間の技術的課題と実装の現実を取り上げる。

2026/05/13Agent API 上級

Anthropic が提示するマルチエージェント設計パターン5選〜ローカル完結から AWS 実装イメージまで〜

DevIO

Anthropic が推奨するマルチエージェントシステムの設計パターン5つを解説。ローカル環境での実装からクラウド環境での本番運用まで、複数の Claude インスタンスを協調させるアーキテクチャの選択肢と実装方法を網羅。エージェント間通信、状態管理、スケーリング戦略の具体例を提示。

2026/05/12Agent 開発上級

Shepherd: メタエージェント操作を形式化するランタイム基盤

Zenn

Lean言語による形式的なエージェント操作モデルと Git 風の実行トレースを組み合わせたShepherd が登場。エージェントの行動理由が追跡不可能という開発課題に対し、再現性とデバッグ性を根本的に改善するアプローチを提示する論文が公開された。

2026/05/12Agent 開発上級

Claude Code の新機能：Agent View

Claude Code に新しい Agent View が追加された。この機能により、AI エージェントの動作を視覚的に確認・管理できるようになり、複雑なコード生成タスクの透明性と制御性が向上する。

2026/05/11Claude-Code Agent 開発