Claude Code 向けメモリレイヤー - SWE-bench Verified ベンチマークで +10.2pt 改善
Hiroba による自動要約
world-model-mcp は、Claude Code / Cursor で動作する時間的知識グラフメモリレイヤーで、コード変更を学習した制約に対して検証し、重複したエラーを防ぎ、矛盾を信頼度加重で解決する。SWE-bench Verified の 50 タスクで、エージェントの繰り返し誤りを +10.2pt(ドメイン内 +15.0pt、クロスドメイン +6.9pt)削減することを実証した v0.9.1 が公開された。MCP 26 ツール、26 サブコマンド、375 テスト、105 ペアの矛盾解決ベンチマークを備える。
読んで良かったら、シェアしてみてください。
同じタグの記事が他に 1934 件あります。
関連する記事
同じタグの記事
nff: ハードウェア向けオープンソース Claude Code
HNnff は MCP サーバーで、Claude に USB 接続した ESP32・Arduino・STM32 などのマイコンボードへの直接制御を可能にします。ファームウェアの作成・コンパイル・書き込み・シリアル出力読み取りを自動化し、フィールドデバイスの遠隔診断・障害解析・アップデート配信もサポート。v0.2.20 ではビルドタイムアウト改善と一時的なツールチェーンエラーの自動リトライ機能を追加し、無人運用での信頼性を向上。

Claude Code × Codex × Obsidian で複数 AI エージェントの「半自動会議」を実装する——役割分担・記憶分離・ガードレール構成
Qiita複数の AI エージェント(Claude Code と Codex)を Obsidian の共有メモリを介して連携させ、設計・実装・レビューを自動化しつつ、本番反映は人間が承認するハイブリッド体制を構築。ファイル経由のやり取り、役割の厳密な分離、Git 管理された Markdown による長期記憶、ガードレール実装を含む再現可能な実装例を解説。

Claude Code と Codex を単一パイプラインとして統合する
HNClaude Code と Codex はそれぞれ異なる設計哲学に基づいており、実装例を交えて両者を単一パイプラインとして組み合わせる方法を解説。ベンチマーク比較ではマルチファイル推論は Claude が強く、ターミナル作業は Codex が優位。コンテキストウィンドウの信頼性低下曲線の理解が実装時の鍵となる。

Power BI を MCP サーバーなしで Claude に操作させる
Qiita.pbip ファイル形式はテキストベースの設計図であり、バイナリの .pbix と異なり、Claude が直接読み書きできる。MCP サーバーを立てずに Claude に TMDL・PBIR・M クエリを書かせることで、Power BI モデルを生成・編集可能。データ本体は別途 refresh で読み込む。