Claude Code の Skill を改善する — autoresearch と evals-skills を使った実践ガイド
出典: Zenn (Claude topic) の記事を Hiroba が自動要約。
元記事を読むHiroba による自動要約
Claude Code の Skill 改善に autoresearch と evals-skills を組み合わせる手法を解説。eval を正しく設計してから autoresearch に渡すことで、AI エージェントが SKILL.md を自律的に改善でき、error-diagnosis Skill はパス率 68% から 100% まで向上した事例を紹介。
! 3行まとめ
evalを正しく設計してからautoresearchに渡すと、AIエージェントが自律的にSKILL.mdを改善し続けます 順序を守らないと、スコアは上がっても実際の品質が下がります error-diagnosis Skillをこの手順で改善したところ、パス率が68%から100%まで上がりました
はじめに はじめまして、SALT2でAIエンジニアをしている岩倉(@KazukiIwakura)です。 自分が日常的に使っているerror-diagnosis Skill(エラーメッセージを入力すると、原因・解決手順・再発防止策を診断するSkill)の出力を眺めていたと...
読んで良かったら、シェアしてみてください。
同じタグの記事が他に 193 件あります。
関連する記事
同じタグの記事

「Control request timeout: initialize」の正体は SIGKILL だった話
ZennProduction 環境で Claude Code CLI を subprocess 実行する Celery task が intermittently 失敗し、「Control request timeout: initialize」というエラーが出ていた問題。原因は OOM Killer による SIGKILL で、メモリ不足が引き金だった。本記事はデバッグプロセスと解決策を解説。

複数の LLM (Claude Code / Cursor / Codex / Gemini) 間でコンテキストを引き継ぐ方法
Zenn異なる LLM 間でプロジェクトコンテキストを統一管理する手法。DB migration から複雑なビジネスロジック実装まで、各 LLM の得意分野を活かしながら、方針・制約情報を一貫して参照できる運用パターンを解説。

Go で Claude CLI を自作した — Claude Code が 18 Issue を自律実装した記録
Zenn開発者が Claude API を呼び出すターミナル CLI ツールを Go で構築。Claude Code を活用して 18 個の Issue を自動実装させた実装記録。シングルバイナリで動作し、パイプやファイルと組み合わせた作業効率化を実現。

Claude Code で仮想会社を運営してわかった、人間がやるべきこと
ZennClaude Code を用いて 10 の部署にエージェントを配置し OSS 開発を自律運営する実験が GitHub・Hacker News・Reddit で BANされた。この実経験から、AI に任せて効果的だった業務と失敗した領域を分析し、人間が担うべき判断領域を考察する。