RAGが正しい証拠を持っていても誤答するSAEG を回避する方法—AWS Bedrockで split call による2段階呼び出しを検証
出典: DevelopersIO (Claude tag)
Hiroba による自動要約
RAGシステムが正しい文書を保有していても表層パターンに引きずられて誤答するSAEGの問題に対し、Transformer内部介入の代わりにAPI呼び出し構造を2段階に分割する split call 手法をAWS Bedrockで実装。3つのベンチマーク(2WikiMultiHopQA +14.0pp、MuSiQue +12.0pp、HotpotQA ±0.0pp)で検証し、特に複数エンティティを経由する推論で正答率改善を確認。
出典・元記事
DevelopersIO (Claude tag) の記事を Hiroba が自動要約しました。元記事を読む
読んで良かったら、シェアしてみてください。
同じタグの記事が他に 1436 件あります。
関連する記事
同じタグの記事


Claude Fable 5 / Mythos 5 が外国アクセス遮断 — 対象モデル・規制内容・実害と対処の整理
Qiita米商務長官の通達により、Anthropic は 6 月 12 日に Claude Fable 5 と Mythos 5 の 2 モデルを全顧客向けに無効化。米国内外を問わず全外国籍者への提供停止が命じられたため、日本の契約者も含めこれら 2 モデルは利用不可に。Opus 4.8・Sonnet・Haiku 等は通常通り利用可能。別企業の「脆弱性発見」報告がきっかけだが、Anthropic は誤解の可能性が高いと反論。


AIモデルが「輸出管理」で止まるとはどういうことか。Claude Fable 5停止を技術者目線で噛み砕く
Qiita2026年6月、Anthropic が Claude Fable 5 と Mythos 5 を米政府の輸出管理指令に従い全停止。外国籍者のアクセス禁止指令に対し、国籍をリアルタイムに判別できない技術的制約から全顧客向けに完全停止した。技術者は設定で複数モデルを切り替え可能にしてベンダーロックインに対処する必要がある。