AnthropicのFable・Mythosモデル輸出規制に76名のサイバーセキュリティ専門家が公開書簡で抗議

記事のサマリー（TL;DR）

米政府が国家安全保障を理由にAnthropicのFable・Mythosモデルを輸出規制、世界中でアクセス停止
Alex Stamosら76名のサイバーセキュリティ専門家が公開書簡で「防御側から最良の能力を奪う危険な措置」と撤回要求
規制の根拠とされたAmazonの未公開論文について、Katie Moussourisが「本物のジェイルブレイクではない」と反論

日本のセキュリティ実務者・AI活用企業が注視すべき論点

今回の規制はAnthropicが世界中のユーザーへのアクセスを一時停止する形で実施されたため、日本国内でFableやMythosを利用していた組織も影響を受けました。日本では、コード脆弱性の検出やセキュリティテスト自動化を目的にClaudeファミリーを活用しているSaaS事業者・金融機関・EC事業者が増えています。輸出規制という手段が「公開されたモデルに突然適用される」前例が生まれたことで、特定のAIモデルに業務フローを依存するリスクが改めて浮き彫りになりました。

一方、公開書簡が「GPT-5.5、Claude Opus 4.8・Sonnet、Kimi 2.7でも同等の技術が再現可能」と指摘している点は重要です。つまりFableだけを規制しても攻撃者の手段を実質的に制限できず、防御側だけが損をするという非対称性が生じます。日本国内でも類似の規制論議が起きた場合に備え、セキュリティ業務でのAI利用ポリシーを複数モデルへの冗長化も含めて整備しておくことが現実的な対応です。

詳細

米政府がAnthropicのFable・Mythosモデルに輸出規制を発動

2025年6月某金曜日、米政府はAnthropicに対し、同社の最上位モデルであるFableおよびMythosの輸出を制限するよう命令を発しました。Anthropicによれば、政府は具体的な理由を説明することなく、国家安全保障上の懸念を理由として挙げるにとどまりました。これを受けてAnthropicは、両モデルへのアクセスを世界中のユーザーに対して一時停止しました。

76名の専門家が公開書簡を提出

この措置を受け、サイバーセキュリティ業界の著名人を含む76名の専門家が連名で公開書簡を米政府に提出しました。署名者には以下が含まれます。

Alex Stamos（元Facebook最高セキュリティ責任者）
Casey Ellis（バグバウンティプラットフォームBugcrowd創設者）
Jon Callas（著名な暗号学者、元AppleセキュリティデザインおよびアーキテクチャマネージャーManager）
Paul Vixie（コンピュータサイエンティスト）
Dino Dai Zovi（元Block応用セキュリティエンジニアリング部門長）
Katie Moussouris（Luta Security創設者）
Rachel Tobac（セキュリティ啓発トレーニング企業SocialProof Security CEO）

書簡は「正当な理由もなく防御側から最良の能力を奪うことは、敵対勢力が急速に能力を高めている中で危険だ」と明記しています。

Fable・Mythosとはどのようなモデルか

Mythosは2025年4月にプレビュー公開されたモデルで、Anthropic自身が「セキュリティ脆弱性の発見において非常に強力であり、悪意あるハッカーや外国の敵対勢力による悪用を防ぐためアクセスを厳しく制限する必要がある」と述べていました。実際、当初は約50社のみにアクセスが許可され、その後15カ国・約150組織に拡大されていました。

Fableは直近に公開されたMythosのパブリック版で、生物学・化学・サイバーセキュリティ分野への利用や、モデルの蒸留（再現）を防ぐための厳格なガードレールが設けられていました。ただしこのガードレールはあまりにも厳格で、多くのセキュリティ専門家がサイバーセキュリティに関するほぼあらゆるプロンプトをブロックされると指摘していました。

規制の根拠となったAmazonの未公開論文

Anthropicの説明によれば、今回のホワイトハウスの輸出規制命令は、Fableをジェイルブレイクしてより強力なMythosレベルの能力を引き出す手法が発見されたとする報告に基づいている可能性があります。

この手法はAmazonの研究者による未公開論文で示されたとされており、公開書簡の署名者の一人であるKatie Moussourisが当該論文を閲覧したと述べています。しかしMoussourisは自身のブログ記事で、「論文は実際のジェイルブレイクを実証していない」と反論しました。

Moussourisによれば、論文で行われたのは「モデルが最初にコードのセキュリティレビューを拒否した後、既知の公開済み脆弱性と『意図的に埋め込まれた脆弱性』を含むオープンソースコードを修正するよう依頼しただけ」でした。

「この論文が示した行動は意味のある形で修正できるものではなく、修正しようとすれば防御用途でのモデルの能力を弱めるだけだ。防御側は、AIにファイルのバグを修正させ、その修正がなぜ重要なのかを説明させ、パッチが機能することを確認するテストを書かせる必要がある。これはガードレールのバイパスではない。防御的セキュリティのためにAIモデルができる最も価値あること、つまり防御側が毎日実行している『発見・修正・テスト』のループを実行することだ」— Katie Moussouris

他のモデルでも同等技術が再現可能という指摘

公開書簡は、Amazonの論文で示されたモデルの能力がOpenAIのGPT-5.5、Anthropicが公開中のClaude Opus 4.8・Sonnet、さらにはKimi 2.7などの中国モデルでも再現可能だと指摘しています。

MoussourisはTechCrunchの取材に対し、「論文の技術を実証するために使われたバグは他のモデルを使っても発見できる。Fableのガードレールを持たないモデルは、セキュリティバグを探すという直接的なリクエストをそもそも拒否しないため、バイパス手法を必要としない」と述べました。

専門家が求める透明性と民主的なプロセス

公開書簡はさらに、産業界や学術専門家による科学的研究に基づき、「民主的なルール策定プロセス」を通じて作られた透明かつ公平に執行される規制を求めました。規制は「米国民の安全を確保するために必要な最小限の範囲」にとどめるべきとしています。

TechCrunchはAmazonの論文が規制命令の発端となったかどうかについて追加情報を求めています。