Claude Mythosとは?Anthropicが発表した最新AIモデル
2026年4月7日、AIスタートアップのAnthropicが「Claude Mythos」(クロード・ミュトス)のプレビュー版を発表した。
ChatGPTを開発するOpenAIのライバルとして知られるAnthropicが送り出したこのモデルは、コーディング・推論・サイバーセキュリティの全分野でこれまでの最高モデルを大幅に上回るベンチマーク結果を示している。
しかし驚くべきことに、Anthropicはこのモデルを一般公開しない方針を取っている。
Anthropicはその理由として「サイバー悪用リスク」を挙げており、世界規模でのサイバー攻撃に悪用される可能性を深刻に捉えているためだ。
発表の経緯──内部文書流出から公式発表へ
実はClaude Mythosの存在は、公式発表より約2週間前にすでに世間に知られていた。
2026年3月下旬、Anthropicの社内コンテンツ管理システムの設定ミス(ヒューマンエラー)により、未公開のブログ記事草稿が誰でも検索・閲覧できる状態になってしまったのだ。
流出した文書には、このモデルの社内コードネーム「Capybara(カピバラ)」と、「これまでで最も強力なモデルであり、コーディング・推論・サイバーセキュリティのテストスコアが従来モデルを劇的に上回る」という記述が含まれていた。
Fortuneの報道でこの流出が発覚すると、Anthropicは即座に該当データを非公開化。
その後、正式発表として今回のプレビュー公開に至った。
「汎用モデル」なのにサイバーセキュリティ能力が際立つ理由
特筆すべきは、Claude Mythosはサイバーセキュリティのためだけに作られたモデルではないという点だ。
Anthropicによると、Mythosは文章生成から数学・コーディングまでこなす汎用(はんよう)AIモデルであり、そのサイバーセキュリティ能力の高さはコーディング力と推論力が極めて高くなった「結果として」生まれたものだという。
つまり「賢くなればなるほど、セキュリティの穴を見つける能力も上がってしまう」というAI開発のジレンマを、このモデルが体現している形だ。
何がスゴいのか?ベンチマークで見るMythosの実力
数字で見るとMythosの実力がよく分かる。
比較対象は、AnthropicがMythos発表直前まで最高モデルとしていた「Claude Opus 4.6」だ。
コーディング能力:SWE-benchで77.8%を達成
SWE-bench(エスダブリューイー・ベンチ)とは、AIが実際のソフトウェアのバグを自動で修正できるかを測るコーディングの総合試験だ。
Claude MythosはSWE-bench Proで77.8%を記録。
これに対しClaude Opus 4.6は53.4%であり、実に24ポイント以上もの差がついている。
より標準的なSWE-bench Verifiedでも93.9%(Opus 4.6は80.8%)と大きく差をつけた。
推論能力:PhD級問題でも94.6%
GPQA Diamond(ジーピーキューエー・ダイヤモンド)は、博士号取得者レベルの科学・数学・論理問題への正答率を測るベンチマークだ。
Claude Mythosはここで94.6%を達成(Opus 4.6は91.3%)。
また、「Humanity’s Last Exam」(ツール使用条件)でも64.7%(Opus 4.6は53.1%)を記録した。
さらにサイバーセキュリティ特化のベンチマーク「CyberGym」では83.1%(Opus 4.6は66.6%)と、いずれの指標でも従来モデルを上回っている。
16年前のバグを数時間で発見した衝撃の実力
ベンチマーク以上に衝撃的なのが、実際のソフトウェアで見せた発見力だ。
Claude Mythosは、動画の変換に広く使われるオープンソースソフト「FFmpeg(エフエフエムペグ)」に潜む16年前の脆弱性(ぜいじゃくせい)を発見した。
この脆弱性が含まれるコード行は、既存の自動テストツールによって500万回以上テストされていたにもかかわらず、一度も検出されなかったものだ。
さらにセキュリティに定評のあるOS「OpenBSD(オープンビーエスディー)」では、TCPの処理に関する27年前のバグも見つけ出した。
どちらもMythosの報告を受けて、現在はパッチが当てられ修正済みとなっている。
なぜ一般公開しないのか?Anthropicが懸念するサイバー悪用リスク
これほど優れたモデルなら、すぐにClaude.aiやAPIで使えるようにすればいいのでは?
しかしAnthropicはその選択をしなかった。
理由は明快で、「守りに使えるものは攻撃にも使える」からだ。
ゼロデイ脆弱性を「数千件」発見できる両刃の剣
ゼロデイ脆弱性(ゼロデイぜいじゃくせい)とは、まだ誰にも発見されておらず、パッチも当たっていない危険なセキュリティホールのことだ。
Claude Mythosはテスト運用の数週間で、主要なすべてのOS・すべての主要ブラウザを含む広範なソフトウェアから「数千件」のゼロデイ脆弱性を発見したという。
これが守りに使われる分には世界のセキュリティを大幅に強化できる。
しかし悪意ある者の手に渡れば、同じ能力で「まだ誰も気づいていない穴」を探し当て、大規模なサイバー攻撃の兵器として使われてしまう。
Anthropicはこのリスクを深刻に受け止め、米国政府の要人にも非公式に警告を送ったと報じられている。
攻撃コストが劇的に下がる「2万ドル問題」
具体的なリスクを想像してみよう。
今まで高度なハッカーが数ヶ月かけて探し出していたような脆弱性を、Claude Mythosなら数時間〜数日で大量発見できる可能性がある。
しかも費用は驚くほど安い。
Anthropicの発表によれば、独自のスキャフォールド(作業枠組み)を使ったテスト1,000回分のコストは合計2万ドル(約300万円)以下だったという。
このコストで重大な脆弱性が大量に見つかるとすれば、攻撃側のコストパフォーマンスが劇的に上がる。
世界の金融・インフラ・医療システムへの攻撃リスクが現実のものとなりかねないため、Anthropicは一般公開を見送る決断をした。
Project Glasswingとは?Apple・Microsoft・Googleが参加する取り組み
では、Claude Mythosはどこで使われているのか。
その答えが「Project Glasswing(プロジェクト・グラスウィング)」だ。
グラスウィングとは半透明の羽を持つ蝶の名前で、「見えない脅威を可視化する」という意味が込められているとされる。
このプロジェクトは、Claude MythosをサイバーセキュリティのAI防衛ツールとして活用するために設立された、企業連合による取り組みだ。
創設パートナーの顔ぶれと役割
Project Glasswingの創設パートナーには、Amazon Web Services・Apple・Broadcom・Cisco・CrowdStrike・Google・JPMorganチェース・Linux Foundation・Microsoft・NVIDIA・Palo Alto Networksが名を連ねている。
まさに世界のテクノロジーとサイバーセキュリティを牽引する企業が一堂に会した形だ。
これらのパートナー企業に加え、約40の組織が重要インフラの防衛目的でMythosへのアクセスを許可されている。
各社はMythosを使ってローカルの脆弱性検出・バイナリのブラックボックステスト・エンドポイント防護・ペネトレーションテスト(侵入テスト)などの防衛的セキュリティ作業を行う。
オープンソースのセキュリティにも貢献する「守りのAI」
Project Glasswingは商業企業の防衛だけにとどまらない。
Anthropicはこのプロジェクトを通じて最大1億ドル(約150億円)分の利用クレジットを拠出するとともに、Linux Foundation傘下のAlpha-OmegaとOpenSSF(オープンソースセキュリティ財団)に250万ドル、Apache Software Foundationに150万ドルを寄付することを発表した。
これにより、世界中のオープンソースソフトウェアのメンテナー(管理者)がMythosの力を借りて脆弱性を修正できる体制が整う。
FFmpegやOpenBSDのような誰もが使うソフトウェアのセキュリティを、AI技術で根本から底上げしようという取り組みだ。
一般ユーザーはいつ使えるようになる?今後の見通し
多くの人が気になるのは「自分はいつ使えるの?」という点だろう。
現時点では、一般ユーザーがClaude Mythosにアクセスする手段はない。
Anthropicは「一般公開の予定はない」と明言している。
Anthropicの「段階的に安全に展開する」方針とは
ただし、Anthropicは「Mythosクラスのモデルを最終的に大規模展開する方法を学ぶ」ことも今回のProject Glasswingの目的の一つとして位置づけている。
つまり現在のプレビュー公開は、将来的な安全な展開への「実証実験」でもあるわけだ。
Anthropicの方針は「リスクを理解した上で段階的にアクセスを広げる」というもの。
Project Glasswingを通じて企業や研究機関でのMythos活用実績を積み重ね、安全なガードレール(利用ルール・制限)が整備された段階で、より広いユーザーへの展開を検討するとみられる。
業界の見方では、もし展開が進んだとしてもClaude Mythosの一般公開は早くとも2026年後半以降になると予測されている。
まとめ:Claude MythosはAI時代の新たなパワーバランスを象徴する
Claude Mythosの登場は、AIが「便利なアシスタント」の領域を超え、「世界のインフラを守る盾にも、崩す矛にもなりうる」フェーズに入ったことを示している。
SWE-bench Pro 77.8%・GPQA Diamond 94.6%・数千件のゼロデイ脆弱性発見という実績は、AIのコーディング・推論能力が人間の最高水準に迫りつつある証拠だ。
それゆえAnthropicは「攻撃より防御が先」という姿勢を取り、世界の名だたるテクノロジー企業と組んでProject Glasswingを立ち上げた。
最強の能力を持ちながらあえて公開せず、世界のインフラを守るために協調するという選択は、AI開発者が社会的責任をどう果たすかという新たな問いを私たちに突きつけている。
一般ユーザーが直接使える日が来るかどうかはまだ見えないが、その影響はすでに世界中の重要システムの「安全」という形で、私たちの生活に届いている。
引用元:
・Anthropic公式(red.anthropic.com)- Claude Mythos Preview
・Anthropic公式 – Project Glasswing
・TechCrunch – Anthropic debuts preview of powerful new AI model Mythos in new cybersecurity initiative
・Fortune – Anthropic is giving some firms early access to Claude Mythos to bolster cybersecurity defenses
・9to5Mac – Anthropic unveils powerful Mythos AI model, working with Apple in cybersecurity initiative
・CNBC – Anthropic limits Mythos AI rollout over fears hackers could use model for cyberattacks
・Linux Foundation – Introducing Project Glasswing: Giving Maintainers Advanced AI to Secure the World’s Code


コメント