← 기사 목록
日本語https://zenn.dev/topics/llm/feed

なぜ、AnthropicのMythosはコケおどしであると断言できるのか?

추출된 키워드

40
Mythos·5Claude Mythos Preview·5コケおどし·5Anthropic·5計算資源·4脆弱性探索·4松竹梅戦略·4資本集約型AI·4高コスト推論·4Project Glasswing·4パラダイムシフト·4アンカリング·3安全保障風マーケティング·3UK AISI·3CyberGym·3Linuxカーネル·3リーナス・トーバルズ·3Linuxコミュニティ·3クラウド資本主義·3Trainium2·3Project Rainier·3AWS·3Amazon·3データセンター·3DeepSeek-R1·3Sonnet·3Opus·3Opus 4.7·3OpenBSD·2ゼロデイ脆弱性·2Apache Software Foundation·2GPU·2OpenSSF·2Logan Graham·2探索深度·2閾値型タスク·2Fluidstack·2MITライセンス·2OpenAI o1·2NBC·1

원문

10,561
なぜ、AnthropicのMythosはコケおどしであると断言できるのか?

なぜ、AnthropicのMythosはコケおどしであると断言できるのか?

はじめに

本稿の題は「なぜ、AnthropicのMythosはコケおどしであると断言できるのか?」です。ここで言うコケおどしとは、能力が無いという意味ではなく、実体ある能力を本来の性質と異なるカテゴリの達成として演出する売り方を指します。一定以上の能力があることは前提であり、問われるのはそれをパラダイムシフトとして語る妥当性です。なお本稿でいうパラダイムシフトには、内部アーキテクチャの革新と応用論的な不連続の両方を含めます。アーキテクチャは既存系列でも、量的拡張からは出てこない質的な不連続が成立していれば、それはパラダイムシフトと呼べる対象です。

Claude Mythos Previewは、Project Glasswing(重要ソフトウェアを防御するための限定提供プログラム)と一体で発表されました。Anthropicは一般公開せず、重要インフラや大手企業の防御用途に限定すると説明しています。Project Glasswing参加者には1億ドル分の利用クレジットを提供し、その後は100万入力トークン25ドル、100万出力トークン125ドルで利用可能にするとされています。これはOpus 4.7の100万入力トークン5ドル、100万出力トークン25ドルと比べて、ちょうど5倍の単価です。

この時点でMythosの性格はかなり見えてきます。同じ性能をより安く実現する新原理の商品という顔ではなく、高コスト推論を前提にした上位商品の顔をしています。AIが高い理由は、電力、メモリ、GPU、クラウドサーバー、長時間推論、ツール実行、検証ループが重いためです。新原理があるなら、本来はそのどれかを大きく下げるか、コスト構造そのものを別の形に組み替えるはずです。

本稿の評価軸は二つです。第一に、価格と提供形態が新原理による不連続を反映しているか。第二に、応用面で示されている質的な飛躍が、アーキテクチャの新規性によるのか、それとも既存延長線上での計算資源大量投入によるのか。結論を先取りすれば、いずれの軸でもMythosは後者の特徴を強く示しており、革命商品としてではなく、Anthropicの松竹梅戦略における「松」として理解するのが最も妥当です。

Mythosの売り文句は能力の説明ではなく演出である

Anthropicは、Mythos Previewが主要なオペレーティングシステムや主要ブラウザに存在する脆弱性を見つけられると説明しています。Anthropicの技術ブログでは、主要OSや主要ブラウザのゼロデイ脆弱性、さらにOpenBSDに存在した27年前のバグへの言及があります。Project Glasswingでは、大手テック企業、セキュリティ企業、重要ソフトウェアを持つ組織に限定して、Mythosを防御用途で使わせるとされています。

一見すると、これは非常に強い主張です。実際、能力が低いモデルではこのような発表はできません。問題は、その能力が革命的能力として記述されるべきか、それとも「既存のAI脆弱性探索を大量の計算資源で強化したもの」として記述されるべきかという点です。ここを取り違えると、Anthropicの宣伝文句をそのまま受け取ることになります。

Mythosの演出は非常に巧妙です。一般公開しない。重要インフラにだけ使わせる。金融機関や大手テック企業が関わる。世界のサイバー防衛を守るという物語をつける。さらに「危険なので限定提供」という説明を被せる。これらの組み合わせにより、Mythosは単なる高額モデルから危険なほど強いモデルへと意味を組み替えられます。サイバーセキュリティ領域は「一般公開できない」「悪用されると危険」「国家や金融機関が関心を持つ」という威信の演出を構築しやすい領域であり、技術発表と演出設計を慎重に分けて読む必要があります。

新原理があるなら、どこかでコスト曲線が壊れるはずである

Mythosが本当にパラダイムシフト商品なら、最初に観察されるべきはコスト曲線の異常です。現在のAIが高いのは、モデルが神秘的に賢いからというより、推論に大量の計算資源を使い、長い文脈を保持し、何度も試行し、ツールを呼び、出力トークンを大量に吐き、GPUや専用チップを長時間占有するためです。新しい推論原理があるなら、同じ成果をより少ないトークンで、より短い試行で、より小さいモデルで出せるはずです。

ここで一つ留保が必要です。技術史を見れば、トランジスタが真空管より初期は高価だったように、初期は割高でも定性的に新領域を切り開くタイプのイノベーションは存在します。しかしその場合でも、新原理は早い段階で「単位能力あたりのコスト」または「以前は不可能だった出力の単位コスト」のいずれかでブレイクスルーを見せます。Mythosの場合、Opus 4.7と同種のタスク(自然言語、コーディング、推論)で5倍の単価を示しており、これは新領域開拓型というより、上位グレード型の価格設定に近い形をしています。

DeepSeek-R1は同じ論点を別角度から照らします。DeepSeekはR1について、OpenAI o1相当の性能、MITライセンスでの公開、蒸留モデルの公開を掲げ、API価格も100万入力トークン0.14ドルまたは0.55ドル、100万出力トークン2.19ドルと明示しました。なおR1自体は資本集約型ラボの教師モデルからの蒸留と検証可能タスクのRLという、それ自体は資本集約R&Dの下流で生まれた成果であり、「資本集約型AIと破壊的イノベーション」を完全な対立軸として描くのは不正確です。それでもなお、R1がコスト面で見せた不連続をMythosは反対方向に示しており、価格設定そのものがMythosの位置付けを物語る強い状況証拠となっています。

Anthropicの動きはクラウド資源の囲い込みそのものである

Anthropicの最近の動きを見ると、同社の競争軸はかなり明確です。AnthropicはAmazonとの協業拡大で、最大5ギガワット規模の計算容量を確保し、10年間でAWS技術に1000億ドル超を投じると発表しています。Project Rainierでは100万基超のTrainium2チップをClaudeの訓練と提供に使っていると説明されています。さらにFluidstackと組んで米国内に500億ドル規模のAI計算インフラを構築し、テキサス州やニューヨーク州に専用データセンターを作るとしています。

研究室内で軽い新原理が見つかった会社であれば、これほど巨大な物理的インフラ確保を急ぐ動機は弱まります。観察されるのは逆で、計算資源、電力、データセンター、専用チップ供給を押さえる方向に資源が集中投入されています。もちろん計算資源を大量に持つこと自体は悪いことではなく、現代のAI企業にとって事業継続の条件です。論点はそこではなく、この投資パターンが「新原理による軽量化」ではなく「インフラ規模による持続的優位」を競争軸とする会社の動きと整合的だという点です。

ここから導けるのは、Mythosの中核が資本集約型AIであるという見立てです。クラウドサーバーを握り、電力を握り、専用チップを握り、大口顧客を握る。その上で、最上位モデルには「危険なので限定提供」という物語を被せる。観察される動きは資本集約型の持続的イノベーションのテンプレートと整合する一方、技術史で言う破壊的イノベーションのテンプレートとは噛み合いません。

Linuxコミュニティの現象はMythos神話への反証である

Mythosの売り文句の弱点は、AIによる脆弱性発見がすでにコモディティ化しつつある点です。2026年5月、リーナス・トーバルズはLinuxカーネルのセキュリティリストについて、AI報告の洪水によりほぼ管理不能になっていると述べました。複数の人が同じようなAIツールで同じようなバグを見つけ、重複報告を大量に送っているためです。

Linuxカーネルの公式文書も、この点を明確にしています。AI支援で見つけたバグは、同じ日に複数の研究者から同時に浮上することがあるため、公開済みのものとして扱うべきだとされています。AI生成レポートは長すぎる、Markdownが多い、影響評価が投機的、再現器が検証されていないといった問題を起こしやすいとも説明され、簡潔な報告、再現器、修正案、テスト済みの内容が求められています。

これは重要な反証です。Mythosだけが別次元の能力を持つなら、AIによる脆弱性発見はまだ一部の最上位モデルだけの特殊能力に留まっているはずです。現実には、LinuxコミュニティではすでにAI支援の脆弱性候補報告が過剰となり、リーナスが文句を言う段階に入っています。脆弱性候補を見つけること自体は、すでに希少能力の地位を失いつつあります。価値の重心は、候補発見から、再現、影響範囲評価、修正案、保守者負荷を増やさない報告形式へと移動しています。

サイバーセキュリティでは一・二割の性能差が大げさに見える

サイバーセキュリティ領域でのMythosの実力は、一定以上のものと評価できます。OpusやSonnetより一・二割ほど強い場合でも、成果は大きく見える可能性があります。脆弱性探索は平均点の世界というより、最後の一歩に届くかどうかの世界であるためです。

ここで正面から検討すべき反対証拠があります。CyberGymベンチマークでMythos PreviewはOpus 4.6の66.6%に対し83.1%を記録し、UK AISIは「他のAIが完了できなかった多段侵入を高頻度で完遂した」と報告しています。これらは量的な差として大きく、また質的な所見も含むため、単純な「一・二割の差」では吸収しきれない部分があります。それでも、絶対値で十数ポイントの差が閾値型タスクで発見数の不連続な伸びを生むことは、量的拡張の枠内で説明可能です。多段侵入の完遂率向上も、長い文脈、より多いツール呼び出し、より深い検証ループ、より長時間の探索といった探索深度の拡張で説明可能な範囲にあります。

したがって、AISIやCyberGymの所見は、新原理の証拠というより、上位グレードの計算予算が閾値型タスクでもたらす派手な見え方の証拠と読むのが整合的です。Logan GrahamがNBCに語った「脆弱性のチェイン構築」も、自律性と長距離性は確かに目立つ特徴ですが、それが量的拡張の延長で実現可能なのか、不可能なのかを切り分ける独立した検証はまだ十分ではありません。質的な飛躍として確定するには、計算予算と探索深度を統制した条件下での比較が必要です。

松竹梅戦略としてのMythos

Mythosの商業的な役割は、江戸時代からある松竹梅戦略で説明できます。松竹梅戦略では、最上位の松が必ずしも売れる必要はありません。売れにくい松を置くことで、竹が合理的な選択に見えるようになります。本来なら梅しか売れない状況でも、松があることで竹がよく売れるようになります。

Anthropicの商品階層に当てはめると、松がMythosです。危険なので限定提供、重要インフラ向け、価格はOpusの5倍。竹がOpusで、最上位に近いが一般利用できる現実解。梅がSonnetで、日常業務、コード支援、大量利用に向く主力モデルです。この構図では、Mythosの役割は大量販売というより、Opusを竹に見せることにあります。Sonnetで十分な顧客にもOpusへの上方移行を意識させ、Anthropic全体の価格階段を作る商品としての機能が一次的です。これは典型的なアンカリングであり、Mythosは技術商品であると同時に、価格認知を操作するための商品でもあります。

なお松竹梅説には反証条件を明示しておく必要があります。本説が誤りと判定されるのは、たとえば次のような観測が成立した場合です。第一に、Mythos相当の能力が、Opus 4.7と同等以下の単価で広く提供される事態が、主要競合からの価格破壊圧力が無い状態でAnthropic側から自発的に起こること。第二に、Mythos Previewの後継が「Opusライン」を完全に置き換える形で一般公開され、価格階段の三層構造が解消されること。これらが観察されれば本説は維持できません。逆に、Mythos相当が長期にわたって限定提供と高単価で維持され、Opusが「準最上位」として売られ続けるなら、本説の説明力は強化されます。

中国系モデルの動向は新原理仮説に否定的である

Mythosが本当に新原理によるパラダイムシフト商品なら、別の場所から類似原理による破壊的イノベーションが起きる可能性が高いです。特に中国系モデルやオープンモデル陣営は、高性能モデルを安く出す方向に強い圧力を持っています。DeepSeek-R1のように、既存の高価格推論モデルに対して安価でオープンな代替を出す動きはすでに起きています。

新原理があるなら、それは模倣されます。完全に同じでなくても、近い原理が再実装されます。蒸留されます。オープンモデルに落ちます。API価格が下がります。中小企業でも使える形になります。その結果、既存の高価格モデルは価格競争に巻き込まれます。これがソフトウェア的技術革新の普通の流れです。

ところがMythosの場合、観察されるのは逆の現象です。高い単価が維持され、提供が限定され、重要インフラ向けに閉じ、防御目的という名目で選別される。破壊的イノベーションが起きた後の市場であれば、最初に観察されるのは「同じようなことが安くできる」という価格破壊です。その兆候が見えないことは、「中国勢がまだ追いついていないほど革命的」という解釈より、「そもそも革命ではないから価格破壊の対象になっていない」という解釈の方が状況と整合的です。Mythosはクラウド資本主義の論理で十分説明でき、破壊的イノベーションの論理を持ち出す必要はありません。

危険性の物語は半分本当で半分商売である

Mythosが危険だという話を全否定する必要はありません。サイバーセキュリティにおいて、脆弱性探索能力が高いモデルを一般公開すれば、攻撃者にも使われる可能性があります。ロイターは、AnthropicがMythosで見つかった金融システムの脆弱性について金融安定理事会に説明する予定だと報じています。金融機関のレガシー技術に対する攻撃リスクが高まる懸念も示されています。

「危険なので限定提供」という説明には、一応の正当性があります。防御側だけが先に使い、重要ソフトウェアを修正し、社会的な被害を抑えるという理屈は完全な虚構ではありません。AnthropicがOpenSSFやApache Software Foundationへ寄付し、オープンソース保守者の対応を支援するとしている点も、防御目的の説明と整合しています。

ただし、実体ある危険性は販促としての強い機能と両立します。むしろこの領域では本当の危険性があるからこそ、マーケティングとして強く機能します。危険だから一般公開しない、危険だから高い、危険だから選ばれた組織だけが使える、危険だからOpusやSonnetにも安全性の文脈がつく。この物語は商業的に非常に都合の良い形をしており、Mythosの危険性は能力の証拠とはなり得ても、内部アーキテクチャの不連続な革新の証拠とはなりません。観察されるのは安全保障風マーケティングと資本集約型推論の組み合わせであり、この組み合わせとして読むのが最も説明力を持ちます。

コケおどしと断言できる理由

Mythosをコケおどしと呼べる根拠は、能力の有無ではなく、性質の演出にあります。実体ある能力を「新しい推論原理による不連続」と「計算資源大量投入による上位グレード」のどちらに分類するかという性質判定で、Mythosは後者の特徴を強く示しています。「すごい脆弱性を見つけたのだからコケおどしではない」という反論は、本稿の論点を能力評価に矮小化しており、論題を取り違えています。

第一に、Mythosは安くなっていません。新原理ならどこかでコスト曲線が壊れるはずですが、MythosはOpus 4.7に対して同種タスクで5倍の単価であり、上位グレード型の価格設定です。第二に、Anthropicの動きは計算資源の囲い込みです。最大5ギガワット級のAWS計算容量、1000億ドル超のAWSコミット、500億ドル規模のデータセンター投資は、軽い新原理ではなく巨大インフラを前提にした競争の姿です。

第三に、AIによる脆弱性発見はすでにMythos固有の秘伝ではなくなりつつあります。LinuxコミュニティではAI支援報告が大量に押し寄せ、重複と低品質報告が問題化しています。公式文書も、AIで見つかったバグは同時多発的に現れるため公開扱いすべきだと説明しています。第四に、商業構造が松竹梅そのものです。Mythosが高く、危険で、限定的で、重要インフラ向けであるほど、Opusは現実的な竹に見えます。Sonnetで十分な顧客にも、重要用途ではOpusへという心理が生まれます。この構造から見て、Mythosは技術商品であると同時に、価格階段の演出装置として機能しています。

まとめ

AnthropicのMythosは、相当な能力を持つモデルである可能性が高いです。脆弱性探索や長時間推論において、CyberGymやUK AISIの所見が示す通り強力です。論点はそこではなく、その実体ある能力がパラダイムシフト商品の証拠として扱えるかという性質判定にあります。高コスト推論、大量の計算資源、ツール利用、検証ループ、サイバー領域向け調整を組み合わせた上位グレードとしての説明で、観察されている事実の大部分は説明可能です。

新原理であれば、同じ性能をより安く、より軽く、より少ない計算資源で出せるか、初期は高くとも近い時期に単位能力あたりのコストでブレイクスルーを見せるはずです。MythosはOpusより高い単価で限定提供され、巨大クラウド基盤とセットで語られる商品設計を取っており、価格と提供形態の両方が新原理仮説と整合しません。観察される姿は、クラウドサーバー、電力、専用チップ、データセンターを握った企業による資本集約型AIの典型です。

LinuxコミュニティでAI支援の脆弱性報告が大量発生していることも、Mythos神話への重要な反証となります。脆弱性候補をAIで見つけること自体は、すでに特別な最上位モデルだけの能力ではなく、価値の重心は候補発見から下流工程へ移動しつつあります。Mythosは革命としての位置付けを取っているものの、商品構造は松竹梅戦略における松として理解する方が観察事実と整合的であり、能力のあるコケおどしという評価が成立します。