【悲報】「危険すぎて非公開」の最強AI、ついに実戦投入されるも結果がショボすぎて開発者にボコボコにされるwww

【悲報】「危険すぎて非公開」の最強AI、ついに実戦投入されるも結果がショボすぎて開発者にボコボコにされるwww

AI業界でいま、一つの「神話」が崩壊しようとしています。ChatGPTのライバルとして知られるAnthropic社が、「危険すぎて一般公開できない」とまで豪語していた最強AIモデル『Mythos(ミュトス)』。この鳴り物入りで登場したAIが、世界中で使われている超重要プログラム「curl」の脆弱性診断に挑んだのですが、その結果が「期待外れ」どころの話ではありませんでした。

膨大なコードの海をスキャンするも、小さな赤い点一つしか見つけられないハイテクな顕微鏡のイメージ

17万8000行のスキャンで、見つかったのは「深刻度・低」のバグ1件のみ

curlの開発者であり、オープンソース界の重鎮であるダニエル・ステンバーグ氏は、Anthropicから届いた「5件の脆弱性を発見した」という報告書を精査。しかし、蓋を開けてみれば、そのうち4件は「仕様書に既に書かれている挙動」や「ただのバグ」であり、セキュリティ上の脅威ではないことが判明しました。

最終的に残った「本物の脆弱性」は、わずか1件。それも「深刻度・低」と判定される、極めて軽微なものでした。世界を変えると言われた最強AIが、17万8000行にも及ぶ磨き抜かれたコードに挑んで残した成果が、たった一箇所の修正という事実に、開発者側からは失笑が漏れています。

「派手なマーケティングの正体」開発者が断じるAIの現在地

ステンバーグ氏は自身のブログで、「Anthropicが起こした熱狂は、主にマーケティングだった」と一刀両断。既存のAIツールが既にやってきたことと比べて、Mythosが特別に高度なものを見つけたという証拠は何一つなかったと結論づけています。

「AIは基地の種類のエラーを見つけるのは得意だが、全く新種の脆弱性を発見したのを見たことがない」とも指摘。AIは確かに効率を上げ、人間の「目」を増やしてくれますが、誰一人として見たことがない未知の脅威を魔法のように発見する装置ではないという、冷徹な現実を突きつけました。

ネットの反応

「危険すぎて非公開」って、ただの宣伝文句だったんかw 恥ずかしすぎるだろ

curlのコードが綺麗すぎてAIが太刀打ちできなかった説。ダニエルさん強すぎ

17万行見てバグ1個って、AIが仕事してないんじゃなくてcurlが完璧すぎるだけな気がする

仕様書に書いてある挙動を脆弱性って報告しちゃうあたり、AIの限界を感じるわ

派手な名前つけてハードル上げまくった結果がこれ。AI企業の煽りもいい加減にしてほしい

まぁでも、17万行を瞬時に見て1個でも見つけたなら、チェッカーとしては優秀なんじゃね?

AIの所感

AI企業による「危険すぎる」というアピールは、一種のブランド戦略として機能してきましたが、今回のcurlの一件は、そのナラティブが現場のエンジニアリングという厚い壁に跳ね返された格好です。AIは確かに過去のパターンを高速に網羅する能力には長けていますが、ダニエル・ステンバーグ氏のように30年かけて一列ずつコードを磨き上げてきた職人の域には、まだ遠く及びません。今回の「神話の崩壊」は、AIへの過剰な期待をリセットし、人間とAIの真の役割分担を再考させる良い機会になるのではないでしょうか。

-パソコン