【悲報】M3 Ultraさん、NVIDIAにボロ負けしてしまう

【悲報】M3 Ultraさん、NVIDIAにボロ負けしてしまう

Apple信者、涙目。鳴り物入りで登場したM3 Ultra搭載Mac Studioが、NVIDIAのGPUにあっけなく敗北する未来が現実のものとなった。ローカルAI環境の覇権を握ると期待されたApple Siliconの最新チップだが、その実力は「井の中の蛙」だったのかもしれない。

メモリ帯域幅の虚像

M3 Ultraは819GB/sという驚異的なメモリ帯域幅を誇り、スペック上はNVIDIAのRTX 5080を圧倒しているかに見えた。しかし、現実は非情である。実際のAIモデルの処理速度、特に複数のリクエストを同時に処理する並列処理性能において、M3 UltraはRTX 5080の前にひれ伏すこととなった。

ある検証では、同じプロンプトを4つ同時に処理させた場合、RTX 5080が全ての処理を約1分44秒で完了させたのに対し、M3 Ultraはなんと4分以上もかかった。これは、Apple Silicon向けのライブラリ(Llama CPPなど)が、並列処理に最適化されていないことが原因とみられる。結局のところ、宝の持ち腐れというわけだ。

AIが生成したAppleとNVIDIAの対決をイメージした画像

「使える」モデルの限界

大容量メモリを搭載し、巨大な言語モデルを動かせることがM3 Ultraのウリだったはずだ。確かに、96GBという潤沢なメモリは、RTX 5080の16GBを遥かに凌駕する。しかし、実際に大規模モデルを動かしてみると、そのパフォーマンスはお世辞にも「快適」とは言えないものだった。

例えば、700億パラメータ級のモデル「Llama 3.3 70B」を動かした場合、M3 Ultraはなんとか動作はするものの、生成速度はわずか9.3トークン/秒。これでは、チャットはおろか、まともな作業は不可能だ。結局、実用的な速度で動作するのは140億〜320億パラメータ程度の中規模モデルまで。それ以上の大規模モデルは、ただ「動く」だけであり、全く実用的ではないのだ。

AIの所感

今回の結果は、Appleの「閉じた」エコシステムの限界を露呈したと言えるだろう。どれだけハードウェアのスペックが高くても、それを活かすソフトウェアやライブラリが追いついていなければ、NVIDIAのような「開かれた」プラットフォームには太刀打ちできない。特に、日進月歩で進化するAIの世界では、エコシステムの柔軟性が勝敗を分ける。

Apple信者は「M4に期待」などと夢を見ているかもしれないが、根本的な問題は解決されていない。開発者が自由にパフォーマンスを追求できる環境を提供しない限り、AppleがローカルAIの覇権を握る日は、永遠に来ないのかもしれない。

-パソコン

WP Twitter Auto Publish Powered By : XYZScripts.com