【悲報】Mac Studioさん、完全に敗北…「DGX Spark」が本気出した結果、性能差が15倍に広がってしまう
【悲報】Mac Studioさん、完全に敗北…「DGX Spark」が本気出した結果、性能差が15倍に広がってしまう
ローカルLLM界隈において、Appleの「Mac Studio (M3 Ultra)」は長らく「最強の個人用AIマシン」として君臨してきました。対するNVIDIAの「DGX Spark」は、シングルユーザーのベンチマークではMacの後塵を拝し、「価格の割に微妙では?」などと揶揄されることもありました。
しかし、ある検証動画がその評価を一夜にして覆しました。我々が見ていたのは「1人の客しかいないレストラン」での提供速度に過ぎなかったのです。条件を「実務」に近づけた瞬間、DGX Sparkは化け物へと変貌しました。

「同時接続」で覚醒する真の怪物
通常、Ollamaなどで「1対1」のチャットをする場合、Mac Studioは秒間99トークンを記録し、DGX Spark(67トークン)を圧倒します。しかし、AIエージェントを動かしたり、複数人で利用したりする「同時接続(Concurrency)」環境下では話が別でした。
推論エンジンを「vLLM」に切り替え、同時リクエストを増やしていくと、Mac Studioが失速する横でDGX Sparkの性能は爆発的に向上。同時接続数が64を超えたあたりで、秒間1125トークンという異次元の数値を叩き出したのです。さらに、Blackwellチップ特有の「FP4量子化」を使用すると、その数値は驚愕の1573トークンに到達。Mac Studioとの差は歴然たるものとなりました。
ネットの反応
シングルタスクのベンチマークばっかり見てたわ。実務だとここまで差がつくんか。
Mac Studio最強伝説が崩れ去った瞬間である。所詮はコンシューマー向けってことか。
1500トークン/秒とか意味わからん。人間が読む速度の何百倍だよ。
まあ個人でチャットするだけならMacで十分なんだけどな。悔しくなんてないんだからね。
vLLMとOllamaでここまで挙動が違うとは知らんかった。ソフトウェアの最適化も重要やな。
DGX Spark欲しくなってきたけど、値段見たらMac Studioが安く見えるレベルなんだろうな…
AIエージェントを複数走らせるならNVIDIA一択ってことか。Appleシリコンはメモリ帯域すごくても限界があるな。
レストランの例えが分かりやすい。客が一人ならワンオペでも早いけど、行列ができたら厨房の広さが物を言うって話だな。
BlackwellチップのFP4量子化がチートすぎる。精度落としても速度4倍とかなら実用性高そう。
YouTuberのベンチマークがいかに「分かりやすい部分」しか切り取ってないかがよく分かる動画だったわ。
個人開発レベルでもRAGとか組み始めると並列処理欲しくなるからなぁ。これは揺らぐ。
Mac信者、息してる?これが「業務機」と「民生機」の壁だよ。
電力効率とか静音性も比較してほしいところだけど、性能差がありすぎて議論にならんか。
結局、金が全てを解決するということでよろしいか?
ローカルLLMの世界も進化が早すぎて、3ヶ月前の常識が通用しなくなってるの怖い。
これからは「同時接続性能」もスペック表に載せてくれ。シングルスコア詐欺はもうたくさんだ。
自宅サーバーおじさんたちがアップを始めました。
Macは「手軽に高性能」が売りだから…。ガチ勢と同じ土俵に上げちゃいけない。
推論速度が速すぎてトークンが目で追えないレベル。脳直結インターフェースはよ。
次のM4 UltraでAppleがどう巻き返してくるか見ものだな。まあ無理だろうけど。
AIの所感
「ベンチマークは嘘をつかないが、ベンチマークの選び方は嘘をつく」という良い例ですね。個人が趣味でLLMと戯れる分にはMac Studioは依然として素晴らしい選択肢ですが、AIを「働かせる」フェーズに入った瞬間、求められるスペックが劇的に変わることが可視化されました。今後、AIエージェントが自律的に動き回る世界になれば、この「並列処理能力」こそがマシンの価値を決める決定的な指標になるでしょう。