サイトアイコン 酒呑ガジェット

【悲報】Mac Studioを4台繋げたら1兆パラメータのAIが爆速で動いてしまった件www

Mac Studioを4台連結!1兆パラメータの巨大AIを自宅で動かす禁断の手法

パーソナルコンピューティングの限界を超えようとする試みが、いま静かに、しかし確実に進行しています。最新の巨大言語モデル(LLM)である「Kim K 2.5」が登場しましたが、このモデルのサイズは驚愕の658GB。一般的なハイエンドPCであっても、単体でロードすることすら困難なこの怪物を、Apple Siliconを搭載したMac Studioを複数台連結することで動作させるという、まるでSFのような試みが話題となっています。

今回注目された構成は、1台あたり512GBのユニファイドメモリを搭載したMac Studioを4台、総額にして約5万ドル(約750万円)という超弩級のシステムです。これらをサンダーボルト経由のRDMA(Remote Direct Memory Access)で接続し、一つの巨大なリソースとして活用することで、1兆パラメータという途方もない規模のAIを、実用的な速度で動作させることに成功しました。

Apple SiliconとMLXが切り拓く「分散処理」の新境地

これまで、複数のコンピュータを繋いで一つのAIを動かすには、複雑なネットワーク設定や高価なインフィニバンドなどの設備が必要とされてきました。しかし、Appleが提供する機械学習フレームワーク「MLX」の分散処理サポートにより、サンダーボルトケーブルでMac同士を繋ぐだけで、GPU同士が直接通信できる環境が整いました。これにより、ネットワークのオーバーヘッドをスキップし、Apple Siliconの特徴である高速なユニファイドメモリを最大限に活かすことが可能になります。

実際にKim K 2.5(4bit量子化版)を動かしたベンチマークでは、2台のMac Studio構成で秒間約23トークン、4台構成では秒間約29トークンという結果を叩き出しました。1兆パラメータという規模を考えれば、これは驚異的なスピードです。開発者によれば、このシステムはスケーラビリティに優れており、マシンを増やせば増やすほど、処理能力が着実に向上していくことが確認されています。

開発者にとっての現実的な選択肢としてのMacクラスター

もちろん、5万ドルの投資は誰にでもできるものではありません。しかし、この手法の真の価値は、必ずしも最高峰のモデルを動かすことだけではありません。例えば、375GB程度のモデルであれば、1台のMac Studioでも動作可能です。また、より軽量で高性能なQwen 34Bのようなモデルを走らせれば、秒間170トークンを超える超高速なレスポンスを得ることもできます。

さらに、このシステムの特筆すべき点は消費電力の低さです。4台のMac Studioをフル稼働させても、消費電力は300ワット程度に収まります。これは同等の性能を持つNVIDIAのハイエンドGPUを複数積んだワークステーションと比較しても、極めて効率的です。静音性にも優れており、自宅のデスク上で「スーパーコンピュータ」を運用することが現実味を帯びてきたと言えるでしょう。

ネットの反応

5年後にはどの家庭にもこういうAIボックスが置いてある時代が来るんだろうな。今はこの動画がその先駆けに見えるわ。

M5 Ultraでメモリ1TB搭載モデルが出たら、マジで世界が変わる予感がする。Apple Siliconの進化が早すぎて震える。

「たったの512GBかよ!」ってセリフ、一般人からしたら狂気の沙汰だけど、この界隈だと本気でそう思えてくるのが怖いw

これこそがMac Proが目指すべき未来の姿じゃないか? 拡張性じゃなくて連結性で勝負するっていう。

サーバー用の高価なDDR5メモリを2TB分も買い揃えるコストを考えたら、Mac Studioを並べる方が安上がりで高性能っていう逆転現象が起きてるな。

自宅で1兆パラメータが動くとか、一昔前なら国家レベルの設備が必要だったはず。個人の力がここまで強くなるとは。

Qwenとかの軽量モデルを分散させて爆速で動かす方が、実務的にはめちゃくちゃ使い勝手良さそう。

サンダーボルトで繋ぐだけでRDMAが効くとか、Appleのエコシステムは本当に開発者にとって天国だな。

電気代が300Wで済むのはデカい。一般家庭のコンセントで最強AIが飼えるってことだろ?

この動画を見てると、自分のデスクがただのゴミ溜めに見えてくる。俺もクラスター組みたいわ……。

AIの所感

今回のMac Studioクラスターによる1兆パラメータAIの動作成功は、ハードウェアの所有の在り方に一石を投じるものです。高価なクラウドサービスに依存せず、ローカル環境で機密性の高いデータを巨大なAIで処理できるメリットは計り知れません。特に、Apple Siliconの電力効率とユニファイドメモリの特性を最大限に引き出すMLXの進化は、今後個人の開発者が手にできる「知能」の規模を飛躍的に拡大させるでしょう。まさに、机の上が宇宙に繋がるような、そんなワクワクする未来がすぐそこまで来ていると感じさせられました。

モバイルバージョンを終了