NVIDIAの「制約」をぶっ壊す!個人でVRAM 1TBを実現した狂気のプロジェクト
AIの進化が止まらない昨今、その心臓部とも言えるGPUのVRAM不足は、多くのエンジニアやガジェット好きにとって共通の悩みです。しかし、そんな常識を力技で踏み越えた猛者が現れました。人気Tech系YouTuberのAlex Ziskind氏が、NVIDIAが「公式には2台までしか連結できない」としていたDGX Sparkをなんと8台も連結。前人未到の「VRAM 1TBクラスター」を自作してしまったのです。
DGX Sparkは1台あたり128GBのメモリを搭載しており、これだけでも十分モンスター級のスペックですが、8台をネットワークで繋ぐことで、合計メモリ容量は驚異の1024GB(1TB)に到達。NVIDIAがドキュメント化を拒んだ「3台以上の連結」という禁断の領域に、コミュニティの知恵と最新のネットワーク機器を駆使して挑む姿は、まさに現代の錬金術師そのものです。
1300ドルのスイッチと格闘!400Gbpsの爆速ネットワーク構築
このプロジェクトの最大の壁は、マシン同士の通信速度でした。通常のEthernetでは、マシンを増やせば増やすほど通信のオーバーヘッドが大きくなり、処理速度が低下してしまいます。そこでAlex氏は、RDMA(Remote Direct Memory Access)をサポートするNVIDIAのConnectX-7インターフェースを活用。さらに、ServeTheHomeでも紹介された1300ドルもする超高級ネットワークスイッチ「MikroTik CRS804」を導入しました。
構築の過程では、ケーブルの規格(QSFP28 vs QSFP56)の誤りに気づいたり、スイッチのポート設定が50GbpsにハードコードされているのをClaude(AI)の助けを借りて修正したりと、数々のトラブルに見舞われます。しかし、最終的には100Gbps×2の計200Gbpsという、一般家庭ではまずお目にかかれない爆速のバックボーンを完成させました。これこそが、複数のGPUがあたかも一つの巨大なGPUであるかのように振る舞う「テンソル並列処理」を可能にする鍵なのです。
Qwen 3.5 397Bが爆速で動く!1TB VRAMの暴力的なまでの性能
苦労の末に完成した1TB VRAMクラスター。その実力を試すべく投入されたのは、最新の超巨大モデル「Qwen 3.5 397B(約3970億パラメータ)」です。このモデルはディスク容量だけで800GBを超え、512GBのメモリを積んだMac Studioでも単体では動かすことができません。しかし、8台のDGX Sparkクラスターは、この怪物をいとも容易く飲み込んでみせました。
ベンチマークの結果、Qwen 3.5 397Bを毎秒24トークンという、実用レベルの速度で動作させることに成功。1台のSparkでは3トークン/秒、2台で6トークン/秒、4台で12トークン/秒と、ノードを増やすごとにほぼリニアに性能が向上していく「理想的なスケーリング」を実現しています。爆熱の排気がカメラを止めてしまうほどの過酷な環境下で、1TBのVRAMが巨大な知能を駆動させる様は圧巻の一言です。
ネットの反応
この男、無限の金を持ってるのか?DGX Spark 8台って一体いくらするんだよ…
NVIDIAがドキュメント化してない設定を、コミュニティとAIの力で突破しちゃうのが今の時代っぽくて最高に面白い。
スイッチの設定までClaudeにやらせるのか。 SSHで直接入り込ませて修正させるなんて、もはや魔法だな。
1TB VRAMがあれば、どんな巨大モデルも量子化なしのフル精度で動かせる。夢のような環境だけど、電気代が恐ろしいことになりそう。
Mac StudioクラスターよりNVIDIAの方がスケーリングが良いって結果も興味深い。やっぱりConnectX-7のRDMAは伊達じゃないな。
AIの所感
本記事で紹介したプロジェクトは、個人の情熱とAIのサポート、そしてコミュニティの知識が合わさることで、企業が設けた「制限」すらも突破できることを証明しています。特に、複雑なネットワーク設定をClaudeに実行させるという手法は、今後のエンジニアリングの在り方を予見させるものです。VRAMの壁を「買う」のではなく「繋いで超える」というアプローチは、AI民主化の新たな形と言えるかもしれません。ただし、これだけの規模になると騒音と熱、そしてコストの面で完全に「変態」の領域ですが、その挑戦心には敬意を表さざるを得ません。

