【衝撃】WindowsがローカルLLMを処理！Linuxがそれを破壊する前に…

2025/07/16

【衝撃】WindowsがローカルLLMを処理！Linuxがそれを破壊する前に…

ソフトウェア開発者にとって、Windows、Linux、macOSといった異なる環境でLLM（大規模言語モデル）を実行する際のパフォーマンスは常に気になる問題です。特に、「WindowsはLLMのパフォーマンスを阻害するのか？」という疑問は多くの開発者が抱いています。今回は、LM Studioを使用して、WindowsとLinux（WSLおよびネイティブUbuntu）環境でLLMの実行速度を比較検証しました。

検証には、NVIDIA GeForce RTX 5080（16GB VRAM）を搭載したPCを使用。Gemma 3 4BモデルをGPUオフロードで実行したところ、Windows環境では102トークン/秒を記録しました。次に、WSL（Windows Subsystem for Linux）環境で同じモデルを実行したところ、108トークン/秒と、わずかながらWindowsを上回る結果となりました。

ネイティブLinuxの驚異的なパフォーマンス

さらに驚くべきは、ネイティブUbuntu環境でのパフォーマンスです。同じGemma 3 4Bモデルを実行したところ、なんと170トークン/秒という、WindowsやWSLを大きく上回る速度を記録しました。これは、Windows環境でLLMを実行しているユーザーにとっては衝撃的な結果と言えるでしょう。特に、小規模なモデルでは、UbuntuがWindowsやWSLに比べて圧倒的な速度差を見せつけました。

しかし、大規模なモデルになると、VRAM容量の制約から、Windows環境ではLM StudioがCPUにオフロードすることで処理速度が著しく低下する現象が見られました。これは、VRAM容量が16GBのグラフィックカードでは、32Bパラメータモデルのような大規模なLLMを快適に実行するには不十分であることを示唆しています。

ネットの反応

LinuxがLLMでこんなに速いとは知らなかった。

WindowsでLLM動かすのはやっぱり厳しいのか。

VRAMの重要性を再認識した。もっと大容量のグラボが必要だな。

AIの所感

今回の検証結果は、LLMのローカル実行において、OS環境がパフォーマンスに大きな影響を与えることを明確に示しました。特に、ネイティブLinux環境がWindowsやWSLを大きく上回る速度を記録したことは、LLM開発者や研究者にとって重要な情報となるでしょう。しかし、同時に、大規模なLLMを快適に実行するためには、VRAM容量の重要性が改めて浮き彫りになりました。これは、LLMの進化が、ハードウェアの進化をさらに加速させることを意味します。今後は、より大容量のVRAMを搭載したグラフィックカードや、LLM処理に特化したハードウェアの需要が高まることが予想されます。WindowsもLLMのローカル実行に対応し始めていますが、Linuxが持つパフォーマンスの優位性は依然として大きく、今後のOS間の競争がLLMの進化をさらに加速させることを期待します。私たちは、LLMがもたらす新たな可能性を最大限に引き出すために、ハードウェアとソフトウェアの両面から最適な環境を追求していく必要があるでしょう。

-パソコン