酒呑ガジェット

〜静かな環境であなたに...こちらは音のでないコンテンツです。〜

【朗報】国産AI「PLaMo 3.0 Prime」がついに本気を出した…GPT超えの日本語性能と衝撃のコスパ

【朗報】国産AI「PLaMo 3.0 Prime」がついに本気を出した…GPT超えの日本語性能と衝撃のコスパ

プリファードネットワークス(PFN)が6月22日に正式リリースした国産生成AI「PLaMo 3.0 Prime」が、早くも業界で大きな注目を集めている。フルスクラッチで開発された国産AIとしては初めて推論(Reasoning)に対応し、コンテキスト長は256Kと大容量。しかも同規模のGPT-5.4 miniやClaude Haiku 4.5を日本語性能で上回るというから驚きだ。

PLaMo 3.0 Primeの最大の特徴は、用途に応じて2種類のモデルを選択できる点にある。複雑な問題を思考の過程を分割しながら解く「Reasoningモデル」と、単純な要約や問い合わせ応答に適した「Non-reasoningモデル」の2系統を用意。検証可能な正解がある問題と、モデルが採点する対話問題の両方を報酬として学習させるGRPOという手法を採用している。

国産フルスクラッチの正体

PFNはAIチップ「MN-Core 2」の自社開発から、計算基盤、基盤モデル、ソリューションまでを一貫して手がける垂直統合型企業だ。PLaMo 3.0 PrimeはNICT(情報通信研究機構)との共同研究を基盤に、Webや書籍から収集された大量の日本語テキストで事前学習されている。国立機関のデータを活用しているため、日本語の質が極めて高いのが強みだ。

PLaMo 3.0 PrimeのAI学習イメージ。日本語処理に特化した青色のニューラルネットワークが光る未来的なビジュアル

ベンチマークで見えた真の実力

日本語指示追従ベンチマーク「JFベンチV2」では、出力形式の指定や複数の制約を同時に守る能力で高いスコアを記録。医療分野の「MedRECT」や医師国家試験ベンチマーク「JMLE」でも、日本語データで鍛えられた専門性の高さが確認されている。パラメータ数は31Bとコンパクトながら、日本語効率の良いトークン分割により、同じコストでより多くの情報を処理できる。一方で、Webブラウジングや数学的推論ではOpenAIのO3やClaude 3.7に及ばない部分もあり、万能ではないという正直な評価も必要だ。

業務利用の3点セット

企業がAIを業務システムに組み込む際に必要な「長文コンテキスト」「関数呼び出し」「構造化出力」の3点がPLaMo 3.0 Primeには揃っている。JSONやCSV、マークダウンといった形式での出力精度は高く、競合モデルが不正なCSVを出力する場面でも正確に処理できる。256Kのコンテキストは単行本約2〜3冊分のテキストを一度に処理できる計算で、長大な社内文書や契約書の分析に適している。

安全性とソブリンAIの文脈

スタンフォード大学開発の「HELM Safety」ベンチマークでは、GPT-4oやClaude 3.5 Sonnetと同等以上の安全性を達成。危険な話題への拒否精度は高いが、Non-reasoningモデルでは過剰拒否の傾向があるという課題も認められている。そして何より、PFNが強調するのは「ソブリンAI(国産AI)」の重要性だ。機密データの国外送信リスク、サプライチェーン途絶リスク、そして2030年には年間約8兆円に達するAI関連デジタル赤字——こうした課題に対して、オンプレミスで運用できる国産AIは現実的な選択肢となる。

ネットの反応

31BでGPT-5.4 mini超えは普通にすごい。日本の技術力まだまだ捨てたもんじゃない

オンプレで動く国産AIって本当に待ってた。金融系の会社なら即導入レベル

日本語性能で海外モデル超えるってのがデカい。今まで英語基準のAIに無理やり日本語喋らせてた感あったから

でも256KコンテキストはGeminiの1Mに比べると弱い。用途選ぶモデルだな

全面戦争しないで得意分野で勝負する姿勢は好感持てる。全部できるAIより確実にできるAIのが仕事で使える

医療・法律・行政の分野だと海外AIより圧倒的に相性良さそう。日本語データで鍛えてあるのはでかい

Reasoning対応は国産フルスクラッチ初なんだ。ここからどこまで伸びるか楽しみ

気になるのは過剰拒否の改善。安全すぎて使えないAIだと現場で嫌がられる

AIの所感

PLaMo 3.0 Primeは、単なる「国産AI」という政治的な文脈だけで評価すべきではない。同規模の海外モデルを日本語性能で上回るというのは純粋な技術的成果であり、31Bというコンパクトなサイズでこれを達成した点は評価に値する。むしろ重要なのは、PFNが「最強のAI」を目指さず「業務に使えるAI」に特化したという製品設計の思想だ。256Kコンテキスト、構造化出力、関数呼び出しの3点セットは、企業の実務でAIを活用するための現実的なスペックであり、使い分けを前提としたReasoning/Non-reasoningの2系統モデルも実用的だ。ただし、Webブラウジングを含むエージェントタスクではOpenAIやAnthropicに差をつけられているため、導入の際には用途を明確に絞り込む必要がある。国産AIの存在意義は「海外AIより優れているから」ではなく「選択肢として存在すること自体に価値がある」というスタンスが、今後の日本のAI戦略を考える上で示唆に富んでいる。

-パソコン