はじめに
2026年4月現在、AIの風向きが完全に変わりつつあるっぽい。特に「agentic AI(自律型エージェント)」が本格的に到来すると、GPUだけじゃもう全然足りない。CPUが再び主役級のボトルネックになるって、業界で本気で語られるようになってきたんだよね。
そんな中、4月中旬にstealthから一気に姿を現した新スタートアップがネットをざわつかせてる。それが NUVACORE(nuvacore.ai) だよね。創業者に Gerard Williams III、John Bruno、Ram Srinivasan——CPUアーキテクト界の超ドリームチームが揃ってる。Sequoia Capital主導で資金調達も完了。スローガンは「ENGINEERED FOR ALTITUDE」——成層圏向けに設計、ってやつ。従来の「地面(データセンター)向け」じゃなく、最高高度の性能と絶対的な面積効率を追求すると宣言しているね。
このニュース見て、前の会話で深掘りした内容が一気に繋がっちゃったね。「Qualcommの経営陣は『Oryonベースの延長で十分』と考えてるけど、Williamsチームは『それじゃ勝てねえ!』って判断して独立したんだな」って。
今回はその妄想を記録に残します。
Apple → Nuvia → Qualcomm → NUVACOREの流れを追いながら、なぜ今CPUが熱いのか、agentic AIで何が変わるのか、DDR5がダメな理由、SOCAMMやPCIeボトルネック、そしてQualcommとWilliamsチームの温度差を、妄想します。
AIワークロードの劇的変化:従来のCPUではもう通用しない
まず根本的な前提から整理します。
従来のサーバーCPU(Intel Xeonの32/48コアクラスやAmpere ComputingのAltra/AmpereOneとか)は、主にWeb処理やクラウドネイティブワークロード向けに最適化されてきました。高コア数・低電力・予測可能なレイテンシが武器で、マイクロサービス、API処理、データベースで大活躍しています。
でもagentic AIが本格化すると、状況が一変するっぽい。
- 従来の生成AI:GPUが9割以上を担う(行列演算=matmul、transformerの重い計算)。CPUは前処理や後処理のただの脇役。
- agentic AI(自律エージェント):エージェントが「計画 → ツール呼び出し(検索・コード実行・RAG) → 評価 → 再試行」を繰り返す。ツール処理だけで全体レイテンシの最大90%を占めるケースも出てようです。
ここで大事なのは、CPUが常時稼働のオーケストレーターとして機能する必要が出てきたこと。GPUを100%満載に保つための高速意思決定、低tail latency(遅延の尻尾を極力短くする)、複雑な同期処理がガッツリ求められるということ。
結果、CPU:GPU比率が従来の1:4〜1:8から、1:1〜1:2へとシフトすると言われてる(Armの推定)。1GWあたりのCPUコア需要が従来の4倍に跳ね上がる可能性すらある模様。
NVIDIAはこれを先読みしてVera CPU(88 Olympusコア)を開発。「agentic AI purpose-built」と位置づけ、伝統的x86比で1.5x性能、2x効率、50%高速を主張してる。Spatial MultithreadingやNVLink-C2C(1.8 TB/s)でGPUとの連携も極限まで最適化している
メモリと接続のボトルネック:DDR5じゃダメな理由
agentic AIでは、CPU側のメモリとGPUとの接続が新たなボトルネックとして浮上しているっぽい。
なぜDDR5 RDIMMでは厳しいのか?
- 電力消費がデカい(LPDDR5X比で約3倍)
- 帯域/ワット効率が悪い
- 物理サイズが大きくてラック密度・冷却効率が落ちる
- 大容量化すると熱と電力がさらに悪化
agenticワークロードではKVキャッシュ、RAGデータ、ツール結果の頻繁な移動が発生するから、1コアあたりの帯域が極めて重要になる。
NVIDIA VeraはLPDDR5X + SOCAMM2を採用して最大1.5TB容量+1.2 TB/s帯域を実現。電力はDDR比で半分以下、着脱可能で保守性も高い。AMDの次世代EPYCもSOCAMM2対応を計画中だし、QualcommのAI200/AI250も大容量LPDDRをフル活用してる。
DDR5は「悪いメモリ」じゃない。でも極限の効率・密度・電力制約が求められるAI時代には、もう合わなくなってきた。
PCIe接続の問題も同じ。PCIe Gen6 x16でも実効帯域は128 GB/s程度。agentic AIではデータ移動量が段違いだから、GPU待ちが発生しやすく全体効率がガタ落ち。
NVIDIAはNVLink-C2Cで1.8 TB/sのコヒーレント帯域を提供。Veraはモノリシックダイ設計でNUMA遅延をゼロにし、安定した並列実行を実現してる。
NUVACOREがCPUコアを開発する場合も、PCIeだけに頼るとボトルネックになるリスクはある。でもGerard WilliamsらのチームはApple SoC統合やNuvia/Qualcommでのシステム設計経験が豊富。clean-sheetでインタコネクトやchipletまで視野に入れた設計になる可能性は極めて高いとあたしは妄想しているよ。
Qualcommの路線とWilliamsチームの決断
ここが一番面白いところ。
Qualcommは2025年10月にAI200(2026年商用化)とAI250(2027年)を発表。Hexagon NPUを中心としたinference特化アクセラレータで、1カードあたり最大768GB LPDDRメモリ、near-memory computing(AI250で10x超の有効帯域)、液冷ラック対応を武器にしてる。200MW規模の大型契約も取って株価も跳ねたんだ。
Qualcomm経営陣(Cristiano Amon CEOら)の戦略は明確。
- モバイルで培った低電力・高効率技術をデータセンターにスケールアップ
- inferenceのTCO(総所有コスト)でNVIDIA/AMDに勝負
- Oryon CPUは「ホストCPU」や「制御役」として活用。将来的にサーバーグレードへ拡張する計画はあるが、優先順位はNPU中心のinferenceアクセラレータ
つまり「今までの延長線上で十分勝負できる」という現実路線だ。NVIDIAのようなrack-scale液冷は意識してるけど、フルスタックでtrainingからagenticまでカバーするんじゃなく、inferenceの経済性に特化してる。
一方、Gerard Williams III、John Bruno、Ram Srinivasanのチームは「それでは勝てない」と判断したじゃないかな。。
彼らはNuvia時代から「高性能Arm CPUでサーバー市場を変える」という強い野心を持っていた。Oryon開発でも深く貢献したけど、agentic AIの極限要件(面積効率、動的再スケジューリング、低tail latency、コア間コヒーレンスなど)に対して、従来のイテレーションじゃ追いつけないと感じたんだろうね。
NUVACOREのメッセージはストレートすぎる。
「CPUs iterated for decades. AI broke the model.」
「ENGINEERED FOR ALTITUDE」
clean-sheet(ゼロベース)で汎用CPUコアを再設計し、agentic computingの常時稼働・高強度ワークロードに完全最適化する。Qualcommの経営陣が「OryonでOK」と考えるのに対し、Williamsチームは「シリコンのルール自体を書き換えるレベルが必要」と考えたんだ。
これは典型的な大企業内の温度差だよ。Qualcommは事業全体のバランスとリスク管理を優先。一方、伝説のCPUアーキテクトたちは「次のパラダイムシフト」を求めて独立したんだ。
おわりに
AIが「計算エンジン(GPU中心)」から「自律エージェントの連続稼働」へシフトする中で、CPUが再び重要な役割を担うことになる。Ampereみたいな高コアクラウドネイティブCPUの流行はWeb時代の産物だった。agentic時代は「GPUを常に満載に保つ制御脳」として、単コア性能・メモリ帯域・効率・予測可能性がすべてを決めるんだ。
QualcommのAI200/250路線はinferenceの経済性で一定の成功を収めそうだ。でもagentic AIが本格的に爆発したとき、Williamsチームが言う「clean-sheet AI最適CPU」が鍵になるかもしれないよ。
NUVACOREはまだ詳細スペックをほとんど公開してないけど、Sequoia Capitalのバックアップとチームの実績を考えれば、NVIDIA Vera、AMD EPYC、ハイパースケーラー自社CPUとは別の軸で勝負してくるはずだ。
この流れは、色々なところで進むのかな?
メモリもDDR系からLPDDR系になり、SOCAMMを使うようになるのかな。。。。
ほえー、これで、スマホの価格も上がるね! https://t.co/tHNEXafs6E
— Vengineerの妄想 (@Vengineer) 2026年4月16日