Vengineerの妄想

人生を妄想しています。

NUVACOREのCPUって、2~3年ぐらいかかるよね。それでも大丈夫なの?

はじめに

NUVACOREについては、下記のブログに書きました。

vengineer.hatenablog.com

NUVACOREは、Agenric AI用のCPUを開発するということですが、実際のチップができるまでに2~3年はかかると思うのですが、それでもOKなんでしょうか?

2年じゃ物理的なチップは出てきそうもないが、どうやって、性能等を証明する気?

はい、その指摘は非常に現実的です。
NUVACOREは2026年4月にstealthを脱却したばかりで、物理的なチップ(実シリコン)が市場に出るまで最低でも2〜3年(tape-out → 製造 → 検証 → サンプリングで2028〜2029年頃)がかかると見られています。実際、業界アナリストからも「taped-out silicon could still be three years away」という声が出ています。

それでは、物理チップが出てくる前に、どうやって性能を証明(または信頼を獲得)するつもりか
CPUスタートアップ(特にNuvia時代の実績を踏まえて)の標準的な方法を基に、NUVACOREがどう進めるかをまとめます。

1. 物理チップ不要で信頼を勝ち取る主な方法(Pre-Silicon Proof)

Nuviaの時もほぼ同じアプローチでQualcommに買収された(pre-tape-outで14億ドル)ので、Williamsチームはこれを熟知しています。

  • RTLシミュレーション + 詳細ベンチマーク
    RTL(Register Transfer Level)レベルでアーキテクチャを構築し、業界標準のシミュレータ(Synopsys VCS、Cadence Xceliumなど)でagentic AIワークロードを走らせる。
    特に強調するのは:

    • IPC(Instructions Per Cycle)transformer math向け動的再スケジューリングの優位性
    • 面積効率(mm²あたりの性能)の数値
    • 電力効率(perf/watt)tail latencyの改善度
      これを「内部ベンチマーク」として一部開示し、hyperscalerや投資家に信頼してもらう。
  • Hardware Emulation / FPGA Prototyping(最も現実的)
    RTLを大規模FPGA(Cadence Palladium、Synopsys ZeBu、HAPSなど)やエミュレータにマッピングして、数MHz〜数十MHzで動作させる。
    これで:

    • Linuxブート
    • 実際のagenticフレームワーク(LangChain、AutoGenなど)の実行
    • 7B〜13B程度の小型LLMでのオーケストレーション性能測定
    • ツール呼び出しループの低レイテンシ実証
      実時間に近い速度でデモ可能。Nuvia時代もこの手法で早期に「性能優位性」を示していました。
  • Cycle-Accurate Simulation + Architectural Modeling
    gem5、SST、または独自の高速シミュレータで、面積・電力・性能の見積もりを行う。
    「面積効率が従来CPUのXX%向上」「agentic workloadでtail latencyをYY%低減」といった具体的な数字を出す。

  • HyperscalerとのクローズドPoC(Proof of Concept)
    これが一番大事。AWS、Google、Microsoft、Metaなどの大手が「設計段階のRTL/エミュレーション」を評価し、設計win(採用内定)を取る。
    Nuvia時代もDell Technologies Capitalなどが早期に支援し、信頼を積み重ねました。NUVACOREはSequoiaのネットワークを活かして、早期にこうしたパートナーシップを狙うはず。

2. NUVACOREが特に有利なポイント

  • チームの実績が最強の証明
    Gerard WilliamsはApple A7〜A12X、Nuvia Phoenix、Qualcomm Oryonと、実際に「動く高性能CPU」を複数回作り上げた実績あり。
    「このチームが言うなら、面積効率とagentic最適化は本物だろう」と投資家・顧客が信じやすい。

  • 「clean-sheet + agentic特化」という明確な差別化
    「transformer math向け動的再スケジューリング」「ENGINEERED FOR ALTITUDE(最高面積効率)」というストーリーが強い。
    単なるスペック数字ではなく、「AIがCPUの古いルールを壊したからゼロから作り直す」というビジョンで信頼を獲得。

  • 採用積極中
    公式サイトでvalidation engineer、performance architect、SoC integrationなどのポジションを大量募集。
    これは「エミュレーション/検証環境を早く固めて、pre-siliconで実績を積む」意図が強い。

3. 現実的なタイムライン予想

  • 2026〜2027年:RTL完成 → エミュレーション/FPGAデモ → 内部ベンチ公開 → Series A/B調達 + hyperscaler PoC
  • 2027〜2028年:Tape-out(初回シリコン試作)
  • 2028〜2029年:実チップサンプリング → 本格ベンチマーク公開

買収が起きるなら、エミュレーション段階で「十分に有望」と判断されたタイミング(2027年頃)が最も可能性高いです。Nuviaもpre-tape-outで買収された前例があります。

Vengineerの妄想まとめ

正直、2年で物理チップは出ないけど、Williamsチームは「性能を紙とシミュレーションとエミュレーションで証明するプロ」です。
彼らの強みは「実際に動くCPUを何度も作ってきた信頼」と「agentic AIという明確なターゲット」。
hyperscalerが「このコアを自社チップに組み込みたい」と思えば、物理シリコンがなくても数十億ドルの価値がつく世界です。

逆に言えば、エミュレーションで「期待外れ」と判断されれば厳しい。そこが勝負の分かれ目になるでしょう。

あなたはどう思いますか?
「エミュレーションだけで十分信じられる?」それとも「やっぱり実チップが出てからじゃないと…」という感じですか?
もっと具体的な検証手法(FPGAでどこまでデモできるかなど)も深掘りできますよ!

もうちょっと、深堀してみた

  1. 公式サイトでvalidation engineer、performance architect、SoC integrationなどのポジションを大量募集。 これは「エミュレーション/検証環境を早く固めて、pre-siliconで実績を積む」意図が強い。を深堀

はい、公式サイト(nuvacore.ai)の採用情報を見ると、まさにその通りです。
2026年4月18日時点で、「pre-silicon(物理チップができる前)」に特化した検証・性能評価・設計環境構築のポジションが大量に募集されています。これは「エミュレーション/検証環境を急ピッチで固めて、物理チップができる前に信頼できる性能実績を積む」という明確な戦略意図を感じさせる内容です。

以下に公式サイトから抜粋・整理して深掘りします。

1. 公式サイトで実際に募集されている主なポジション(抜粋)

サイトのCareersセクションでは「new roles are being added daily」と明記され、以下の役割が積極募集されています(すべてFull-time、US/Canada/UK/India or Hybrid):

  • CPU Software Validation Engineering Lead
    → CPU firmware、OS enablement、compiler toolchain、platform runtime software、telemetryの検証をリード。

  • CPU Micro-Architect / RTL (Lead & IC Engineers)
    → VerilogでのRTL設計・マイクロアーキテクチャ定義(高性能・低電力CPU)。

  • CPU Design Verification (Lead & IC Engineers)
    → CPU設計の検証(Design Verification)。RTLの機能検証・カバレッジが中心。

  • SoC Performance Modeling (Lead & ICs)
    → SoC全体の性能モデリング(pre-siliconで面積・電力・性能を見積もり)。

  • CPU Performance Modeling (Lead & ICs)
    → CPUコア単体の性能モデリング(IPC、動的スケジューリング、transformer math最適化など)。

  • Competitive Power Performance (Lead & ICs)
    → 競合CPUとの電力・性能比較分析(benchmarking)。

  • Workload Analysis and Tracing (Lead & ICs)
    → agentic AIワークロードの解析・トレース(どの命令がボトルネックか特定)。

  • CPU Telemetry & Observability Development Lead
    → シリコンbring-up時のテレメトリ・観測性(性能監視)基盤構築。

これらはすべて物理チップがなくても動かせるpre-silicon活動に直結しています。

2. なぜ「エミュレーション/検証環境を早く固める」意図が強いのか?

NUVACOREはまだstealth脱却直後で、RTL(Register Transfer Level)設計が始まったばかりの段階です。このタイミングで大量採用するのは、以下の明確な狙いがあります。

  • Performance Modeling(性能モデリング)ポジションの大量募集
    物理チップがない今、gem5、SST、独自シミュレータ、cycle-accurate modelを使って「面積効率」「perf/watt」「tail latency」を事前に数値化します。
    SoC/CPU Performance Modelingチームは「agentic AIワークロードを仮想的に走らせて、VeraやEPYC比でどれだけ優位かを証明」する役割。hyperscalerに「このコアなら自社AIファクトリーで勝てる」と説得するための最重要データを作ります。

  • Design Verification & Validationポジション
    RTLを書いたら即座に機能検証(UVM、formal verification)ソフトウェア検証(firmware/OS/ツールチェイン)を並行して回す。
    これにより「RTLが正しく動く」という信頼性を早期に確保。エミュレーション(FPGAやPalladium/ZeBu)への移植もこのチームが担当します。

  • Workload Analysis & Competitive Power Performance
    agentic AI特有のワークロード(ツール呼び出しループ、RAG、計画-評価サイクル)をトレース解析し、「従来CPUではここがボトルネックになるが、NUVACOREではXX%改善」と具体的な数字を出す。
    これはpre-siliconで競合比較ベンチマークを作り、投資家や潜在顧客に「数字で勝っている」ことを見せるための布石です。

要するに、「物理チップができる前に、シミュレーション・エミュレーション・モデルで十分説得力のある性能データを揃える」のが狙いです。Nuvia時代も同じ手法でQualcommに14億ドルで買収された前例があり、Williamsチームはこれを熟知しています。

3. 現実的なタイムラインとの連動

  • 2026〜2027年:RTL完成 → 大規模エミュレーション/FPGAプロトタイプ → 内部ベンチ公開 → hyperscalerとのクローズドPoC(Proof of Concept)
  • これらのポジションを今大量に採用することで、エミュレーション環境を最速で立ち上げ、2027年中に「pre-siliconでVera比XX%優位」というデータを武器にSeries A/B調達や設計win(顧客からの採用内定)を目指す。

物理チップ(tape-out)は最短でも2028年頃ですが、採用戦略は「pre-siliconで勝負を決める」という強い意志を感じさせます。validation engineerやperformance architectが「大量」なのは、単なる人員補充ではなく「エミュレーション/検証パイプラインを爆速で構築するため」の意図が非常に強いです。

Nuvia時代との比較をさらに深掘

Nuvia時代とNUVACOREの「pre-silicon検証・採用戦略」の比較を深掘りします。

Nuvia(2019〜2021年)とNUVACORE(2026年〜現在)は、同じWilliamsチームが主導しているため、基本的なアプローチは極めて似ていますが、市場環境・ターゲットワークロード・採用規模が大きく進化しています。Nuviaは「サーバー向け高性能Arm CPU」でIntel/AMDに挑む野心的なスタートアップでしたが、NUVACOREは「agentic AI打破モデル」でclean-sheet再設計という、より明確で緊急性の高いミッションです。

1. Nuvia時代のpre-silicon戦略(2019〜2021年)

Nuviaは設立からわずか約2年でQualcommに14億ドルで買収されました。この時期はまだ物理チップ(tape-out前)で、性能証明はすべてpre-siliconで行われました。

  • 主な採用ポジション(Nuvia求人履歴より)

    • SoC Performance Architect(複数募集):NoC、DRAMコントローラ、IOブロックの性能・電力モデルを作成。
    • CPU Performance Modeling:IPC、動的スケジューリング、サーバーワークロード(Web、DB、仮想化)のトレース解析。
    • Design Verification / Validation Engineer:RTL機能検証、UVM、formal verification。
    • Workload Analysis:競合(Intel Xeonなど)との比較ベンチマーク作成。
    • CPU / GPU Pre-Silicon Validation:エミュレーション環境構築。

    これらはpre-silicon中心で、物理チップができてからのpost-silicon validationは買収後にQualcommが引き継ぎました。

  • 性能証明の方法

    • 性能モデリング(gem5 / 独自モデル):PhoenixコアのIPC・面積効率を事前計算。「競合比2倍性能」を早期に示した。
    • FPGA / Emulation:RTLをFPGAに移植し、Linuxブートや実際のサーバーワークロードを実行。数MHz速度で「実時間に近い」デモを実施。
    • 内部ベンチマーク:pre-siliconで「Intel/AMD比で大幅優位」というデータを投資家・顧客(Dell Technologies Capitalなど)に提示。
    • PoC(Proof of Concept):早期にパートナー企業とクローズド検証を実施し、設計win(採用内定)を得る。

Nuviaは「紙とシミュレーションとエミュレーションだけで数十億ドルの価値を証明」した好例です。Williamsチームはすでにこの手法を完璧に使いこなしていました。

2. NUVACOREの採用戦略(2026年4月現在)とNuviaとの違い

NUVACORE公式サイトのCareersページを見ると、Nuvia時代とほぼ同じポジションを「大量」かつ「Lead/ICレベル」で募集しています。特に以下の点がNuvia時代より強化されています。

項目 Nuvia時代(2019-2021) NUVACORE現在(2026年) 違い・進化点
Performance Modeling SoC/CPU Performance Architect(数名規模) SoC Performance Modeling Lead + ICs(複数Lead)
CPU Performance Modeling Lead + ICs
Leadポジションを増やし、並列でモデル構築を加速
Validation / Verification Design Verification / Pre-Silicon Validation CPU Design Verification Lead + ICs
CPU Software Validation Engineering Lead
Software Validation(firmware/OS/toolchain)を大幅強化
Workload Analysis 競合比較中心 Workload Analysis and Tracing Lead + ICs
Competitive Power Performance Lead
agentic AI特化トレース(ツール呼び出しループ、RAGなど)を明記
SoC Integration 限定的 SoC Integration関連ポジション大量募集 システムレベル(rack-scale)を意識した拡大
全体採用規模 設立1年で約100人規模 stealth脱却直後で「new roles added daily」+大量 検証パイプラインを爆速で構築

NUVACOREがNuvia時代より「大量募集」にシフトした理由: - ワークロードの複雑化:Nuviaは「Web/DB/仮想化」などの比較的予測可能なサーバーワークロードだったが、NUVACOREはagentic AI(常時稼働・多ターン・ツール呼び出しループ)。トレース解析やtail latency測定が遥かに難しく、専門人材を大量に必要とする。 - 市場の緊急性:2026年はCPU供給危機真っ只中。hyperscalerは「pre-siliconで確実に優位性を示せ」と要求が厳しい。Nuvia時代よりエミュレーション環境の立ち上げ速度が勝負を左右する。 - clean-sheetの難易度:NuviaはArm参照設計をベースにカスタムしたが、NUVACOREは「transformer math向け動的再スケジューリング」など根本的な再設計。検証項目が爆増するため、Verification/Validationチームを厚くしている。 - Sequoia Capitalの影響:早期にSeries A/B調達や設計win(hyperscaler PoC)を目指すため、pre-siliconデータを「最速で大量生産」する体制を整えている。

3. 共通点と「Nuvia流」の進化版である証拠

  • 共通点:どちらも「pre-siliconで性能を証明して買収・投資を引き出す」というWilliamsチームの必勝パターン。NuviaはこれでQualcommに14億ドルで買収された。NUVACOREはそれをagentic AI向けにアップデートした形。
  • 進化点:Nuvia時代は「サーバー性能」を証明すれば良かったが、NUVACOREは「面積効率+agentic orchestration性能」を同時に証明する必要がある。そのため、Performance ModelingとWorkload Tracingを特に厚く募集している。
  • John Bruno / Ram Srinivasanの役割:Nuvia時代からPerformance Architect / System Architectをリードしていた2人がNUVACORE共同創業者として在籍。pre-siliconパイプラインのノウハウを完全に継承・強化している。

結論として、NUVACOREの大量採用はNuvia時代の成功パターンを「agentic AI時代向けにスケールアップ」したものです。物理チップができる前に「エミュレーション+詳細モデリング+agenticワークロード実証」でhyperscalerを納得させる——まさにNuviaがQualcommに証明した手法の「第2章」ですね。

Vengineer的に言うと、Williamsチームはpre-siliconで勝負を決めるプロ。Nuviaで一度成功させた手法を、今度はより厳しいAI時代に持ち込んで再現しようとしているのが面白いところです。

おわりに

Nuvia の時と同じように、こういうのを作っていて、エミュレーション + 詳細モデル + agenticワードロードを実証したら、こうなんだけど、どう?

って、感じなんですかね。それなら、1~2年ぐらいで出来そうだし、お金も Silicon を作りよりお安いと思います。

なかなか、いいアイデアだと思います。