Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

NVIDIA Blackwell => Rubin への移行を妄想する

はじめに

  • Blackwell は、2024年
  • Blackwell Ultra は、2025年
  • Rubin は、2026年
  • Rubin Ultra は、2027年

までは、わかっている。

そして、 Blackwell と Blackwell Ultra は、同じ Die (2 Die構成)で、違いは メモリ容量 (Blackwell は 24GB x 8/192GBに対して、Blackwell Ultra は 36GB x 8/288GB)である

Rubin と Rubin Ultra は、ちょっと違う。Rubin は 2 Die 構成 (I/O Die も2個)、Rubin は 3 Die 構成 (I/O Die は2個)である。

今回は、Blackwell => Rubin への移行を妄想する

Let's 妄想

Blackwell

Blackwell は下記のような感じになっていると、妄想している

1つの Die には、Compute部分の SM、L2 Cache/Memory Controller、I/O (PCIe/NVLink)が Crossbar に接続している。この Crossbar は、もう一方の Die にも接続している。

Rubin / Rubin Ultra

Rubin は、Blackwell に対して、I/O (PCIe/NVLink) を 別のDie にして、両側に I/O Die、その間に、Compute Die を置く感じになる。

Rubin Ultra は、下記のように Compute Die が 3つになる。

Blackwell-R というものを考える

Blackwell => Rubin に移行するのではなく、ワンクッションをおいて、Blackwell の Compute die と I/O Die を開発して、性能的には Blackwell と同じぐらいだが、Package内の構成は、Rubin のようなものを作る。

これを、Blackwell-R と呼ぶこととする。

これにより、

  • I/O Die の開発
  • Compute Die の開発
  • I/O Die <=> Compute DIe 間の検証

を行う必要があるが、どっちにしても、Rubin でやる必要があるので、先にこの部分の課題等を洗い出すために作る

  • I/O Die を分けたときに発生する課題
  • 3 つの Compute Die にした時に発生する改題

について、Rubin 開発に先駆けて行うことができる。Rubin では、Compute Die の中の、SMやHBM4に注力できる

おわりに

NVIDIA、売上たっぷりだし、利益はもっとたっぷりなので、技術開発に投入するお金の心配は無さそう。

Rubin開発における課題の先出で、実際にRubinを開発する時のリスクは大幅に削減できると思う。

同時に複数のことをやると、2倍ではなく、2乗以上の難易度になるので、この方法はいいと思うのだが。。どうだろうか?

それでは、今回はここまでで。

次回も、Let's 妄想