はじめに
- Blackwell は、2024年
- Blackwell Ultra は、2025年
- Rubin は、2026年
- Rubin Ultra は、2027年
までは、わかっている。
そして、 Blackwell と Blackwell Ultra は、同じ Die (2 Die構成)で、違いは メモリ容量 (Blackwell は 24GB x 8/192GBに対して、Blackwell Ultra は 36GB x 8/288GB)である
Rubin と Rubin Ultra は、ちょっと違う。Rubin は 2 Die 構成 (I/O Die も2個)、Rubin は 3 Die 構成 (I/O Die は2個)である。
今回は、Blackwell => Rubin への移行を妄想する
Let's 妄想
Blackwell
Blackwell は下記のような感じになっていると、妄想している
1つの Die には、Compute部分の SM、L2 Cache/Memory Controller、I/O (PCIe/NVLink)が Crossbar に接続している。この Crossbar は、もう一方の Die にも接続している。
Rubin / Rubin Ultra
Rubin は、Blackwell に対して、I/O (PCIe/NVLink) を 別のDie にして、両側に I/O Die、その間に、Compute Die を置く感じになる。
Rubin Ultra は、下記のように Compute Die が 3つになる。
Blackwell-R というものを考える
Blackwell => Rubin に移行するのではなく、ワンクッションをおいて、Blackwell の Compute die と I/O Die を開発して、性能的には Blackwell と同じぐらいだが、Package内の構成は、Rubin のようなものを作る。
これを、Blackwell-R と呼ぶこととする。
これにより、
- I/O Die の開発
- Compute Die の開発
- I/O Die <=> Compute DIe 間の検証
を行う必要があるが、どっちにしても、Rubin でやる必要があるので、先にこの部分の課題等を洗い出すために作る
- I/O Die を分けたときに発生する課題
- 3 つの Compute Die にした時に発生する改題
について、Rubin 開発に先駆けて行うことができる。Rubin では、Compute Die の中の、SMやHBM4に注力できる
おわりに
NVIDIA、売上たっぷりだし、利益はもっとたっぷりなので、技術開発に投入するお金の心配は無さそう。
Rubin開発における課題の先出で、実際にRubinを開発する時のリスクは大幅に削減できると思う。
同時に複数のことをやると、2倍ではなく、2乗以上の難易度になるので、この方法はいいと思うのだが。。どうだろうか?
それでは、今回はここまでで。
次回も、Let's 妄想