Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

書籍 : ビリー・マサーズ

はじめに

ひとり読書会、スティーブン・キングの新作

  • ビリー・サマーズ

を読み終えました

前回の「リーシーの物語」は、3月29日なので、1か月無かったですね。

vengineer.hatenablog.com

その間に1冊、読んでいますが。

ビリー・サマーズ

書いたのが、2019年6月12日 ~ 2020年7月3日

パンデミックが始まる前。中でも、これからパンデミックが起こるのに、と書いてある。

ビリー・サマーズは、ホラー作品でもないです。ちょっとだけサスペンスですが、なかなか悩ましい内容でした。

おわりに

在庫は、

  • 電流心霊

のみです。

ビリー・サマーズの下巻の解説に

  • 初夏 : Later
  • 秋 : 幻の中編「コロラド・キッド」「ライディング・ザ・ブレッド」「Elevation」を加えた日本オリジナル中編集
  • Fairy Tale

が出るようです。真ん中の「コロラド・キッド」は非売品なので、読めないかな?と思っていたので、超嬉しいです。

Tenstorrent の Blackhole の性能は、1000 8b TOPS、NVIDIA H100 (2000 TOPS)の半分の性能!

はじめに

Tenstorrent の Blackhole の性能ですが、8bit であるものの 1000 TOPS 。NVIDIA H100 の FP8 が TensorCore で 2000 TOPS (dense) なので、半分の性能です。

vengineer.hatenablog.com

Blackhole の性能

上記のブログにも載せた Tenstorrent のスライドを説明のために引用します。

プロセスを考えると、Tenstorrent のものは 性能がいいですね。

ただし、メモリが GDDR6 なので、そこがボトルネックになる可能性があります。

おわりに

あまり気にしていませんでしたが、Tenstorrent 、8b ではあるものの 性能いいですね。

AIアクセラレータ、第3世代が勝負どころか?

はじめに

Intel Habana Gaudi 3の詳細が出てきたことはこのブログでも紹介しました。

GPUを含めたAIアクセラレータ。第3世代目が勝負どころでは?と思っています。

第3世代を見てみる

  • NVIDIA : P100 (16nm) => V100 (12nm) => A100 (7nm)
  • AMD : MI100 (7nm) => MI200/MI210/MI250 (7nm) => MI300X (5nm)
  • Intel Habana : Gaudi (16nm) => Gaudi 2 (7nm) => Gaudi 3 (5nm)

AI Cloud Chip Startup では、

  • Cerebras Systems : CS-1 (16nm) => CS-2 (7nm) => CS-3 (5nm)
  • SambaNova Systems : SN10 (7nm) => SN30 (7nm) => SN40L (5nm)

残念ながら、Graphcore は、第二世代までで終わりです。

  • Graphcore : IPU MK1 (16nm) => IPU MK2 (7nm) = BoW IPU (7nm) これは、IPU MK2 の電源を強化したものなので第二世代

この中で、NVIDIAだけ、7nm 。AIアクセラレータと考えると、TensorCoreを入れたV100を第一世代とすると、

  • NVIDIA : V100 (12nm) => A100 (7nm) => H100 (4nm)

となり、同じ感じなんでしょうかね。

想定外だった、SRAM

TSMCが 3nm では、5nm に対して、SRAMのサイズはあまり小さくならないよ、宣言によって、辛くなっている感じ。

となると、第4世代 (TSMC 3nm) では力業、つまり、いっぱい詰め込む、では無理そう。。ということで、5nm からは 2 die 以上で攻めている感じです。

  • AMD MI300X : die たくさん
  • Intel Habana Gaudi 3 : 2 die
  • SambaNova Systems : SN40L : 2 die

そして、NVIDIAも H100までは 1die でしたが、B100では 2 die

おわりに

5nm ベースの AI アクセラレータが出そろいました。性能的には、NVIDIA H100/H200 程度にはなっているようです。となると、あとはお値段ですね。H100 の $30,000 に対して、AMD MI300X は $15,000 という話も出ているようなので、性能はほぼ同じで AIアクセラレータは半分。とは言え、1ボードで済むことがないので、Node単位だけでなく、Cluster単位でのお値段に比較が必要ですね。

基本、$1M を考えないといけないので、あたしの世界観ではもうすでに、どこかに行ってしまいました。。。。さようなら。

NVIDIA B100/GB200/B200、AMD MI350/MI375 のリリース時期

はじめに

NVIDIA B100/GB200/B200、AMD MI350/MI375 のリリース時期を Trendforce が予測しています。

www.trendforce.com

各プロダクトのスケジュール

下記の図は、上記の Trendforce の記事から説明のために引用します。

  • B100 : Q3.2024, HBM3e-8hi/192GB
  • GB200 : Q3.2024, HBM3e-8hi/192GB
  • B200 : Q1.2025, HBM3e-12hi/288GB

  • MI350 : Q4.2024, HBM3e-12hi/288GB

  • MI375 : Q4.2024, HBM3e-12hi/288GB

MI350は、HBM3e-12hi なんですね。

おわりに

AMD MI400 って、Q4.2024 ぐらいだと思っていたんですが、ここには載っていいませんね。どうなっているのでしょうか?

wccftech.com

によると、MI400 は、2025 なんですね。なので、MI350 が MI300 refresh として開発しているんですね。

Tenstorrent の Blackhole が上がってきたようだ。Blackhole は、AI Accelerator ではなく、AI SoC なのか?

はじめに

Tenstorrent の Blackhole が上がってきたようです。

Jim san の Xの投稿に、チップおよび評価ボードの写真が載っています

以下、Jim san の Xの投稿を説明のために引用します。また画像も引用します。

記録のために残します。

3月7日のブログには、4月に火入れということなので、順調にいっているようです。

vengineer.hatenablog.com

Blackhole

BLACKHOLE とありますね。

評価ボード

右側に、PCIe x16 Edge が見えます。また、PCIe x16 slot が 2 個載っています。

左側にあるのは、マザーボードっぽいですね。マザーボードのPCIe x16 の Slot からケーブルが伸びていて、評価ボードに下にいっていますね。

水色のケーブルって、チップのソケットから PCIe x16 Edge までの配線を均等にできないので、このようにしているのですかん。

手前側に、M.2 が載るようになっていますね。

下記の部分が PCIe Gen5 関連の

  • PCIe Gen5 x16 の スロットが2個
  • PCIe Gen5 x16 Edge
  • M.2
  • PCIe Gen5 x8 (x4?) のケーブル用コネクタが 7個

がいますね。

Blackhole : PCIe Gen5 が 32 lanes ということなので、全部同時に使うのではなく、接続を切り替えて使えるようにしているんでしょうね。

Blackhole の CPU

vengineer.hatenablog.com

で紹介したスライドです。

SiFive X280 が 14 個載っています。Wormhole までは、ARC x 4 でしたが、RISC-V コアが 14 です。なので、Linux が Boot するので、M.2 や PCIe x16 Slot が載っているのでしょうね。

つまり、Blackhole は、AI Accelerator ではなく、AI SoC なんでしょうかね?

vengineer.hatenablog.com

の下記のスライド(説明のために引用します)に、書いてありました。

Blackhole

  • Bigger arrays of AI processors
  • Combine with CPUs
  • CPUs can handle high level code
  • CPUs can also work in the AI graph

Building Computers for AI with RISC-V の 7頁から Black Hole は、Heterogenous

おわりに

それにしても、評価ボードのソケットすごいですね。その上のファンは、PCのCPU並みですね。。。。

Alder Lake-Nな ODROID-H4

はじめに

このブログでも大昔にODROIDを取り上げていました。Cortex-Aシリーズ搭載品です。

一番古いのは、2013年。10年前です。Odroid-XU

vengineer.hatenablog.com

この他にもODROIDについては、下記にあります。

vengineer.hatenablog.com

ODROID-H4

ODROIDシリーズにおいて、Intel CPU 搭載品が H シリーズ

このブログでも2回紹介しています。

今回は、Alder Lake-N搭載の ORDOID-H4 です。

www.cnx-software.com

サイトは、こちら

www.hardkernel.com

  • ODROID-H4 (N97) : $99
  • ODROID-H4 PLUS (N97) : $139
  • ODROID-H4 ULTRA (Core i3 N305) : $220

H4とH4 PLUS の違いは、 - 2.5GbE : 1=> 2 - SATA III : 0 => 4

H4 PLUS と H4 ULTRA の違いは、CPU - N97 => N305

メモリとSSDは別。

  • Alder Lake-N は、メモリが1チャネル (Max 48GB, DDR5-4800)
  • SSDは、M.2 が1つ (PCIe Gen3 x 4)

Amazonで、SODIMM(DDR5-4800)

  • 8GB : 3,880
  • 16GB : 7,980
  • 32GB : 14,785

SSD

  • 500GB : 5,980
  • 1TB : 9,399

なので、

  • 8GB + 500GB = 10,000
  • 16GB + 500GB = 14,000
  • 16GB + 1TB = 18,000
  • 32GB + 1TB = 25,000

ですね。

おわりに

ケースも必要になり、それなりのお値段になるので、mini PC を買った方がよさそうな気がします。。。。

Alder Lake-N300 は、Core i3 N300

はじめに

このブログで一番アクセスがあるのは、

vengineer.hatenablog.com

で、2番目が

vengineer.hatenablog.com

で、Alder Lake-N関するものです。

Intel Alder Lake-N97 とは?でも書きましたが、Alder Lake-Nなプロダクトとしては、

  • N50 (Embedded)
  • N95
  • N97 (Embedded)
  • N100
  • N200

があります。

そして、Core i3 N300 も Alder Lake-N なのです。

Core i3 N300 (Alder Lake-N300)

www.intel.co.jp

  • お値段は、$309.00 (N100が$128なので、かなりお高いです)
  • 8コア@3.80GHz、6MB Smart Cache, 7W
  • メモリ : 16GB
  • GPU : 32 Unit@1.25GHz

N100 が4コア@3.4GHzで $128, N300 が 8コア@3.8GHzで309

おわりに

pc.watch.impress.co.jp

の記事によると、MINISFORUM「UN305」は、3万6,780円から

Kakaku.comによると、売っているところなさそうですね。

Core i3 N305 なるものもあります。

www.intel.co.jp