HPE の NVIDIA GH200のblade : HPE Cray EX254n

はじめに LinkedInを散歩していたら、HPEのNVIDIA GH200が8基搭載された 1Uサーバーの写真が載っていたので、記録として残します。 HPE GH200 1U サーバー下記のLinkedinの投稿です。 www.linkedin.com 記録のために、写真を引用します。 HPEのサーバーなの…

2023-12-09

MicrosoftのOlive Quantizer

はじめに MicrosoftのOlive Quantizer github は、ここにあります。 accelerator もあった olive/hardware に、accelerator.py なるものがありました。この中で、 class AcceleratorLookup: EXECUTION_PROVIDERS: ClassVar[dict] = { "cpu": ["CPUExecution…

2023-12-08

AmpereOneのL1-I Cacheが小さいぞ！

はじめに AmpereOneのProduct Briefを見て、気が付いたこと。L1 Cacheのサイズが小さいこと。 L2: 2 MB per Core L1: 16 KB Instruction and 64 KB Data per Core 何故？ Altra Max を振り返る Altra MaxのDataSheetを見たら、 128 Arm® v8.2+ 64-bit CPU co…

2023-12-07

NVIDIA GH200 NVL32って、お幾らなんだろうか？

はじめに GraceベースのDGXを妄想したのが、2022年3月27日 vengineer.hatenablog.com あれから、1年8か月。NVIDIAは、Grace-Hopperベースの NVIDIA GH200 NVL32 を発表 developer.nvidia.com NVIDIA GH200 NVL32 NVIDIA GH200 NVL32 は、Grace-Hopperである…

2023-12-06

Xerox Alto のお話

はじめにこのブログを読んでいただいている方で、Xerox Alto の実物を見たことがあるのは多くは居ないと思います。あたしは動いたものは見たことないですが、数年間通勤時に2回見ていました(見ていましたというより、途中に置いてあるということです)。下…

2023-12-05

Metaは、RISC-Vで攻めてくる？

はじめに RISC-V SUMMIT のビデオが11月30日に公開されました。その中に、Metaの Keynote: Building Data Center Scale SoC's using RISC-V at Meta - Prahlad Venkatapuram では、 Video 処理ASIC (MSVP : Mea's Scalable Video Processor) AIアクセラレー…

2023-12-04

Google TPU v5e と AWS Trainium の比較

はじめに Microsoft が Maia 100 を発表し、来年にサービスインすることで、3大 Cloud Service Google AWS Microsoft にて、AIアクセラレータを利用できるようになります。今回は、既にサービスを行っている Google TPU v5e AWS Trainium/Inferentia2 につ…

2023-12-03

Intel FPGA Runtime for OpenCL Software Technology の HAL部分のコードを覗いてみた

はじめに Intel FPGA Runtime for OpenCL Software Technologyは、下記のようび github に公開されています。 github.com 最近、HAL (レジスタ部分)が公開されたので、みてみます。 HAL 部分を眺める今回更新されたHALの部分は、 include/acl_hal_mmd.h で…

2023-12-02

AWS Trainium の SRAMは、Scratch Padとして使うと。

はじめに AWS Trainium 内には、2つのNeuronCorev2 があり、各NeuronCorev2には On-chip SRAM Memory が載っています。このSRAMをどのように使っているのかがわかりました。 OpenXLAの講演ビデオ (AWS) Innovating with XLA for the Neuron compiler for AWS…

2023-12-01

HBM4をGPU dieの上に積む？

はじめに HBM4の情報がXのTLに流れてきました。下記の投稿を説明のために引用します。 From HBM4, we will witness a historic moment when the roles and influences of memory, system, fabless, and foundry will be reversed. According to a report by …

2023-11-30

11月の映画鑑賞

11月の映画鑑賞 : 27本 10月の映画鑑賞 : 20本 9月の映画鑑賞 : 22本 8月の映画鑑賞 : 24本 7月の映画鑑賞 : 25本 6月の映画鑑賞 : 20本 5月の映画鑑賞 : 29本 4月の映画鑑賞 : 20本 3月の映画鑑賞 : 27本 2月の映画鑑賞 : 17本 1月の映画鑑賞 : 20本 2007年…

2023-11-30

Xilinx AI Engine Runtime

はじめにいつものように github をぶらついていたら、AMD のサイトで AI Engine Runtime なるものが公開されているのを知りました。 github.com AIE Driver(driver) AIE Driver is a userspace library that provides hardware access to applications. AIE…

2023-11-29

AWS : Graviton4 / Trainium2 を発表

はじめに AWS が Graviton 4 / Trainium2 を発表しました。 press.aboutamazon.com 左 : Graviton4、右 : Trainium2 Trainium2 の HBMが左側に付いているので、Trainiumとは違います (Trainium は右側に2個付いています) Graviton4 AWS Announces 4th Genera…

2023-11-28

Google TPU v5は存在するのか？

はじめに Googleは、TPU v5e を発表したのはこのブログでも以下のように紹介しました vengineer.hatenablog.com vengineer.hatenablog.com vengineer.hatenablog.com 今日は、v5e ではなく、v5 について、探っていきます。 Google AI生成に聞いてみた以前(1…

2023-11-27

GAFAMがAI Chipに投資し、AI Cloud学習チップのスタートアップはどうなる？

はじめに 6月12日に下記のようなブログを書きました。 vengineer.hatenablog.com この時は、既に一強になっているNVIDIAのGPGPU(H100とかGH200とか)について書きました。今回は、Cloud Service を行っている、Google、AWS、Meta、Microsoft が AI Chip への…

2023-11-26

SOPHGOのRISC-VベースSoC

はじめに Xに下記の投稿が流れてきました。SOPHGOという中国の会社でRISC-VベースのSoCを開発しているようです。 Chinese RISC-V chip maker Sophgo is developing a a server/PC chip using cores from US company SiFive. See a problem there? It is also…

2023-11-25

Xilinx (AMD)の RISC-V なコア？

はじめに XにXilinx(AMD)の RISC-V なコア？が出たと流れてきました。下記の投稿を引用します。ついにAMD (Xilinx)オフィシャルのRISC-V FPGAソフトコアが出たAMD MicroBlaze V Processorhttps://t.co/OSgMrBLwZ4— miya (@parallellafan) 2023年11月3日 AMD…

2023-11-24

Ryzen AI の DMA & NoCs とは？

はじめに Ryzen AIの公式の内部構造は、このブログに6月18日にアップした AMD Ryzen AIは、AMD XDNAにの中にあるスライドのみです。そのスライドを下記に説明のために引用します。このスライドの中の「DMA & NoCs」がどうなっているのかを調べてみました…

2023-11-23

Ryzen AI の AI Engine は 1GHzで動いている

はじめに Ryzen AIの公式の内部構造は、このブログに6月18日にアップした AMD Ryzen AIは、AMD XDNAにの中にあるスライドのみです。そのスライドを下記に説明のために引用します。 AIE Tile が 4 x 5 Memory Tile が 1 x 5 DMA & NoCs が Ryzen AI でそれが…

2023-11-22

AMD Ryzen AIを使うには、IPU Binary を使う。そして、IPU Binary は2種類ある！

はじめに AMD Ryzen AI を使うためのドキュメントを確認してみた。 ryzenai.docs.amd.com 0.9 で preview 版っぽい。基本的には、Python で使う下図を説明のために引用します。 TensorFlow PyTorch ONNX ベースの python で使うもの。 CPU XDNA XDNA が AI…

2023-11-21

AMD Ryzen AIをFPGA(Versal)のAI Engineと同じように使える？

はじめにこのブログで5月に書いた以下の内容についての更新。 vengineer.hatenablog.com いつものように、AMD/Xilinx の github を散歩していたら、mlir-aie の説明の中に Ryzen AI でも FPGA(Versal) の AI Engine が使えるっぽいです。詳細は、ここにUb…

2023-11-20

Microsoft Cobalt 100 を深堀する

はじめに先週発表があった Microsoft Cobalt 100 については、このブログでも 11月17日に取り上げました。 vengineer.hatenablog.com 今回は、Cobalt 100 について、もう少し深堀したいと思います。 Arm Compute Subsystems N2 (CSS N2) の振り返り Arm CC…

2023-11-19

AMD MI300A x 4

はじめに Gigabyte は、AMD MI300A を 4 つ搭載したサーバー G383-R80 を発表しました。 www.youtube.com 空冷のようです。 OAM なものではない下記のように、OAMのようなものを4つ使うのではなく、基板の上に4つの MI300A をソケットで実装するというもの…

2023-11-18

Google/AWS/Microsoft、AIアクセラレータとArmCPU は、x86_64 + GPGPU を駆逐できるだろうか？

はじめに Google は、下記のTPUを発表推論チップ v1 学習チップ v2 学習チップ v3 学習チップ v4 推論チップ v4i 学習・推論チップ v5e AWS は、下記のチップを発表推論チップ Inferentia 学習チップ Trainium 推論チップ Inferentia2 そして、今週、Micro…

2023-11-17

Microsoftも発表。Maia AI Chip & Cobalt CPU

はじめに Microsoftも AI Chip (Maia 100) と CPU (Cobalt 100) を発表しましたね。下記は Microsoft からのMaia AI Chip と Cobalt CPU の発表内容です。 news.microsoft.com Youtube : AI Infrastructure: Satya Nadella at Microsoft Ignite 2023 Google …

2023-11-16

Mediatek Dimesity 9300

はじめに Mediatek Dimensity 9200についてこのブログに書いたのは、2022年11月11日 vengineer.hatenablog.com 1年経って、Mediatek Dimesity 9300 の紹介 Mediatek Dimesity 9300 wccftech.com CPUは、 Cortex-X4 x 1@3.25GHz <= Cortex-X3 x 1 @3.05GHz Co…

2023-11-15

NEXTSILICONという会社

はじめに下記のXの投稿にて、NEXTSILICONなる会社を知りました。 Vanguard Program: @SandiaLabs partners with @NextSilicon & @PenguinSolution to deliver ‘first of its kind’ runtime #reconfigurable #accelerator technology for its next Advanced …

2023-11-14

SynopsysもRISC-V

はじめに SynopsysのARCがRISC-Vベースになったと。 www.eda-express.com ARC-V プレスリリースによると、 32-bit Synopsys ARC-V RMX embedded processor IP (Q2.2024) 32-bit Synopsys ARC-V RHX real-time processor IP (H2.2024) 64-bit Synopsys ARC-V …