Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

2023-01-01から1年間の記事一覧

HPE の NVIDIA GH200のblade : HPE Cray EX254n

はじめに LinkedInを散歩していたら、HPEのNVIDIA GH200が8基搭載された 1Uサーバーの写真が載っていたので、記録として残します。 HPE GH200 1U サーバー 下記のLinkedinの投稿です。 www.linkedin.com 記録のために、写真を引用します。 HPEのサーバーなの…

MicrosoftのOlive Quantizer

はじめに MicrosoftのOlive Quantizer github は、ここにあります。 accelerator もあった olive/hardware に、accelerator.py なるものがありました。 この中で、 class AcceleratorLookup: EXECUTION_PROVIDERS: ClassVar[dict] = { "cpu": ["CPUExecution…

AmpereOneのL1-I Cacheが小さいぞ!

はじめに AmpereOneのProduct Briefを見て、気が付いたこと。L1 Cacheのサイズが小さいこと。 L2: 2 MB per Core L1: 16 KB Instruction and 64 KB Data per Core 何故? Altra Max を振り返る Altra MaxのDataSheetを見たら、 128 Arm® v8.2+ 64-bit CPU co…

NVIDIA GH200 NVL32って、お幾らなんだろうか?

はじめに GraceベースのDGXを妄想したのが、2022年3月27日 vengineer.hatenablog.com あれから、1年8か月。NVIDIAは、Grace-Hopperベースの NVIDIA GH200 NVL32 を発表 developer.nvidia.com NVIDIA GH200 NVL32 NVIDIA GH200 NVL32 は、Grace-Hopperである…

Xerox Alto のお話

はじめに このブログを読んでいただいている方で、Xerox Alto の実物を見たことがあるのは多くは居ないと思います。あたしは動いたものは見たことないですが、数年間通勤時に2回見ていました(見ていましたというより、途中に置いてあるということです)。 下…

Metaは、RISC-Vで攻めてくる?

はじめに RISC-V SUMMIT のビデオが11月30日に公開されました。 その中に、Metaの Keynote: Building Data Center Scale SoC's using RISC-V at Meta - Prahlad Venkatapuram では、 Video 処理ASIC (MSVP : Mea's Scalable Video Processor) AIアクセラレー…

Google TPU v5e と AWS Trainium の比較

はじめに Microsoft が Maia 100 を発表し、来年にサービスインすることで、3大 Cloud Service Google AWS Microsoft にて、AIアクセラレータを利用できるようになります。 今回は、既にサービスを行っている Google TPU v5e AWS Trainium/Inferentia2 につ…

Intel FPGA Runtime for OpenCL Software Technology の HAL部分のコードを覗いてみた

はじめに Intel FPGA Runtime for OpenCL Software Technologyは、下記のようび github に公開されています。 github.com 最近、HAL (レジスタ部分)が公開されたので、みてみます。 HAL 部分を眺める 今回更新されたHALの部分は、 include/acl_hal_mmd.h で…

AWS Trainium の SRAMは、Scratch Padとして使うと。

はじめに AWS Trainium 内には、2つのNeuronCorev2 があり、各NeuronCorev2には On-chip SRAM Memory が載っています。このSRAMをどのように使っているのかがわかりました。 OpenXLAの講演ビデオ (AWS) Innovating with XLA for the Neuron compiler for AWS…

HBM4をGPU dieの上に積む?

はじめに HBM4の情報がXのTLに流れてきました。下記の投稿を説明のために引用します。 From HBM4, we will witness a historic moment when the roles and influences of memory, system, fabless, and foundry will be reversed. According to a report by …

11月の映画鑑賞

11月の映画鑑賞 : 27本 10月の映画鑑賞 : 20本 9月の映画鑑賞 : 22本 8月の映画鑑賞 : 24本 7月の映画鑑賞 : 25本 6月の映画鑑賞 : 20本 5月の映画鑑賞 : 29本 4月の映画鑑賞 : 20本 3月の映画鑑賞 : 27本 2月の映画鑑賞 : 17本 1月の映画鑑賞 : 20本 2007年…

Xilinx AI Engine Runtime

はじめに いつものように github をぶらついていたら、AMD のサイトで AI Engine Runtime なるものが公開されているのを知りました。 github.com AIE Driver(driver) AIE Driver is a userspace library that provides hardware access to applications. AIE…

AWS : Graviton4 / Trainium2 を発表

はじめに AWS が Graviton 4 / Trainium2 を発表しました。 press.aboutamazon.com 左 : Graviton4、右 : Trainium2 Trainium2 の HBMが左側に付いているので、Trainiumとは違います (Trainium は右側に2個付いています) Graviton4 AWS Announces 4th Genera…

Google TPU v5は存在するのか?

はじめに Googleは、TPU v5e を発表したのはこのブログでも以下のように紹介しました vengineer.hatenablog.com vengineer.hatenablog.com vengineer.hatenablog.com 今日は、v5e ではなく、v5 について、探っていきます。 Google AI生成に聞いてみた 以前(1…

GAFAMがAI Chipに投資し、AI Cloud学習チップのスタートアップはどうなる?

はじめに 6月12日に下記のようなブログを書きました。 vengineer.hatenablog.com この時は、既に一強になっているNVIDIAのGPGPU(H100とかGH200とか)について書きました。 今回は、Cloud Service を行っている、Google、AWS、Meta、Microsoft が AI Chip への…

SOPHGOのRISC-VベースSoC

はじめに Xに下記の投稿が流れてきました。SOPHGOという中国の会社でRISC-VベースのSoCを開発しているようです。 Chinese RISC-V chip maker Sophgo is developing a a server/PC chip using cores from US company SiFive. See a problem there? It is also…

Xilinx (AMD)の RISC-V なコア?

はじめに XにXilinx(AMD)の RISC-V なコア?が出たと流れてきました。下記の投稿を引用します。 ついにAMD (Xilinx)オフィシャルのRISC-V FPGAソフトコアが出たAMD MicroBlaze V Processorhttps://t.co/OSgMrBLwZ4— miya (@parallellafan) 2023年11月3日 AMD…

Ryzen AI の DMA & NoCs とは?

はじめに Ryzen AIの公式の内部構造は、このブログに6月18日にアップした AMD Ryzen AIは、AMD XDNAに の中にあるスライドのみです。そのスライドを下記に説明のために引用します。 このスライドの中の 「DMA & NoCs」がどうなっているのかを調べてみました…

Ryzen AI の AI Engine は 1GHzで動いている

はじめに Ryzen AIの公式の内部構造は、このブログに6月18日にアップした AMD Ryzen AIは、AMD XDNAに の中にあるスライドのみです。そのスライドを下記に説明のために引用します。 AIE Tile が 4 x 5 Memory Tile が 1 x 5 DMA & NoCs が Ryzen AI でそれが…

AMD Ryzen AIを使うには、IPU Binary を使う。そして、IPU Binary は2種類ある!

はじめに AMD Ryzen AI を使うためのドキュメントを確認してみた。 ryzenai.docs.amd.com 0.9 で preview 版っぽい。 基本的には、Python で使う 下図を説明のために引用します。 TensorFlow PyTorch ONNX ベースの python で使うもの。 CPU XDNA XDNA が AI…

AMD Ryzen AIをFPGA(Versal)のAI Engineと同じように使える?

はじめに このブログで5月に書いた以下の内容についての更新。 vengineer.hatenablog.com いつものように、AMD/Xilinx の github を散歩していたら、mlir-aie の説明の中に Ryzen AI でも FPGA(Versal) の AI Engine が使えるっぽいです。 詳細は、ここ にUb…

Microsoft Cobalt 100 を深堀する

はじめに 先週発表があった Microsoft Cobalt 100 については、このブログでも 11月17日に 取り上げました。 vengineer.hatenablog.com 今回は、Cobalt 100 について、もう少し深堀したいと思います。 Arm Compute Subsystems N2 (CSS N2) の振り返り Arm CC…

AMD MI300A x 4

はじめに Gigabyte は、AMD MI300A を 4 つ搭載したサーバー G383-R80 を発表しました。 www.youtube.com 空冷のようです。 OAM なものではない 下記のように、OAMのようなものを4つ使うのではなく、基板の上に4つの MI300A をソケットで実装するというもの…

Google/AWS/Microsoft、AIアクセラレータとArmCPU は、x86_64 + GPGPU を駆逐できるだろうか?

はじめに Google は、下記のTPUを発表 推論チップ v1 学習チップ v2 学習チップ v3 学習チップ v4 推論チップ v4i 学習・推論チップ v5e AWS は、下記のチップを発表 推論チップ Inferentia 学習チップ Trainium 推論チップ Inferentia2 そして、今週、Micro…

Microsoftも発表。Maia AI Chip & Cobalt CPU

はじめに Microsoftも AI Chip (Maia 100) と CPU (Cobalt 100) を発表しましたね。下記は Microsoft からのMaia AI Chip と Cobalt CPU の発表内容です。 news.microsoft.com Youtube : AI Infrastructure: Satya Nadella at Microsoft Ignite 2023 Google …

Mediatek Dimesity 9300

はじめに Mediatek Dimensity 9200についてこのブログに書いたのは、2022年11月11日 vengineer.hatenablog.com 1年経って、Mediatek Dimesity 9300 の紹介 Mediatek Dimesity 9300 wccftech.com CPUは、 Cortex-X4 x 1@3.25GHz <= Cortex-X3 x 1 @3.05GHz Co…

NEXTSILICONという会社

はじめに 下記のXの投稿にて、NEXTSILICONなる会社を知りました。 Vanguard Program: @SandiaLabs partners with @NextSilicon & @PenguinSolution to deliver ‘first of its kind’ runtime #reconfigurable #accelerator technology for its next Advanced …

SynopsysもRISC-V

はじめに SynopsysのARCがRISC-Vベースになったと。 www.eda-express.com ARC-V プレスリリースによると、 32-bit Synopsys ARC-V RMX embedded processor IP (Q2.2024) 32-bit Synopsys ARC-V RHX real-time processor IP (H2.2024) 64-bit Synopsys ARC-V …

NVIDIA H200を発表

はじめに NVIDIAがSC23にて、H200を発表しました。 www.youtube.com 上記のビデオでは、Ian Buck さん (Vice President of Hyperscale and HPC) が説明をしています。 NVIDIAのサイトにも H200 が載っていますね。 www.nvidia.com H200 H200 は、メモリHB3e…

NVIDIAのH20/L20 PCIe/L2 PCIeとは?

はじめに NVIDIAが H20 L20 PCI L2 PCI なるプロダクトを発表しました。 どうやら、A800/H800が売れなくなったので、その代わりに出すっポイです。 H20, L20 PCeI, L2 PCIe とは? 下記のXの投稿がわかりやすかった。 .@Nvidia is prepping three new #GPUs …