2023-12-01から1ヶ月間の記事一覧
はじめに LinkedInを散歩していたら、HPEのNVIDIA GH200が8基搭載された 1Uサーバーの写真が載っていたので、記録として残します。 HPE GH200 1U サーバー 下記のLinkedinの投稿です。 www.linkedin.com 記録のために、写真を引用します。 HPEのサーバーなの…
はじめに MicrosoftのOlive Quantizer github は、ここにあります。 accelerator もあった olive/hardware に、accelerator.py なるものがありました。 この中で、 class AcceleratorLookup: EXECUTION_PROVIDERS: ClassVar[dict] = { "cpu": ["CPUExecution…
はじめに AmpereOneのProduct Briefを見て、気が付いたこと。L1 Cacheのサイズが小さいこと。 L2: 2 MB per Core L1: 16 KB Instruction and 64 KB Data per Core 何故? Altra Max を振り返る Altra MaxのDataSheetを見たら、 128 Arm® v8.2+ 64-bit CPU co…
はじめに GraceベースのDGXを妄想したのが、2022年3月27日 vengineer.hatenablog.com あれから、1年8か月。NVIDIAは、Grace-Hopperベースの NVIDIA GH200 NVL32 を発表 developer.nvidia.com NVIDIA GH200 NVL32 NVIDIA GH200 NVL32 は、Grace-Hopperである…
はじめに このブログを読んでいただいている方で、Xerox Alto の実物を見たことがあるのは多くは居ないと思います。あたしは動いたものは見たことないですが、数年間通勤時に2回見ていました(見ていましたというより、途中に置いてあるということです)。 下…
はじめに RISC-V SUMMIT のビデオが11月30日に公開されました。 その中に、Metaの Keynote: Building Data Center Scale SoC's using RISC-V at Meta - Prahlad Venkatapuram では、 Video 処理ASIC (MSVP : Mea's Scalable Video Processor) AIアクセラレー…
はじめに Microsoft が Maia 100 を発表し、来年にサービスインすることで、3大 Cloud Service Google AWS Microsoft にて、AIアクセラレータを利用できるようになります。 今回は、既にサービスを行っている Google TPU v5e AWS Trainium/Inferentia2 につ…
はじめに Intel FPGA Runtime for OpenCL Software Technologyは、下記のようび github に公開されています。 github.com 最近、HAL (レジスタ部分)が公開されたので、みてみます。 HAL 部分を眺める 今回更新されたHALの部分は、 include/acl_hal_mmd.h で…
はじめに AWS Trainium 内には、2つのNeuronCorev2 があり、各NeuronCorev2には On-chip SRAM Memory が載っています。このSRAMをどのように使っているのかがわかりました。 OpenXLAの講演ビデオ (AWS) Innovating with XLA for the Neuron compiler for AWS…
はじめに HBM4の情報がXのTLに流れてきました。下記の投稿を説明のために引用します。 From HBM4, we will witness a historic moment when the roles and influences of memory, system, fabless, and foundry will be reversed. According to a report by …