Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

2023-08-01から1ヶ月間の記事一覧

Google TPU v5e の構成と性能

はじめに 昨日、Google TPU v5e に関するブログを書きました。 vengineer.hatenablog.com その中で、v5e では、Multislice Technology なるものが出てきました。 Googleは、これについて、Overview を公開していました。 Cloud TPU Multislice Overview [Pub…

Intel GPU (Ponte Vecchio) の die ?

はじめに XのTLに流れてきた下記のツイート。Intel GPU (Ponte Vecchio) の die っぽいです。 The base tile of Ponte Vecchio. They put eight Compute Tiles and four times Rambo Cache (the middle lines) on there.Another shot with the Compute Tiles…

2023年8月の映画鑑賞

8月の映画鑑賞 : 24本 7月の映画鑑賞 : 25本 6月の映画鑑賞 : 20本 5月の映画鑑賞 : 29本 4月の映画鑑賞 : 20本 3月の映画鑑賞 : 27本 2月の映画鑑賞 : 17本 1月の映画鑑賞 : 20本 2007年3月から2022年12月まで : 3348本 + 2023年1月から8月まで : 182本 = 3…

Googe TPU v5e 発表

はじめに Google Cloud Next '23 にて、Google が TPU v5e を発表しました。 www.youtube.com Efficient (Per/$ vs. TPU v4) 2X training 2.5x inference Scalable 10s of Ks of chips (Multislice technology) ほんのちょことしかなかったですが、下記のブ…

Esperanto Technologies が recommendation から HPC/LLMs に pivot ?

はじめに このブログでも何度も取り上げている Esperanto Technologies 。下記の eetimes の Sally -san の記事によると、recommendation から HPC/LLMs に pivot したと。 www.eetimes.com Esperanto Technologies は、recommendation をターゲットにしてい…

AMD の IRを眺めてみたら、Xilinxの売上を除くと売上減かな?

はじめに AMD の IR (Q2.21 - Q2.23) のカテゴリ別 Data Center Client Gaming Embedded を覗いてみました。 全体の推移 下記が Q2.21 - Q2.23 のカテゴリ別および4カテゴリ合計のグラフです。Q2.22 がピークで下がっています。 下がっているのは、どうやら …

Mediatekの月度売上が2020年に近づいてきた

はじめに MediaTekの売上が2021年度の同月を下回ってきたというブログを書いたのが 2022.12.13。 vengineer.hatenablog.com あれから8か月。データのアップデートをしました。 2022.12 - 2023.7 を追加 2023.3は、2021.3よりちょっと上ですが、それ以外は 20…

Androidの Page size を 16KB に!

はじめに XのTLに流れてきた下記の投稿。ツイートなんだけど、画像がうまく使われていて、なんか記事を読んでいるみたいです。 Google is working on a new developer option in Android that will swap out your device's Linux kernel with one that uses …

OpenHW GroupのCORE-V MCU DevKit

はじめに OpenHW Group から RISC-V MUC の "CORE-V MCU DevKit" 用のチップをテープアウトしたよと、アナウンスがありました。 www.openhwgroup.org CORE-V MCU DevKit CORE-V MUC は、 GlobalFoundries’ proprietary 22FDX® process technology CV32E40P c…

AMD (Xilinx) が Mipsology(Zebra)をお買い上げ

はじめに このブログでも3回、とりあげている Mipsology (Zebra) を AMD (たぶん、旧Xilinx)がお買い上げしました。 community.amd.com Mipsology AI Inference用として、Xilinxと仲良くしていた Mipsology 、プロダクト名 Zebra を AMD が取り込む感じです…

AWS Trainium / Inferentia2 の NeuronCove-v2のGPSIMD Engine って、何?

はじめに AWS Trainium / Inferentia2 の NeuronCore-v2 に入った、GPSIMD Engine。 図を見ると、3個ぐらい入っているのですが、これ、何でしょうか? 下図はAWSのサイトから持ってきました。説明のために引用します。 AWS Neuron Documention の中を探って…

Supercomputer Aurora のノードの中のブロック図

はじめに XにSupercomputer Auroraに関する情報が流れてきました。 ICYMI: Preparing for #Exascale on #Aurora @argonne@IXPUG1 Webinar by Scott Parker @argonne_lcf Aug 10 2023o Aurora Overviewo Preparing Applicationso Early performance resultsSl…

AWS Trainium/Inferentia2のNeuronLink-v2には、Collective Communicationが入っている

はじめに AWSのTrainium と Inferentia2には、NeutronLink-v2というチップ間を接続する機能が入っているということは、このブログでも紹介しました。 その NeuronLink-v2 には、Collective Communication が入っているというこの今回のお話。 Neuron Collect…

Groq の Language Processing Unitって、なんだ?

はじめに Groq が The Language Processing Unit なるものを発表しました。 futurumgroup.com Groqのプレスリリースは、こちら www.prnewswire.com The Language Processing Unit (LPU) 上記の記事によると、 LLM Llama-2 70B を1秒あたり100トークン以上の…

432 Core な RISC-V Chip、Occamyが上がってきた模様

はじめに XのTLに、Occamyが上がってきたという投稿が流れてきました。下記の投稿を説明のために引用します。 Live from PULP, you are witnessing the unboxing of Occamy by @LucaBeniniZhFe. Our 432-core Multi-TFLOPs RISC-V-Based 2.5D Chiplet System…

Tier IVのSoC (AX91101) の Real-Time Many-Core Processors 部分を掘ってみた

はじめに XのTLに流れてきた、Tier IVの Kato -san の投稿 当時の仲間たちとチームを再結成し、新しく開発したチップがこちらです。試作ですが、これから5年間かけて量産していきます。https://t.co/gXvrEh0n5R https://t.co/fM3Wx8cr50 pic.twitter.com/wDK…

Tier IVのチップの運用が始まったポイ

はじめに 昨年の9月に Tier IV のチップが上がってきたことはこのブログでも取り上げました。 vengineer.hatenablog.com そのチップを使ったシステムの運用が始まったようです。 medium.com チップの型番 上記の記事からチップの型番は、AX91101 っぽいです…

NVIDIAのGPUだけが売れるのは?何故?

はじめに NVIDIAのGPUの件、H100が売り切れ、A800も売れている、ということをこのブログで取り上げました。 では何故?NVIDIAのGPUだけが売れるのか? それは、NVIDIAが長年作り上げてきたエコシステムがあるからです。特に、2006年11月発表があり、2007年7…

NVIDIA RTX50 が CB20X になるんだ。

はじめに NVIDIAのRTX 40 (Ada Lovelace) の次のGPUである RTX 50は、CB20Xになるようです。 videocardz.com GB202, GB203, GB205, GB206, GB207 上記の記事の内容では、 GB202, GB203, GB205, GB206, GB207 とあるので、コンシューマー向けのGPUになってい…

AWS Inferentia2 (推論用チップ)って、Trainium (学習用チップ)とほぼ同じ

はじめに 先週、AWS Trainiumの実物、ということでブログを書きましたが、推論チップの Inferentia2 が Trainium とほぼ同じような構成でした。 Trainium Inferentia2 上記のサイトからそれぞれの絵を説明のために引用します。違いは、NeuronLink-v2の本数だ…

AWS Trainium の 実物が公開されたかな?

はじめに AWSがAI学習用チップである Trainium を発表したのが、AWS re:Invent 2020 のこと 2022年10月12日の技術ブログ、 独自設計チップ AWS Trainium 搭載 Amazon EC2 Trn1 インスタンスで ML トレーニングを高速実行(基礎編) によると、チップには HBM…

NVIDIA H100ではなく、A800も売れている

はじめに Xに流れてきた、下記の投稿の記事。 #China's largest web and cloud providers are lining up to buy as many @Nvidia #GPUs as they can Alibaba, Baidu, ByteDance, and Tencent ordered 100,000 #A800 GPUs worth ~$1B and another $4B worth o…

書籍 : 11/22/63

はじめに スティーブン・キングの 11/22/63 を読み終えました。 7/27 - 8/12 です。8/11 - 8/12 で一気に 最後の 1/3 ぐらいを読みました。 スティーブン・キング11/22/63ひとり読書会終了かなり良かった次は The Stand(全5巻)2000頁ぐらいかな https://t.co…

NVIDIA H100が売り切れ!

はじめに 昨年後半のChatGPTに始まった生成AIブームというかバブルの影響でNVIDIAのGPUが売り切れというお話。 www.barrons.com H100は、Q1.2024/Q2.2024 まで買えない 上記の記事によると、H100は、Q1.2024/Q2.2024 まで買えない、ということです。 vengine…

Bluespec Systemverilog の bluetcl を使ってみる

はじめに Bluespec SystemVerilog の中に、bluetcl なる tcl インタプリタがあります。今回は、この bluetcl を使ってみようと思います。 bluetcl を使うことでインタラクティブにシミュレーションを進めることができるようです。 例題 例題 (examples/smoke…

PCI Express 5.0/6.0 Cabling Specifications、7.0、PCIe Optical Workgroup

はじめに PCI Express 、現在は 5.0 ですが、数年すると、6.0 になります。 7.0 の Specification の策定をしています。 www.businesswire.com 6.0では、64Gbps (32Gbps-PAM4) です。7.0では 128Gbps (64Gbps-PAM4) です。 5.0 をサポートする、Intel Sapphi…

NVIDIA GRACEのLinux Kernelでは、64K PAGE SIZEをサポート

はじめに NVIDIAの Grace 用の Linux Kernel 、github にあります。 64K PAGE SIZE ちょっと散策していたら、64K PAGE SIZE をサポートするように、defconfig が修正されていました。 CONFIG_ARCH_VISCONTI=y CONFIG_ARCH_XGENE=y CONFIG_ARCH_ZYNQMP=y CONF…

NVIDIA EGMってなんだ!

はじめに いつものように、github を散策していたら、NVIDIAの open-gpu-kernel-modules の中に EGM なるものがあることを知りました。 EGM とは? ここに、説明がありました。 #define ADDR_EGM 7 // Extended GPU Memory (EGM) EGM == Extended GPU Memory…

自分の時間を見直そう!

はじめに 先日、下記のようなことをXに投稿しました。(Twitterにツイートしました) 多くのひとは毎日時間が無いと嘆いていると思いますどうすれば時間を作り出すか1. 毎日24時間1週間、何に時間を使っているかを記録する2. 記録したものを分類し、絶対に必要…

NVIDIA GH180とTH500とは?

はじめに NVIDIAがGrace Hopper Superchipを GH200 として発表したことはこのブログでもお知らせしています。 vengineer.hatenablog.com いつものように、github を散策していたら、GH180なるものを見つけました。 上記のブログでは、GH180 == TH500 (Grace)…