Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

2022-04-01から1ヶ月間の記事一覧

2022年4月の映画鑑賞

4月、29本、(内、アマゾンプライムは1本、Youtubeで1本) 3月、28本、(内、アマゾンプライムは3本) 2月、34本 1月、42本、(内、アマゾンプライムは6本) 1月-3月までの合計 : 104本 リトル・シングス (2021) /THE LITTLE THINGS、テンゼル・ワシントン主演(元…

書籍 :「問いかける技術」と「謙虚なリーダーシップ」を読みました

はじめに ずーと、アマゾンのほしい物リストに入れといたエドガー・H・シャインの 問いかける技術 謙虚なリーダーシップ を読みました。 あと一冊、 人を助けるとはどういうことか も読もうと思っています。読み終えたら、ここに追加します。 「問いかける技…

NVIDIA A100/H100 のL2 Cacheについて、再度調べた

はじめに NVIDIA A100にて、L2 Cacheの構成が変わったことは、下記のブログで書きました。 vengineer.hatenablog.com 今回は、L2 Cache のサイズが、P100の4MB、V100の6MBから A100 では 40MB (48MB)、H100 では 50MB (60MB) になって、その利用について調べ…

IPA: Floorplan-Aware SystemC Interconnect Performance Modeling and Generation for HLS-based SoCs

はじめに NVIDIA Research のサイトを眺めていたら、見つけました。 IPA: Floorplan-Aware SystemC Interconnect Performance Modeling and Generation for HLS-based SoCs SystemC ベースの Floorplanを意識したインターコネクト・パフォーマンス・モデルに…

EsperantoのET-SoC-1の評価が始まったようだ

はじめに このブログで Esperanto を取り上げたのが、かなり昔で、2016.12.07です。もう5年以上前です。 vengineer.hatenablog.com CEOはTransmetaのPresident & CEO だった Art Swift さん、Founder and Execute Chairman は Transmeta の Founder and CEO …

NVIDIA GPU、L3 Cacheを投入する?

はじめに NVIDIAのL2 Cacheの構成が GA100(A100)で変わり、GH100(H100)でも同じ構成になっているのは、このブログにもアップしました。 GH100(H100)の次(Blackwell : GB100)になったら、もしかしたら、L3 Cache が投入されるかもしれません。 再度、GPU Doma…

NVIDIAのGPUのL2 Cacheの構成がGA100で変わった?

はじめに NVIDIA A100 から L2 Cache の構成が変わったようです。 L2 Cache の構成 NVIDIA GV100(Volta) の L2 Cache は、下記のようになっています。Volta Architecture WhitepaperのPage 17 から説明のために引用します。 下記のように、6つの GPC に対し…

GeForce用GPUの die size

はじめに GeForce 用GPUの die size を比べてみたいと思います。 GPU Specs Database から色々と比較してみました。 Turing、Ampere、Ada Lovelace Turing : TU102 Ampere : GA102 Ada Lovelace : AD102 がトップラインです。ざっくりな仕様です。 メモリが …

NVIDIA の NVLINK を調べなおしました

はじめに NVIDIAのNVLINK、P100で初めて導入され、V100、A100、H100の転送レートを上げてきています。 そこで、NVLINKとは、何か?を振り返りたいと思います。 NVLINKとは? NVLINKは、P100の時に導入されました。 NVIDIA Tesla P100 White PaperのNVLink Hi…

書籍 : アダム・グラントの Think Again を読みました

はじめに 何気なく、次に読む本をアマゾンで物色していたら、出てきた、アダム・グラントの新作、Think Again を Kindle で買って、読みました。 www.amazon.co.jp あ、アダム・グラントって、誰?。。と Take & Giveの著者です。Take & Giveは、原書のKindl…

NVIDIA Hopper、GH100 ではなく、GH202とは?

はじめに 先日のNVIDIAへのアタックによってリークされた情報の中に、GH202 なるものがあることを知りました。GB100 や GB202 もあるようです。 wccftech.com GH100 は、先日に発表があった H100 のシリコン。GH202 はまだ発表されていませんが、何れ出てく…

NVIDIA Ada Lovelace、その2

はじめに NVIDIA Ada Lovelace については、4.8に書きましたが、die shot 、間違っていました。Turing でした。 vengineer.hatenablog.com SemiAnalysis の記事 semianalysis.substack.com www.youtube.com この記事の中の Ampere (GA10x : Samsung 8N) と A…

AMD 3D V-Cacheで使われているCu-Cu接続とは?

はじめに 昨日の半導体チップ雑談は、「Cache dieの積層」について、お話しました。 毎週日曜日の11:00-12:00に半導体チップに関する雑談をやっています第35回、来週日曜日(4/17)の半導体チップ雑談Cache dieの積層について、グダグダお話したいと思っていま…

書籍「Learn Better」を読みました

はじめに ダニエル・カーネマンの「NOISE」を読み終えたので、何か?読むものないかな?と Amazon を眺めていたら見つけた「Learn Better」。いつものように Kindle 版を買いました Amazon : Learn Better ― 頭の使い方が変わり、学びが深まる6つのステップ …

NVIDIA Grace + A100は、DGX A100に対して、10倍速い?

はじめに 2021年4月の GTC 2021にて発表があったGrace。そのGraceとAmpere NextベースのDGXは、DGX A100の10倍になるという発表がありました。 cloud.watch.impress.co.jp NVIDIAによれば、1兆パラメータという非常に複雑で巨大なAIモデルを利用すると、学習…

Intel Ponte Vecchio の 資料とdie無しパッケージ

はじめに Intel の HPC用GPU、Ponte Vecchio。このブログでも取り上げています。 vengineer.hatenablog.com 新しい資料と写真 HPC User Forum での講演資料:Ponte Vecchio: A Multi-Tile 3D Stacked Processor for Exascale Computing The Huge Endeavor to…

Ampere Computing が IPO ?

はじめに Ampere Computingについては、下記のようにこのブログでも何度か取り上げました。昨日のブログの最後に追記しましたが、どうやら IPOの準備をしているようです。 vengineer.hatenablog.com vengineer.hatenablog.com このツイートで知りました Ampe…

Ampere ComputingのAltra Max搭載のマシンが $3999

はじめに Apple Mac StudioのM1 Ultra版が $3,999ドル(ただし、GPUは48コアです。64コア版は +$1,000)もします。日本では、499,800円です(125円/1ドル?) CPUは20コアですが、8 x 2コア + 2 x 2コアの構成になっているんですよね。ということは、 Ampere Co…

Cacheを積層する、流行り?

はじめに AMDがMilanのCCDの上にL3 Cache silicon dieを積層し、32MB + 64MB の L3 を搭載した Milan-Xなるものを発表しています。 cloud.watch.impress.co.jp この発表を最初に聞いた時、Cacheって積層できるんだと思いました。 Milanには、CCDが8個搭載さ…

AMD EPYC Genoa

はじめに AMD EPYC Genoaの実物写真が色々出てきました。 Genoa は、12 x CCD + IO 下の写真は、AMD EPYC 7004 “Genoa” which has been pictured, features twelve Zen4 chipsetsから説明のために引用しています。かなりモックっぽいですが、 Another AMD EP…

書籍:「NOISE 組織はなぜ判断を誤るのか?」を読みました

はじめに ダニエル・カーネマンの前作、ファスト&スローのKindle版を購入したのは、2013年8月でした。あれ、そのころからKindle使っていたんだ。。 現在のKindle版の価格は752円+752円です。確かその頃は、文庫じゃなかったので、もっと高かった気がします…

NVIDIA GPU : Ada Lovelace

はじめに NVIDIAのコンシューマー用GPU、Ada Lovelace (GeForce RTX 4000シリーズ) wccftech.com AD102 AD102 が Ampere の GA102 に相当する。 AD102 : RTX 4090/4080、144 SM、GDDR7 下記の記事では、H100の die shot というものが掲載されています。 www.…

Armv9なスマホ用SoC

はじめに ArmがArmv9のCPUコア、X2、A710、A510をアナウンスしたのが、2021年5月 news.mynavi.jp これら、Armv9なCPUコアを搭載したスマホ用SoCとしては、 Qualcomm Snapdragon 8 Gen1 Samsung Exynos2200 Mediatek Dimensity 9000 Qualcomm Snapdragin 8 G…

QualcommのCloud AI100は、終了?

はじめに Twitterに流れてきたこのツイート Qualcommの推論用チップ、Cloud AI100がMetaのシステム内で使われていないようです。 This is why the AI100 has disappeared from $QCOM's presentations.Great hardware doesn't matter much without the softwa…

AMDがDPUの会社 (Pensando) を買収

はじめに AMDがDPUのPensandoを買収したようです。 Pensandoという会社知らなかったです。 Pensando この記事に詳しく書いてあります。 www.servethehome.com この記事の中の下図(Hotchipsでのビデオのシーンのようです)を説明のために引用します。 2018 : 1…

Intelの iGPU、intel ARC A-Series

はじめに ntel の iGPU、intel ARC A-Series 上記の図は、説明のために下記のYoutubeの2:10のところをキャプチャしたものです。 www.youtube.com intel ARC A-Series : codename Alchemist ACM-G10 Xe-core : 32 Ray Tracing Units : 32 L2 Cache : 16MB GDD…

AMD、NVIDIA、IntelのGPUの比較

はじめに コンシューマー用のGPU、AMD、NVIDIA、Intelの比較したグラフがTwitterにアップされました。 GPU manufacturing comparison - die size, transistor count and transistor density of current Gen AMD, NVIDIA and Intel GPUs. pic.twitter.com/C1P…

NVIDIA DGX Station

はじめに NVIDIA の DGX Station 、A100を使ったのは、DGX station A100。データシートは、こちら。 説明のために、システム仕様のところを画像として引用します。 消費電力は、1.5kW 。A100 SMX だと、400Wです。4個で1600Wなり、1.5kW 超えます。CPU(AMD E…