2024-01-01から1ヶ月間の記事一覧
はじめに いつものように、Xilinx (AMD) の github を散歩していたら、mlir-aie の中に、 AIE Flows and Routing なるものを見つけました。 AIE Flows and Routing github.com MLIR の Dialect として、 AIE Tile Routing %t71 = AIE.tile(7, 1) // (Column,…
1月の映画鑑賞 : 24本 見えざる手のある風景 (2023) / LANDSCAPE WITH INVISIBLE HAND アウトフィット (2022) / THE OUTFIT バーバリアン (2022) / BARBARIAN パイプライン (2021) / PIPELINE フォーガットン (2004) / THE FORGOTTEN ルーム・フォー・レント…
はじめに AMD XDNA Driver for Linux を覗いてみる (その2) 昨日の続き、今回は、PSP の部分を見ていきます。 amdxdna_psp psp_load_firmware から。PSPのFirmware をロードする部分 ret = request_firmware(&fw, psp->conf.fw_path, psp->dev); 標準の requ…
はじめに このブログでも何度か取り上げた、AMD XDNA (Xilinx AI Engine) 。その Linux の driver が github に公開されました。 github.com 今回は、github の中をさっくり、覗いてみます。 どんな構成 Introduction に下記のような記載があります。 This r…
はじめに 映画や書籍について、個別でブログに書きますが、音楽については書いたことがありません。 今回、書こうと思ったのは、PV(MV)が凄く良かったからです。 chilldspot の「愛哀」 chilldspot Youtube Premium に課金してから、色々なアーチストの曲を…
はじめに スティーブン・キングの新作(日本語訳という意味で)の「異能機関」をひとり読書会で読み終えました。 Doctor Sleepのことを書いたのが1月1日。 vengineer.hatenablog.com 4週間でしたね。 上 : 478ページ 下 : 486ページ 原題(The Institute)は、20…
はじめに ルネサスのDRPはかなり前からあるのは知っているのですが、どのDRPがAIに対応していたのは最近知りました。 で、このブログで DRP を取り上げていたかな?と思い、検索してみたら、なんと、2020年9月30日に、DRP-AI について書いていました。。*1 v…
はじめに XのTLに下記のような投稿が流れてきました。投稿者は、Raja -san ですね。 XeTile and XeGPU MLIR dialects. Good to see..https://t.co/ofbKtKftnZ— Raja Koduri (@RajaXg) 2023年11月30日 intel GPU の MLIR拡張のようです。 github.com 対象は?…
はじめに ちょっと前に、NVIDIAの地域別の売上をまとめていて、あれ、何で、Taiwan の売上、こんなに多いの?という疑問がありました。 先日、雑談をしていた時に、その理由が分かったので、メモとしてブログに残します。 地域別売上 まずは、値から 棒グラ…
はじめに MobileyeがCES2024にて、EyeQ 7Hを発表しました。 Youtube : Mobileye: Now. Next. Beyond. CES 2024 Press Conference with Prof. Amnon Shashua EyeQ 7H 下記のXの投稿の写真によると、 既に量産中の EyeQ 5H、来年(2025年)量産の今はサンプル中…
はじめに Windows 11がリリースされたのが 2021年10月5日。その前のWindows 10がリリースされたのが 2015年7月29日。Windows 10 => Windows 11 で約6年。 Windows 12が出るという話(2024年6月)になっていますが、まだ3年も経っていません。 Windows 12 のハ…
はじめに NVIDIA B100 がGTC2024年で発表があると思うのですが、では実際に量産されるのはいつかを妄想しました。 TSMCの量産時期 N3の量産(2022.Q4, 12月末) N3Eの量産(2023.Q4) N3(N3B) を使うことはないので、N3Eと考えると、量産開始が 2023.Q4。 Apple…
はじめに TSMCの先端プロセスは、AppleのiPhoneのリリース時期にあうように量産されているようにみえます。 今回は、AppleのAx(iPhone)/Mx(Mac)の発表時期とTSMCの先端プロセスの量産時期を見てみます。 AppleのAx(iPhone)/Mx(Mac)の発表時期 iPhone 12/A14 …
はじめに いつものように、AMD/Xilinx の github を散歩していたら、MLIRのスライドを見つけました。 FCCM 2023 Workshop - Leveraging MLIR to Design for AI Engines ISFPGA 2023 Workshop - Leveraging MLIR to Design for AI Engines 基本的には同じ。 M…
はじめに 下記の記事によると、LGA7529 Socket な Sierra Forest があるようです。 www.servethehome.com 1ソケットな Sierra Forest ボード 下記の写真は、上記の記事からです。説明のために引用します。 説明文として、 As we can see, there are 11x MCIO…
はじめに Kindleにて、Stephen King の The Shining Doctor Sleep を下記のように連続読みしました。 vengineer.hatenablog.com vengineer.hatenablog.com 映画 続けて、Amazon Prime Video にて、 The Shining Doctor Sleep を連続鑑賞しました。 The Shini…
はじめに Xの投稿にIntel Lunar LakeのPackgeが流れてきました。 The colleagues from @ComputerBase got a nice shot of that Lunar Lake package. But is that three tiles or is one of the separations just not visible? pic.twitter.com/Ef5tDm3ags— A…
はじめに 前工程の TSMC の売上は調べてみましたので、今回は 後工程 (OSAT) の トップ 2 の ASE と Amkor の売上を調べてみました。 対象は、2020.Q1 - 2023.Q3 です。 Amkor の IR ここからデータをまとめてみました。売上はUS B$です。 ASE の IR ここか…
はじめに 明日、TSMCのQ4.2023の決算発表があるようなので、今までのIRを振り返ってみたいと思います。 今回は、2018.Q1 - 2023.Q3 です。 売上 売上の推移です。単位は、ここでは、US B$ です。2022.Q3が最高で、$20.23B です。そこから、2023年は2024より…
はじめに 下記の記事にて、Intel Xeon Emerald Rapids/Sapphire Rapids と AMD Genoa のお値段が出ていたので記録に残します。 www.tomshardware.com Emerald Rapids は、Genoa に対抗して、Sapphire Rapids よりもかなりお安い? Genoa 9654 : 96コア、$11.…
はじめに Super computer の Frontier (MI250X) で LLM を学習した結果が出てきたようなので見てみます。 arxiv.org 175B Model となんと、1T Model Super computer なので、GPUがいっぱいあります。なので、本当にでっかいモデルも学習できます。この論文で…
はじめに 生成AIバブルがもう1年も続いていますが、Ampere ComputingがIPOの準備をしたという情報が2022年4月に出てきて、その時書いたブログが下記のものです。 vengineer.hatenablog.com この時は、Oracle が $300M 出資したということまではわかりました…
はじめに たまたま、TwitterのTLに、下記のツイートからPete Warden -san どうしているのかな?とLinkedinで調べたら、Googleを辞めて、Useful Sensors という会社を始めていたので、記録として残します。 "The one aspect I was overly optimistic about wa…
はじめに NVIDIA GH200の ZeRO-Inference のベンチマーク値が出てきたので見てみます。 lambdalabs.com ZeRO- Inference とは、 www.deepspeed.ai GH200 vs H100-80GB vs A100-80GB 下図は上記の記事から説明のために引用します。 Bloom 126b inference Perf…
はじめに Intel Habana Gaudi 2 と NVIDIA A100 の比較について、昨日のブログに書きました。 vengineer.hatenablog.com 計算機のBF16/FP16のFLOPsやPackage間での転送帯域には大きな違いがないのに、A100の方が速いよねと。 そこで、NVIDIA A100/H100, AMD …
はじめに 昨日、 Gaudi2 のコスパについてみてみました。今日は、Gaudi2 と A100 の性能比較をもうちょっとしてみます。 Gaudi2 : BF16=400 TFLOP/s, HBM=96GB, 2450GB/s (4.166) A100 : BF16=312 TFLOP/s, HBM=80GB, 2039GB/s (3.9) メモリ帯域とメモリ容量…
はじめに AI学習用/推論用チップとしてのコスパについては、Google TPU v5e と AWS Trainium/Inferentia2 を比較したものをこのブログでも2023年12月4日に取り上げました。 vengineer.hatenablog.com TPU v5p が出たので、v5e は推論用という位置づけになる…
はじめに ダニエル・ピンクの新作、「THE POWER OF REGRET 振り返るからこそ、前に進める」を読みました。発売日は、2023/12/6。 英語版は、The Power of Regret: How Looking Backward Moves Us Forward。発売日は、2022/2/1 英語版が出てから、1年10か月も…
はじめに 昨日の半導体チップ雑談でAppleの話になり、日本でも半導体開発やっているよ。ということになり、Apple Japan での職を確認してみました。 無くなると思いますの、スクリーンショットしておきます。 Kanagawaの職 New Product Introduction (NPI) E…
はじめに Google Pixel 8 の SoC (G3) の Edge TPU は 2個というのは、下記のブログで紹介しました。 vengineer.hatenablog.com 今回は、デバイスドライバをもう少し掘ってみたので、2個である証拠が見つかりましたので、記録として残します。 リセット関係 …