Vengineerの妄想

人生を妄想しています。

Hot Chips 2024 での Tenstorrent Blackhole の発表内容から復習する

はじめに Hot Chips 2024 にて、TenstorrentのBlackholeの詳細が公開されました。下記の記事をベースに気になったとこを復習したいと思います。 www.servethehome.com 下記の図は、上記の記事から説明のために引用します。 Blackhole のレイアウト 下図からB…

Tenstorrent Blackhole の PCIe / NoC について妄想する

はじめに Tenstorrent Blackhole は、PCIe Gen5 x32 になっていることは、下記のブログに書きました。 vengineer.hatenablog.com ブログにも書きましたが、Blackholeの評価ボードには、 PCIe Gen5 x16 の スロットが2個 PCIe Gen5 x16 Edge M.2 PCIe Gen5 x8…

Groq の V2-LPUを妄想する

はじめに Groq の V2-LPU が2025年に出てくるということですが、どんな構成になるのかを妄想します。 それでは、 Let's 妄想 DDR/LPDDR あるの? この職 (Post Silicon Validation Lead) に、C2C, PCIe, CXL, DDRx, LPDDR controller/chips という記述があり…

NVIDIA Blackwell NVL72 の中身

はじめに 8月25日から HotChips が始まって、XにNVIDIA Blackwell NVL72の各Trayの中身の写真が流れてきましたので、記録に残します。 下記のXの投稿内の記事は、NVIDIA Blackwell Platfowmを発表したときのものです。 $NVDA 將參加 8/25/8/27 在 Stanford U…

Google G4 の TPUは、G3 と同じ!

はじめに Google G4搭載の Pixel 9 シリーズが発売されました。これに伴い、Zuma Pro (G4搭載機)の Android の Kernel 等のソースコードが公開されました。 今回は、そのソースコードを覗いてみます。 Google G4 は、Zuma Pro ここを見ると、 zuma zumapro …

過去を振り返る会 : C++言語について、

はじめに 土曜日は、過去を振り返る会ということで、今回は、C++言語について、 初めてのC++ あたしが初めて、C++を触ったのは、たぶん、修士1年の時です。昭和の時代です。 その時のC++は、コンパイラではなく、AT&T C++ Translator でした。 C++のコードを…

Groqの新しい資料から V2-LPU 2nd Gen System がある模様

はじめに 下記に、LLM Inference超絶速い Groq に関する資料を見つけました。 Groq AI Workshop, ALCF AI Testbed, June 2024 この資料の中に、V2-LPU 2nd Gen System みたいなものがありましたので、記録に残します。 2nd Gen System と 3rd Gen System に…

MediatekのAI PC対応

はじめに PCが売れなくなっているのですが、その対策として今キャンペーンが行われているのが AI PC。 ローカル(手元のノートPC)にて、LLM Inference をするために、40 TOPS 以上の NPU を搭載した SoC ベースのもの Qualcomm : Snapdragon X Elite AMD : Ry…

Apple が Google TPU を使って、学習をしているんですね。

はじめに AppleがNVIDIAのGPUではなく、Google TPUを使って学習したようなので記録に残します。 arxiv.org Apple Intelligence Foundation Language Models The AFM models are pre-trained on v4 and v5p Cloud TPU clusters with the AXLearn framework [A…

NVIDIA Linux Open GPU Kernel Module Source に、GB100/GB102が登場

はじめに NVIDIAは、GPU の Kenel module をオープンソースにするという発表を行っています。対象は、R560からです。 developer.nvidia.com ということで、github に、R560 が落ちてきたので見てみました GB100/GB102 NVIDIAのopen-gpu-kernel-modulesにBlac…

Graphcore、第2章が始まり、職の募集も再開したようです。

はじめに GraphcoreがSoftbank に買収されたのは、下記のようにこのブログでも取り上げました。 vengineer.hatenablog.com 今日のブログは、Softbank の配下で Graphcore の第2章が始まり、職の募集も再開されたようなので、記録に残します。 職の募集 職の…

Rasberry Pi 2 Pico (RP2350) は、Arm Cortex-M33+DPS@150MHz x 2 と RISC-V (Hazard3) が入っているの?

はじめに Rasberry Pi 2 Pico (RP2350)のアナウンスがありました。 www.raspberrypi.com Picoとの大きな違いは、 Arm Cortex-M33+DPS@150MHz x 2 <= Arm Cortex M0+@133MHz x2 RISC-V (Hazard3) の切り替えができるようです。 残念ながら同時には使えないよ…

書籍 : 勝者の科学 一流になる人とチームの法則

はじめに 勝者の科学 一流になる人とチームの法則 を読み終えました。Kindle版を 2277円で購入しました。まだ、出たばかりなので割引は紙の書籍の10%(消費税相当)の253円です。 マシュー・サイド 本 この本を読む前に、マシュー・サイド 本としては、 多様性…

Huawei Ascend 910シリーズ

はじめに Huawei Ascend 910C が H100 を超える性能という情報が流れてきました。 www.tomshardware.com 今回は、Hauwei Ascend 910シリーズについて、見ていきます。 Ascend 910 Ascend 910 についても、このブログでも2019年9月6日に取り上げています。継…

過去を振り返る会 : 何故?日本でディープラーニング用ハードウェアを開発しないのか?

はじめに 毎週土曜日の過去を振り返る会。今回は、下記のXの投稿したものについてです。この投稿にあるURLは、2017年12年1日に書いたブログで、現在のことではありません。 何故?日本でディープラーニング用ハードウェアを開発しないのか?https://t.co/OFs…

生成AIスタートアップへの出資(投資)とクラウドサービスの売上

はじめに 2023年9月29日書いた下記のブログ vengineer.hatenablog.com グーグル、AI新興アンスロピックに追加投資 最大20億ドル AmazonがAnthropicに$4B投資? マイクロソフトがOpenAIへ「1.3兆円投資」のワケ、ChatGPTで対グーグルとOffice強化 クラウド…

Cerabras SystemsのFounderの人が NVIDIA Blackwell の遅延について、説明してくれていますよ。

はじめに 8月2日に、NVIDIA Blackwell の出荷に遅延が発生するということが、Xの投稿に流れてきました。 www.theinformation.com 上記の記事は、ユーザー登録等を行わないと読めないので、下記の記事が参考になります。 xenospectrum.com NVIDIA Blackwell …

Groq : v3 LPU の開発を始めたっぽい!

はじめに 昨日、Groqの 2nd Gen System と 3rd Gen System の妄想をしましたが、Groq は既に V3 LPU の検討を始めているようです。 Principal Performance Modeling Engineer というCareersのところに、下記のような文言がありました。 Responsibilities & o…

書籍 : ジェームズ・クリアー式 複利で伸びる1つの習慣

はじめに ひとり読書会で、今読んでいる、「勝者の科学 一流になる人とチームの法則」に飽きたので、 ジェームズ・クリアー式 複利で伸びる1つの習慣 原題は、Atomic Habits Kindle版が半額の 825円(ポイント8)、だったのポチリました。 気になったところ な…

Groqの2nd Gen Systemと3rd Gen Systemについて、妄想する

はじめに 昨日は、このブログに書いたGroqの記事についてまとめました。 今回は、来年、V2 Chipが上がってきて、その V2 Chip を使った、3rd Gen System について妄想してみたいと思います。 では、 Let's 妄想 GroqNode と GroqRack 現在のプロダクトは、Gr…

2017年から2024年8月までのこのブログに書いたGroqに関する記事、めっちゃ多かった

はじめに LLM Inferenceが超絶速い Groq。先日、なんと、$640M もの資金調達して、10万台の LPU を導入するという。 下記のブログでも紹介しましたが、2024年では 22万台設置の予定なので、まだまだ増えそうです。 vengineer.hatenablog.com このブログでの …

Qualcomm Snapdragon 8s Gen3

はじめに Qualcomm Snapdragonのお高い方はどんどん先端技術を使うのでお高くなり、それに伴い、Smartphoneも普通に10万円超え、それじゃ、売れなくなるよね。 ということで、Qualcommは、Snapdragon 8s Gen 3 なるものをアナウンスしました。 8s Gen3 www.a…

過去を振り返る会 : ブログに何を書いていたのか?

はじめに 2007年3月にブログを書き始めました。何を書いていたのかを振り返ります。 2007 - 2012 この頃は、ASICの検証関連がほとんどでした。 Verification Evangelist宣言 : 2011-10-22 Verification Evangelistと名乗ることにした理由 : 2011-10-23 2011 …

GF 14nm/12nmのWaferコストとGroq/Tenstorrentのチップのお値段を妄想する

はじめに GroqのGroqChip1 は、下記のブログで $1,000 で PCIe Card は作れそうと書きました。 vengineer.hatenablog.com GroqChip 1 は、GF 14nm で開発 一方、Tenstorrent の GraySkull と Wormhole は、GF 12nm で開発 ということで、 Let's 妄想 GF 14nm…

Intel のプロセスを振り返ってみた

はじめに Xの投稿に下記のようなものが流れてきました。Intel 3 Interconnect Stacks のスライドです。 Up to 21 metal layers. pic.twitter.com/sSBBEITjK8— witeken (@witeken) 2024年6月28日 Intel 3 の Interconnect Stacks 上記のスライドを見ると、 In…

書籍 : 失敗の科学

はじめに 今回の ひとり読書会は、 失敗の科学 、マシュー・サイド (著) Kindle版、2479円、ポイントバック1226 多様性の科学については、2021年12月7日に書きました。 vengineer.hatenablog.com 目次 下記の目次は、Amazonの頁から引用しています。 <目次> …

Groqの資金調達額($1317M)、SambaNova Systems($1132M)を抜き、トップに!

はじめに 5月に、Groq が追加で $300M の資金調達したことは、このブログにも書きました。 vengineer.hatenablog.com そして、2024年8月5日、Groqは、Series D round として、$640M の資金調達をしたようです。 wow.groq.com Groq の資金調達 2021.03 : $67M…

Intel と UMC の件を妄想する

はじめに Intel と UMC が米国アリゾナにて、12nm プロセスの共同開発をするということに news.mynavi.jp UMCは現在、14nmまでのソリューションを提供しています。それに、12 nm を追加するということになります。 Let's 妄想 Intel が 12nm って Intelは、2…

AmpereOne Aurora

はじめに このブログでは、何度も Ampere Computing について取り上げています。 vengineer.hatenablog.com 2024年5月9日のブログでは、AmpereOne-3について、取り上げました。 今回、新しいロードマックが公開されたようなので、見てみます。 www.nextplatf…

expedera : Origin Eシリーズ

はじめに ここ数年、Edge側のAIチップを全くみていなかったのですが、最近、M.2 Board に実装できるぐらいのAIアクセラレータが出ているので色々と調べることにしました。 今回は、expedera について妄想したいと思います。 Let's 妄想 expedera www.expeder…