はじめに
昨日の朝、下記のXの投稿でなんか凄いの出てきたな?と思っていましたが、昨日は記念日でお散歩していたのでそのままにしていました
AI Startup Etched Unveils Transformer ASIC Claiming 20x Speed-up Over NVIDIA H100 https://t.co/XyDuxpAjcg pic.twitter.com/WndQOstVFL
— TechPowerUp (@TechPowerUp) 2024年6月25日
今日は、NVIDIA H100x8より20倍、B200x8より10倍速く、LIama 70Bを実行するEthced Sohuを妄想してみたいと思います。
では、Let's 妄想
Etched のサイト
夜、下記のEtchedの投稿が流れてきたので、サイトの情報を眺めてみました。
PCで見てみたら、ボード(CGでしょうね)の下記の写真が出てきます。説明のためと無くなると勿体ないので引用します。
- OAMみたいなボード
- 1 die + HBM x6
- 周りにある2個のICが載っているのは電源(23個)
- 左側にある大きなモジュールも電源(48Vor54V)
- 右側にあるのはマイコン?(マイコンの周りにはデバック用のピンが立てられるようになっている)
Meet Sohu, the fastest AI chip of all time.
— Etched (@Etched) 2024年6月25日
With over 500,000 tokens per second running Llama 70B, Sohu lets you build products that are impossible on GPUs. One 8xSohu server replaces 160 H100s.
Sohu is the first specialized chip (ASIC) for transformer models. By specializing,… pic.twitter.com/IndYfP2CN0
die の部分を拡大します。CGなので本物かどうかは分かりませんが、全くのウソじゃないでしょう!
- 上下に3個づつ、HBMのPhy
- 左下が PCIe Gen5 x16 ?
- 右側には、8組の何らかのPHY (Ethernetらしい)。x8構成には、7組は必要。残りの1個は外部用でしょうか?
- 左側が計算機部分
- 右側がなんでしょうか?
- 上側のHBM PHYの間に、何かありますね。
サイトには、下記のように、
-「Only One Core」とありますので、左の大きなのがコア、っぽですね - 144 GB HBM3E per chip - この記事では、TSMC 4nm のようです
職を見てみる
サイトのCareersをクリックすると、HARDWARE関連では、
- Design Verification Engineer
- Director of Systems
- Physical Design Engineer
- RTL Design Engineer
があります。。
う?まだ、チップはない。。。の?
上記の内容を見ると
- PCIe, Ethernet, or HBM interfaces
- Experience with back-end design and timing closure on 3nm-7nm
- Familiarity with OpenROAD and other automated RTL-to-GDSII flows
下図は、Careersの頁にあったボードの図です。参考のために引用します。
過去の職(5か月前)
- RTL Design Engineer
- Experience with chip-to-chip interconnects and HBM3/HBM3E technologies.
- Director of Platform
- Experience with Open Compute Platform standards
- Familiarity with OAM-like accelerators and the baseboards they fit onto
経営陣
- Gavin Uberti : Co-Founder & CEO、めっちゃ若い。
- Mark Ross : CTO (超ベテラン : Weitek/PARC(Xerox)/Next/Sun Microsystems/Cisco Systems/Cypress)
- Robert Wachen : Co-Founder & COO
- Ajat Hukkoo : VP of Hardware Eng (Broadcom/Intel)
- Saptadeep Pal : Chief Architect
- Chris Zhu : Co-Founder & Director of Compilers
みつけました
- The Next 100x - Gavin Uberti | Stanford MLSys #92
下記は、上記の動画から説明のために引用します。チップの中身は、Matrix Unit のみのイメージ。
ボードのCGもあった
おわりに
上記の経営陣を調べてみて、CEOとDirector of CompilersがMITだったので、同級生かな?と思いました。調べてみたら、そのようでした。2023年5月17日なので、1年前。
Etched.aiは、2024年にSohuチップの提供を開始することを目指している。
ここに、なんかインタビューの文字おこしもあった。
ここにもなんかあった。
いや、これが一番詳しかった。後でじっくり読む。
- 2024.2.4時点で、チップはない
$120M 集めた模様なので、これからチップを作る感じなんですかね。。
2024年、今年、出てくるようですが、間に合いますかね。。。。
では、ここまでで
次回も、Let's 妄想
関連、Xの投稿
I'm all for new chips, and it's great to see new competitors!
— Horace He (@cHHillee) 2024年6月25日
That being said, a couple of points that I think are misleading and I see people being confused by:
1. 500k tokens per second is *not* 500k tokens per second per user. In other words, it might be generating 100… https://t.co/Mspng2H25x