Vengineerの妄想

人生を妄想しています。

Qualcomm Hexagon‑MLIR

はじめに

Qualcomm の AI200 について、調べていたら、

というものを見つけたので記録に残します。

Qualcomm Hexagon-MLIR

下記のブログによると、

にて、Hexagon NPU を使えるようにするためのものっぽい。

www.qualcomm.com

下図は、上記のブログから

ソースコード

ソースコードは、下記の github にあります。

github.com

動画

www.youtube.com

スライド

おわりに

  • Single Hexagon NPU (tested on v73, v75, v79)

とありますね。

  • v73 → Snapdragon 8 Gen 2(2022-2023世代)
    • 多くのフラッグシップAndroid端末(例: OnePlus Ace3など)で採用
    • INT8/FP16などの基本的なAIアクセラレーションが強力
  • v75 → Snapdragon 8 Gen 3(2023-2024世代)
    • Snapdragon X Elite(PC向け)でも近い世代の派生が使われている
    • さらに高いTOPS(例: 45 TOPS INT8クラス)、効率向上
  • v79 → Snapdragon 8 Elite(2024-2025世代)
    • 最新のフラッグシップ(例: OnePlus Ace5 Proなど)
    • 特に低ビット量子化(4-bitなど)の効率が大幅向上
    • 浮動小数点演算の内部フォーマット(qfloat)の変換オーバーヘッドをLUT(ルックアップテーブル)で削減するなど、LLM推論で顕著に速くなる設計変更あり

v79 って、4ビットをサポートしているんですね。

  • v81 → Snapdragon 8 Gen 5 / 8 Elite Gen 5(2025-2026世代、例: OnePlus 15Rなど)
    • メモリ最適化強化:VTCM(Vector Tensor Cache Memory)のbyte-granularity予約対応(v81から)。グラフ単位でより細かくメモリを割り当て可能になり、LLMのような大規模モデルで効率アップ。
    • 低精度/混合精度推論の改善:INT4/INT8/FP16/BFloat16のサポートがさらに洗練。FP16演算のバグ修正(例: sub演算で+∞が出る問題がQNN 2.41.0以降で議論)や、overlapスケジューリングの最適化。

NVIDIA DGX B300 には、DC-SCM (Datacenter-ready Secure Control Module) が入っているだね。

はじめに

NVIDIAのBMCとDPUの関係を調べていたら、

  • DC-SCM(Datacenter Secure Control Module)

なるものが出てきたので、記録に残します。

DC-SCM(Datacenter Secure Control Module)

DGX B300 の DC-SCM の詳細を Grok さんに聞いてみました。

DC-SCM(Datacenter Secure Control Module)は、Open Compute Project(OCP)が推進する標準仕様で、大規模データセンター向けにサーバーの管理・セキュリティ・制御機能をモジュール化(独立した交換可能カード)したものです。従来のマザーボードに直接実装されていたBMC(Baseboard Management Controller)関連回路を分離・標準化することで、柔軟性・セキュリティ・保守性を大幅に向上させています。

NVIDIADGX B300(Blackwell世代)では、このDC-SCMを初めて本格採用しており、従来のDGX B200などではオンボードだったBMCが交換可能なDC-SCMモジュールとして実装されています。

DC-SCMの主な目的とメリット

  • 従来のBMCとの違いオンボード実装 vs DC-SCM)

    項目 従来のオンボードBMC DC-SCM(モジュール化) メリット(DC-SCM側)
    実装場所 マザーボード上に直接半田付け 専用コネクタ(DC-SCI)経由の着脱可能モジュール 故障時・アップグレード時に本体マザーボードを交換せずに済む
    交換性 ほぼ不可能(マザーボードごと交換) 現場で簡単に交換可能(DGX B300サービスマニュアル記載) MTTR(平均修復時間)短縮、大規模運用でコスト削減
    ベンダー独立性 サーバーベンダーごとにBMCチップ・ファームウェアが異なる 共通フォームファクター → 複数ベンダーBMC(ASPEED, Axiadoなど)選択可能 ロックイン回避、OpenBMCなどオープンソース活用しやすくなる
    セキュリティ マザーボード依存でRoT(Root of Trust)統合が複雑 HWRoT(Hardware Root of Trust)・TPMをモジュール内に集約 セキュアブート・ファームウェア保護が標準化・強化
    開発・保守 毎世代マザーボード設計変更が必要 管理モジュールは世代間で再利用可能 開発コスト低減、セキュリティパッチ適用が速い
    フォームファクタ なし 主にHorizontal Form Factor(HFF)またはVertical(VFF)、最新はCompact Form Factor(CFF)も AI/Edge向け小型化対応

DC-SCMの主な構成要素(典型的な実装)

  • BMC SoC:ASPEED AST2600/2600シリーズが最も一般的(NVIDIA DGX B300でもほぼこれ)
  • Hardware Root of Trust (HWRoT):セキュアブート・署名検証用(例:Infineon、Axiadoなど)
  • TPM 2.0:Trusted Platform Module(オプションだがほぼ必須)
  • フラッシュメモリ:BMC用ファームウェア + BIOS/UEFI用(冗長構成が多い)
  • CPLD / FPGA:電源シーケンス・I2C/I3Cブリッジ・カスタムロジック
  • インターフェース:DC-SCIコネクタ(OCP標準ピンアウト)経由でホスト(HPM: Host Processor Module)と接続

NVIDIA DGX B300でのDC-SCMの特徴

  • BMCがDC-SCM内に集約 → 従来のDGXシステムより管理部品の交換が容易。
  • サービスマニュアルに専用交換手順が存在(静電気注意・専用ツール使用)。
  • 1 GbE RJ-45専用管理ポートはDC-SCMから出ている。
  • Redfish / IPMI / KVMなどの標準OOB管理を完全にサポート。
  • セキュリティ強化:Secure Flash(署名なしファームウェア拒否)、AES-CBC暗号化対応。
  • GB200 NVL72などNVIDIAの他のOCP貢献設計でも、より小型(10%縮小)のDC-SCMを採用し始めている。

現在の進化状況(2025-2026時点)

  • DC-SCM 2.0 / 2.1 / 2.2:主流。Type 1ピンアウト標準化、Compact Form Factor(CFF)追加でAI/Edge対応強化。
  • DC-SCM 3.0:2025年以降のワークストリーム開始。多ノード・マルチHPM(Host Processor Module)対応を想定。
  • 大手(Google, Microsoft, Meta, NVIDIA, Cloudflareなど)が積極採用 → 事実上の業界標準に。

要するに、DC-SCMは「BMCをマザーボードから切り離して標準カードにしたもの」で、DGX B300では保守性・セキュリティ・将来性を高めるための重要な進化となっています。故障してもDC-SCMだけ交換すればBMC復旧できるのは、大規模AIクラスタ運用で非常に実用的です。

DGX B300 のどこにあるのか?

下記の図は、ここから、説明のために引用します。

おわりに

DGX B300 の DC-SCM の物理的な形状などの情報は無いのですが、OCP準拠と考えると、仕様書を見ればいいんじゃないですか。ということで

OCP DC-SCM の仕様書は、下記にあります。

書籍 :: 映画ビジネス

はじめに

今回の「ひとり読書会」は、

Kindle版、1760円、ポイントバック888

業界ビジネスシリーズの「映画ビジネスが分かる書籍」

目次

ここから

  • 序章 アメリカを席巻した日本映画業界の現状について考える
  • 第1章 プロデューサー・監督から学ぶ映画制作の世界
  • 第2章 製作方式から学ぶ映画作りの世界
  • 第3章 洋画から学ぶ映画配給の世界
  • 第4章 伝説の宣伝マンから学ぶ映画宣伝の世界
  • 第5章 映画の誕生から学ぶ映画史の世界
  • 第6章 ポップコーンから学ぶ映画館の世界
  • 第7章 Netflixから学ぶ二次使用の世界
  • 第8章 アニメ映画から学ぶ海外展開の世界
  • 第9章 DXから学ぶこれからの映画の世界
  • 終章 夢のある、世界に誇れる映画ビジネスであるために
  • おわりに

おわりに

1980年から映画を観始めて、今年で46年。色々な映画を劇場、テレビ、VHS、DVD、BD、配信で。

先日、「はたらく細胞」を配信で観た時、何で配給がワーナー・ブラザーズなのか疑問でしたが、ワーナー・ブラザーズ・ジャパンが邦画も制作しているんですね。

www.youtube.com

そう言えば、

の作品を結構観ました。ここで確認したら、こんな感じでした。

1980 - 1985 のほとんどを観ていました。

BlueField-3 には、BMCが載っている

はじめに

NVIDIA BlueField-3 は、DPUです。

そして、BlueField-3 には、BMC が載っています。

BlueField- 3 の BMC は、どれ?

のBoard のレイアウトは、下記のようになっています。説明のために引用します。

  • 1 : System-on-Chip (SoC) : 8/16 Arm-Cores DPU SoC
  • 2 : Networking Interface : The network traffic is transmitted through the DPU QSFP112 connectors. The QSFP112 connectors allow the use of modules and optical and passive cable interconnect solutions
  • 3 : Networking Ports LEDs Interface : One bi-color I/O LEDs per port to indicate link and physical status
  • 4 : PCI Express Interface : PCIe Gen 5.0/4.0 through an x16 edge connector
  • 5 : DDR5 SDRAM On-Board Memory : 20 units of DDR5 SDRAM for a total of 32GB @5200 or 5600MT/s. 128bit + 16bit ECC, solder-down memory
  • 6 : NC-SI Management Interface : NC-SI 20 pins BMC connectivity for remote management
  • 7 : USB 4-pin RA Connector : Used for OS image loading
  • 8 : 1GbE OOB Management Interface : 1GbE BASE-T OOB management interface
  • 9 : MMCX RA PPS IN/OUT : Allows PPS IN/OUT
  • 10 : External PCIe Power Supply Connector : An external 12V power connection through an 8-pin ATX connector
  • 11 : Cabline CA-II Plus Connectors : Two Cabline CA-II plus connectors are populated to allow connectivity to an additional PCIe x16 Auxiliary card
  • 12 : Integrated BMC : DPU BMC
  • 13 : SSD Interface : 128GB
  • 14 : RTC Battery : Battery holder for RTC
  • 15 : eMMC Interface : x8

12 が BMC です。BMC の Net が 8 です。そして、おまけに、13 の SSD です。

では、BMCはどのように接続されているのか?

下記のブログで、BMCについて学びました。

vengineer.hatenablog.com

のように、

  • BMC と 1GbE を繋げている感じですね。

7の USB は、BlueField-3 内のCPUのためのOS image のダウンロードのために使うようですね。その OS は、13 の SSD か 15 の eMMC にストアされているんでしょうね。

おわりに

BlueField-3 には、BMCがあるということは、BlueField-4 にも BMCがあるでしょうね。

下記は、Rubin NVL72 の Compute Tray の Front です。BlueField-4 のところに、RJ45のコネクタがありますね。これが BlueField-4 用の BMC になりますね。

色々と調べたら、LinkedIn の NVIDIA Data Center のこの記事、に合った下記の写真(説明のために引用します)に、ASPEED というログが見えて、Grok 4.1 Beta さんに聞いたら、AST2600A2-GP とありました。

AMD IR : Q4.2025

はじめに

AMD の Q4.2025 の IR が発表されました。史上最高売上だったのですが、株価は下落。。なんだか。。

で、詳細を見て、Intel と比べたら、面白いことが分かったので、記録に残します。

AMD Q4.2025 の IR

AMD IR

  • 売上

    • Data Center : $5380M
    • Client & Gaming : $3940M
    • Embedded : $950M
    • 合計 : $10270M
  • 利益

    • Data Center : $1752M
    • Client & Gaming : $725M
    • Embedded : $357M
    • 合計 : $2834M

Intel Q4.2024 の IR

Intel IR

  • 売上

    • Data Center : $4.7B
    • Client : $8.2B
    • Foundry $4.5B
  • 利益

    • Client : $2.2B
    • Data Center : $1.3B
    • Foundry : $-2.5B
    • 合計 : $1.0B

比較

  • 全体の売上

  • 全体の利益

    • AMD $2834M
    • Intel : $1.0B (Foundry $-2.5B)

Intel Foundry を除くと、

  • 売上
    • Intel (Client + Data Center) : $12.9B
  • 利益
    • Intel (Client + Data Center) : $3.5B

Foundry さえなければ、Intel はイイんですがね。。

おわりに

AMD 、Data Center に関しては、Intel の売上・利益よりも大きいです。

Client に関しては、Intel は $8.2B 、AMD は $3940Mで、倍半分です。。。

2026年、AMD がどれくらい、Data Center の売上・利益を上げるかによって、2027年は Intel を超えるかもしれません。

見守りましょう!

映画 : 爆弾

はじめに

今年、3回目の劇場での映画鑑賞

爆弾

www.youtube.com

ブルーリボン賞 2025年

日本アカデミー賞ノミネート

全部「国宝」とガチンコです。

たぶん、取れるのは助演男優賞だけでしょう!

おわりに

大昔の、「セブン」を思い出しました。。。。

あれは、凄かった。。。

Intel foundry の パッケージ技術

はじめに

Intel foundry の

の中に、Intelのパッケージ技術が載っていたので、記録に残します。

Intel foundry のパッケージ技術

下記の図が紹介されているパッケージ技術です。

  • eMIM-T
  • CoaxMIL
  • eDTC

このベースにある説明をGoogle翻訳にて、日本語にしてみました。

Intel 18Aロジックタイルは、PowerViaバックサイド電力供給機能を搭載しており、電力パスを大幅に短縮し、IRドロップを低減し、高速信号伝送のためのフロントサイド配線を解放します。このアーキテクチャは、オンダイOmni MIMコンデンサと組み合わせることで、高速過渡時の誘導性ドループを最小限に抑え、バースト的なAI負荷時でも周波数を維持するのに役立ちます。 Omni MIM コンデンサーは、高周波での電力供給ネットワーク (PDN) インピーダンスも縮小します。パッケージ レベルでは、EMIB-T 2.5D はシリコン貫通ビア (TSV) と高出力 MIM コンデンサーをブリッジに直接組み込むことで、カンチレバー電源トレースを排除し、インピーダンスが低く信頼性が向上した垂直電力供給を可能にします。これらの改善は、HBM4 および将来の世代の帯域幅要件の増加、および 32Gbps 以上の速度で動作する UCIe を満たすために不可欠です。電力供給をさらに安定させるために、Intel Foundry は、負荷の近くに超高容量密度の組み込みディープ トレンチ コンデンサー (eDTC) を統合し、ベースダイ全体の PDN インピーダンスを平坦化します。組み込み MIM (eMIM-T) テクノロジーは、成熟したノードでも Omni MIM と同じ高度なアーキテクチャーを活用し、ベースダイで優れたデカップリングを実現します。正確で高速なポイントオブロード制御を実現するために、CoaxMIL テクノロジーは磁気インダクタを基板に埋め込み、応答が速く損失が最小限の統合電圧レギュレータ (IVR) を実現します。

TSMC では、どうなのか?

eDTC については、TSMCでも導入していたと思うのですが、eMIM とかはどうなんでしょうかね。

こういう時は、Grok さんに登場してもらいます。一瞬で出てきました。

Intelの記述した技術(PowerVia、Omni MIM、EMIB-Tなど)は、HPC/AI向けの高効率電力供給、デカップリング、パッケージングに焦点を当てています。TSMCも同様のAI/高性能コンピューティング用途向けに類似の先進技術を提供しており、主にN2/A16ノード(ナノシートトランジスタベース、2025-2026年量産開始)と3DFabricエコシステム(CoWoS、InFO、SoIC)で実装されています。Intelが一部機能で先行している一方、TSMCはコスト効率、スケーラビリティ、広範な採用を重視しています。

以下に、各Intel技術とTSMCの対応する技術を比較した表を示します(最新のTSMCロードマップに基づく)。

Intelの技術 説明 TSMCの対応技術 説明と比較
PowerVia (バックサイド電力供給) 電力パス短縮、IRドロップ低減、フロントサイドを信号専用に解放。バーストAI負荷時の周波数維持に有効。Intel 18Aで使用。 Super Power Rail (SPR) (A16 1.6nmノード) バックサイド電力供給ネットワーク(BSPDN)。ナノシートトランジスタと統合。N2P比で8-10%高速化、15-20%低消費電力、密度1.07-1.10倍向上。IRドロップ大幅低減。TSMCはA16(リスク生産2025年後半、量産2026年後半)で導入し、Intel 18A(2025年)よりやや遅れるが、HPC向け複雑配線に最適化。
Omni MIM Capacitor オンダイ高密度コンデンサ。誘導性ドループ最小化、高周波PDNインピーダンス低減。PowerViaと組み合わせAIバースト対応。 Super High-Performance MIM (SHPMiM / UHPMiM) 高密度MIMコンデンサ(200fF/mm²超)。前世代比2倍以上の容量密度、Rs/Rc 50%低減。N2/N2PでHPC/AI向けに電力安定性向上、Fmax向上。Omni MIMと同様の役割だが、ナノシート最適化で高周波応答性が高い。
EMIB-T 2.5D TSVと高出力MIMコンデンサをブリッジに直接統合。カンチレバー電源トレース排除、低インピーダンス垂直電力供給。HBM4、32Gbps+ UCIe対応。 CoWoS-L (LSIブリッジ + TSV + MIMコンデンサ) ローカルシリコンインタコネクト(LSI)ブリッジ、TSV、RDLで高密度配線。MIMコンデンサ統合、HBM4/HBM4E対応。パッケージサイズ最大9Xリクティクル(2027年目標)。Intelの埋め込みブリッジより大型インタポーザー中心で柔軟性高く、異種統合に強いが、大型SiPではコスト高の可能性。
eDTC (Embedded Deep Trench Capacitor) 負荷近くに超高容量密度コンデンサ統合。ベースダイ全体のPDNインピーダンス平坦化。 Embedded Deep Trench Capacitor (eDTC) CoWoSインタポーザー/基板に直接統合。高密度デカップリング、AI/HPCで50%超電力密度対応。2020年頃から量産、CoWoS-S/LでHBM2E/3対応。Intel版とほぼ同等で、ウェハーレベル統合による電力品質向上に特化。
eMIM-T (Embedded MIM Technology) 成熟ノードでOmni MIMアーキテクチャ活用。ベースダイで優れたデカップリング。 Embedded MIM (eMIM) / UHPMIM インタポーザー/ベースダイに統合MIMコンデンサ(前世代2倍容量)。コスト重視HPC向け。3D-MiM(MUST-in-MUST)でシステムレベルPPA向上。eMIM-Tと同等のモジュラー設計、ボンディングピッチスケーラブル。
CoaxMIL (Coaxial Magnetic Inductor Layer) 基板埋め込み磁気インダクタ。高速・低損失IVRでポイントオブロード精密制御。 Integrated Voltage Regulators (IVR) with Embedded Inductors (CoWoS-L) インタポーザーにIVR、PMIC、コイル、eDTC統合。多相バックコンバータ対応、電力損失30%低減(デモ)。Coaxial磁気コアインダクタ使用。Intelの基板埋め込みに対しインタポーザー中心だが、同等のIVR効率(82%デモ)。A16/N2で開発中、kW級AI電源対応。

TSMCの技術はN2(2025年後半量産開始)/A16(2026年後半)ノードと3DFabricで統合され、NVIDIAAMDなどのパートナーで広く採用されています。Intelがバックサイド電力などで一部先行する一方、TSMCはNanoFlexによるPPA柔軟性やエコシステムの広さで優位。HBM4/UCIe進化に対応し、2026-2027年に量産ランプアップ予定です。

おわりに

Intel foundry のパッケージ技術 と TSMC のパッケージ技術

  • eDTC <=> Embedded Deep Trench Capacitor (eDTC)
  • eMIM-T <=> Embedded MIM (eMIM) / UHPMIM
  • CoaxMIL <=> Integrated Voltage Regulators (IVR) with Embedded Inductors (CoWoS-L)

では、同じようなものはあるんですね。

で、Samsung はどうなんでしょうか?

Grok さんに聞いてみたら、また、一瞬で出てきました。

Samsung Foundryの技術(主にSF2/SF1.4シリーズ)は、HPC/AI向けの高性能プロセスと先進パッケージングに注力していますが、IntelTSMCに比べてバックサイド電力供給(BSPDN)の導入が遅れており、全体的にTSMC寄りのアプローチ(コストと歩留まり重視)です。現在のロードマップ(2025-2027年)では、SF2(2nmクラス、2025年量産開始)が主力で、SF2Z(2027年)でBSPDNを導入。SF1.4(1.4nmクラス)は2027年予定ですが、歩留まり改善を優先し、一部で遅延の可能性が指摘されています。

IntelのPowerVia/Omni MIM/EMIB-T/eDTC/CoaxMILなどの先進電力・パッケージング技術に対して、Samsungの対応は以下のようになります(最新のSamsung Foundry Forum 2024情報と更新ロードマップに基づく)。

Intelの技術 説明 Samsungの対応技術 説明と比較
PowerVia (バックサイド電力供給) 電力パス短縮、IRドロップ低減、フロントサイド信号解放。バーストAI負荷対応。Intel 18Aで使用。 BSPDN (Backside Power Delivery Network) (SF2Z 2nmクラス) ウェハ裏面に電力レールを配置し、電力・信号ボトルネック解消。SF2比でPPA向上、IRドロップ大幅低減、HPC/AI性能強化。量産は2027年予定。Intel 18A(2025年)やTSMC A16(2026年後半)より2年遅れで、Samsungはモバイル優先のSF2/SF2Pを先に展開し、HPC向けにSF2Zで追従。
Omni MIM Capacitor オンダイ高密度コンデンサ。誘導性ドループ最小化、高周波PDNインピーダンス低減。 High-Density MIM Capacitors (プロセス内統合) SamsungもGAAプロセス(SF3/SF2)で高密度MIMコンデンサを採用し、デカップリング強化。詳細スペック(容量密度など)は公開少ないが、HPC/AI向け電力安定性向上に活用。IntelOmni MIMほど強調されていないが、同等の役割でIRドロップ/ノイズ低減。Samsung Electro-Mechanicsの高容量MLCCもサーバー電源補助に寄与。
EMIB-T 2.5D TSV+MIMコンデンサ統合ブリッジ。垂直電力供給、低インピーダンス。HBM4、32Gbps+ UCIe対応。 I-Cube / X-Cube (2.5D/3Dパッケージング) I-Cube(インタポーザー型2.5D)でHBM統合、X-Cube(3Dスタック)でTSV+ハイブリッドボンディング。HBM4/HBM4E対応、大型SiP可能。Intelの埋め込みブリッジに対し、Samsungは大型インタポーザー中心で柔軟性高く、異種チップ統合(HBM+ロジック)に強いが、コスト/歩留まり面でTSMC CoWoSに近い。
eDTC (Embedded Deep Trench Capacitor) 負荷近く超高容量密度コンデンサ。ベースダイPDN平坦化。 Embedded DTC / 高密度コンデンサ (先進パッケージ内) CoWoS相当の先進パッケージでeDTC類似の高密度トレンチコンデンサ統合。AI/HPCで電力密度向上、PDNインピーダンス低減。SamsungもHBMスタック近くにデカップリング強化。Intel版と同等レベルの電力品質向上を目指す。
eMIM-T (Embedded MIM Technology) 成熟ノードでOmni MIM活用。ベースダイ優れたデカップリング。 Embedded MIM Capacitors (パッケージ/ベースダイ) インタポーザーやベースダイにMIMコンデンサ埋め込み。高容量デカップリングでコスト重視HPC対応。IntelのeMIM-Tと同様のモジュラー設計で、システムレベルPPA向上。
CoaxMIL (Coaxial Magnetic Inductor Layer) 基板埋め込み磁気インダクタ。高速低損失IVR、ポイントオブロード制御。 Integrated Voltage Regulators (IVR) / Embedded Inductors (先進パッケージ) X-CubeやI-CubeでIVR/PMIC/インダクタ統合。多相電源管理で電力損失低減、AI向けkW級電源対応。Intelの基板埋め込みに対し、Samsungはパッケージレベル中心だが、同等の効率向上(損失低減30%クラス)。開発中。

Samsungの技術はSF2(2025年)でモバイル/一部HPCを強化し、SF2Z(2027年)でBSPDNを本格導入してAI/HPC追従を目指しています。Intelが電力関連で先行(PowerVia/Omni MIMなど2025年)、TSMCがエコシステム広さで優位な中、Samsungは歩留まり改善と顧客獲得(Tesla AIチップ、Qualcommなど)に注力。HBM4/UCIe進化に対応しつつ、2027年頃にIntel/TSMC並みの電力効率を実現する見込みです。