Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

IBM POWER8のメモリ


IBM POWER8の続き。

POWER8のメモリはDDR4を使っていますが、POWER8とはバッファチップ経由で接続する。
バッファチップには、L4キャッシュがeDRAMで実装されているようだ。

Assesing IBM's POWER, Part1: A Low Leel Look at Little EndianDRAM周りの詳しい情報があります。

これによると、
 ・Buffer Cacheの名前は、Centaur
 ・POWER8 <=> Buffer Cache(バッファチップ)間は、28.8GBps(Read: 19.2GB/s, Write: 9.6GB/s)
 ・Buffer Cache <=> DIMM間は、5.3GBps (最大8DIMM)

POWER8は105GB/s要求してくるので、28.8GB/s x 4 = 115.2GB/s となり、とりあえずOK!

Stream Benchmark-5.10 (Triadd : gcc 5.2.1 -Ofast -fopenmp -static -DSTREAM_ARRAY_SIZE=120000000)
では、
 ・IBM POWER8 20 threads : 91.5GB/s
 ・IBM POWER8 10 threads : 91.0GB/s
 ・IBM POWER8 40 threads : 91.0GB/s
 ・IBM POWER8 80 threads : 90.5GB/s

Memory Latencyは、
 ・L1         :  3    cycles
 ・L2         : 13    cycles
 ・L3         : 27-28 (8ns)
 ・    16  MB : 55    ns
 ・ 32-64  MB : 55-57 ns
 ・ 96-128 MB : 67-74 ns
 ・384-512 MB : 89-91 ns

16MBの場合は、Xeonの方が速いですが、それ以外はPOWER8の方が速いです。

新しい資料を見つけた。
Programmable Near-Memory Acceleration on ConTutto
Centaurの代わりにFPGAに実装したConTuttoというものが4頁に。
そして6頁と12頁に、Near-Memory Acceleration。
13〜19頁には、Near-Memory Accelerationに接続されるAccess Processorなるものの。