DMA転送のパフォーマンスを測る 1 レイテンシーとスループット
出典: PS3 Linux Information Site / Cell/B.E.のパワーを体験しよう
ここではDMA転送の時間を測定し、そのスループットとレイテンシーを計算します。 Cellのプログラムにおいてはspuが必要な時にデータをlsに載せておく必要があり、DMA転送のスループットとレイテンシーを知っておくことは非常に重要です。
(注:前に計ったときより1割ぐらい低い。データを取り直して書き直す)
Media:dma-perform-basic.tar.gz
[編集]
get
DMA転送のgetを測定します。サイズは128バイトから16Kバイトまで測定しました。 その結果が下図です。
最小二乗法で y = a*x + b にあわせると a = 226.1, b = 467.1 がが得られました。 従って切片からレイテンシーが 467cycle、傾きからスループットが14.5 Gbyte/sec と求まります。
[編集]
put
同様にputも測定します。
同様にレイテンシーとスループットを求めると、レイテンシーが 234cycle、スループットが23.3GByte/secでした。
[編集]
考察
getが実際のRDRAMからデータを読み込んで来るのにたいして、putはCellのオンチップのメモリーコントローラーに書き込むだけなので速いのだと思われます。getではだいたい初期コストが 500 cycle で 1KByte ごとに 220 cycle かかると覚えておけばいいでしょう。


