>>123
pの値が4になっても、メモリ使用量は増えません。
ただし、メモリアクセス回数が4倍になります。

Nやrが大きくなるか(メモリ使用量が大きくなる)、
配列Sが大きくならないと(シェアードメモリに入りきらなくなる)、
GPU対策にはなりませんよ…

間に入って済まない。名無し名誉名人でした。