ソース変えなくても環境変数設定すればintensity大きくしてもプログラム走る
ただ残念ながら速度アップには当方環境では至らなかった、つーか下がった

RX570 4GB intensity 1920/worksize 4にて

C:\>set GPU_MAX_HEAP_SIZE 100
C:\>set GPU_MAX_ALLOC_PERCENT 100
C:\>set GPU_SINGLE_ALLOC_PERCENT 100
C:\>xmr-stak.exe

(どの環境変数が効いてるかは確認してない、全部はいらないかも)

どうもGPUメモリで一度に確保できるサイズが決まってて、その値が物理メモリより小さい値に設定されてる
設定されている以上のメモリを確保しようとすると物理メモリ以下でも
CL_INVALID_BUFFER_SIZEとopenclのコードが返すから、メモリ確保失敗でプログラムが終了する
上記の環境変数を設定することで、物理メモリいっぱいまで利用できるようになる

1つだけ走らせるほうが余計なオーバーヘッドが削減されて速くなるかと期待したけど、
逆に速度が下がる結果になった

なんか60%以上の物理メモリを一度に確保すると性能が落ちる場合があるらしいだの、
チップの内部側では32bitでメモリ空間を管理してるから一定以上にするとよろしくないだの、
openclでは単一メモリだけどamdの物理メモリは複数にブロックに分かれてるからだの出てきたけど何が影響を与えてるかはよくわからん

まあ、今までできなかったパラメータで走るようになるはずなので、
いろいろ試してもらえたらいいと思う