SRAMコントローラー???
先ずNNを演算するハードエンジンの仕組みをおぼろげながらで良いから理解するのが第一歩だと思うぞ

イメージとしては何千ものプロセッサが互いに計算結果を交換しながら同時実行していく。

即時にデータ交換出来れば良いがデータを保存する為にどうしてもメモリーが必要になる

メモリーは一度にたくさんのデータを同時には捌けない。またシリコン上で高速に信号を伝えるにはメモリーまでの距離に依存する配線遅延が問題になる

メモリーを小さなブロックに分けかつ各々の演算素子に近接させて配置する事が大切。ちゃんとやらないとメモリーアクセスネックで速度が出ない

これを行うには実際の処理に応じて配置配線しなければならないが、テスラはそれを端折ってる。
ちなみにこれは私の個人的な見解ではなくLSIにある程度の知見があれば誰でも分かる。

テスラに技術がなかった訳ではなく開発速度を優先したのでは?という好意的な見方もある。ただそれならnvidiaにケンカ売って大ボラ吹いたイーロンはなんだったのか www