NVIDIA的GPU架构有SM、SP、CUDA Core、Wrap等各种硬件,其到底有什么作用?回到NVIDIA在2006年推出的CUDA,里面主要是提出了分层的现成Thread、块Block、网格Grid,这些跟GPU硬件架构如何对应?CUDA如何驱动硬件告诉并行计算?