arch和gencode的设置
SM(Streaming Multiprocessing):流式多处理器
https://blog.csdn.net/weixin_40427089/article/details/86741198
https://www.cnblogs.com/physutech/articles/10928077.html
Nvidia GPU架构 - Cuda Core,SM,SP等等傻傻分不清?
https://blog.csdn.net/asasasaababab/article/details/80447254
https://www.cnblogs.com/phillee/p/12049208.html
多进程服务(MPS)是CUDA应用程序编程接口(API)的另一种二进制兼容实现。
MPS运行时架构被设计成透明地启用协作的多进程CUDA应用程序(通常是MPI作业),以利用最新的NVIDIA(基于kepler) gpu上的Hyper-Q功能。