本篇是GPGPU 架构汇总的总章,参考的是AMD公布OpenCL 手册,该手册总结了AMD. Nvdia 早年的GPGPU体系架构,以及Opencl 各个API 与硬件结构的映射关系 。本篇除了整理这两家的GPU 架构 , 也会增加Intel dGPU的架构(牙膏厂终于回过神了 。。。。)
对于现代的 GPU,通常的它的控制逻辑单元比较简单(和 cpu 相比),cache 也比较小 。
线程切换开销比较小,都是轻量级的线程
GPU 的每个“核”有大量的 ALU 以及很小的用户可管理的 cache 。
内存总线都是基于带宽优化的 。150GB/s 的带宽可以使得大量 ALU 同时进行内存操作 。
文章插图
* AMD GPU 硬件架构
* Nvdia GPU Femi 架构
* Intel GPU Gen11 架构
【现代GPGPU 架构汇总】
推荐阅读
- Windows 环境搭建 PostgreSQL 物理复制高可用架构数据库服务
- 图文全面详解 Kafka 架构和原理机制
- 六 软件架构MVC架构历史
- Windows 环境搭建 PostgreSQL 逻辑复制高可用架构数据库服务
- 11 微服务架构学习与思考:开源 API 网关02-以 Java 为基础的 API 网关详细介绍
- 10 微服务架构学习与思考:微服务网关和开源 API 网关01-以 Nginx 为基础的 API 网关详细介绍
- Punched Card 编程架构演化史:远古时代,从打孔卡开始
- gradle项目对比maven项目的目录架构以及对gradle wrapper的理解
- OnionArch - 采用DDD+CQRS+.Net 7.0实现的洋葱架构
- 18-基于CentOS7搭建RabbitMQ3.10.7集群镜像队列+HaProxy+Keepalived高可用架构