回归 Pascal:英伟达 RTX 50 显卡全体 CUDA 中心支撑
IT之家 2 月 1 日新闻,英伟达现已颁布 Blackwell GPU 架构白皮书,表露了 GeForce RTX 50 系列显卡的大批技巧细节,此中相称值得留神的一点是 Blackwell 架构的全体单精度 CUDA 中心同时支撑 FP32 / INT32 数据,这点上回归了九年前的 Pascal 架构。▲ Blackwell 架构 SM 计划▲ Pascal 架构 SM 计划英伟达在 GeForce 10 Pascal 世代仍采取单精度 CUDA 单位统筹 FP32 / INT32 的计划,而在 Volta 跟 Turing 两代上换用了两组 1:1 比例的 CUDA 中心分辨承当 INT32 跟 FP32 的计划。▲ Volta(左)、Turing(右)两代架构 SM 计划离开 Ampere 架构,英伟达则为每个 SM 流式处置器的四个处置块(IT之家注:Processing Block)之一供给了 1 组 16 个 FP32 / INT32 单位跟 1 组 16 个纯 FP32 单位;而在 Ada GPU 上,这一计划失掉连续。▲ Ampere(左)、Ada(右)两代架构 SM 计划Blackwell 架构上的同一 CUDA 使得每 SM 可能的 INT32 整数运算才能较 Ada 翻倍。不外在任何给定的时钟周期内,Blackwell 同一内核只能以 FP32 或 INT32 形式中的一种运转。英伟达提到,Ada 架构 SM 是为尺度着色器计划跟优化的,而 Blackwell SM 则是为神经着色器计划跟优化的。
- 上一篇:迷信家立解听觉明码,听觉毛细胞的运气由它守
- 下一篇:没有了