首页 > 财经 >

英伟达 RTX 50 系列显卡重大突破:CUDA 核心双功能回归,性能飞升

发布时间:2025-02-01 11:57:09来源:
2 月 1 日消息,英伟达正式公布 Blackwell GPU 架构白皮书,为 GeForce RTX 50 系列显卡揭开神秘面纱。其中最引人注目的是,该系列显卡的全部单精度 CUDA 核心同时支持 FP32(32 位浮点数)与 INT32(32 位整数)双功能,这一设计标志着英伟达在架构设计上的重大转变,回归到九年前 Pascal 架构的经典设计理念。

在图形渲染与机器学习等领域,FP32 和 INT32 数据格式各有优势。回溯到 Pascal 架构时代,英伟达采用单精度 CUDA 单元兼顾 FP32 和 INT32 运算的设计,有效提升了显卡的灵活性与处理效率。但在后续的 Volta 和 Turing 架构中,英伟达改用两组 1:1 比例的 CUDA 核心,分别独立承担 INT32 和 FP32 运算。这种设计虽然细化了计算能力,却也增加了系统资源的消耗,在一定程度上影响了处理效率。

到了 Ampere 架构,英伟达为每个 SM 流式处理器的四个处理块之一,配置了 1 组 16 个 FP32/INT32 单元和 1 组 16 个纯 FP32 单元,这一设计思路在 Ada GPU 架构中得以延续。而此次 Blackwell 架构的统一 CUDA 核心设计,让每个 SM 的 INT32 整数运算能力相比 Ada 架构实现翻倍。不过需要注意的是,在任意给定的时钟周期内,Blackwell 的统一内核只能以 FP32 或 INT32 其中一种模式运行。

英伟达方面表示,Ada 架构的 SM 主要是为标准着色器设计并优化,而 Blackwell 架构的 SM 则是面向神经着色器进行设计与优化。这一转变意味着,在未来的游戏和 AI 应用场景中,RTX 50 系列显卡的计算能力将更加出色,有望为端游、主机游戏以及云游戏等不同平台提供更强大的技术支持。

随着深度学习、图像生成、自然语言处理等领域对计算能力的要求日益增长,RTX 50 系列显卡的推出,无疑将大幅提升这些技术的运行效率。以游戏开发为例,开发者可以利用该显卡的 FP32 模式实现精美的可视化效果,在处理 AI 计算时则切换到 INT32 模式,这种灵活切换不仅能提升游戏帧率,还能让 AI 的自适应学习过程呈现出更真实的场景和互动效果,为玩家带来更沉浸式的游戏体验。

RTX 50 系列显卡凭借 CUDA 核心双功能的回归,在性能上实现了显著提升,无论是对于游戏玩家追求极致画面与流畅体验,还是 AI 开发者探索前沿技术应用,都具有重大意义,也让我们对其未来在市场中的表现充满期待。
(作者: 阿毛视界)

版权声明:本文为三牛号作者或机构在本站上传并发布,仅代表该作者或机构观点,不代表本站的观点或立场,三牛网仅提供信息发布平台。