据IT之家5月7日消息,在Moore’s Law is Dead 在最新一期视频中透露,英伟达今年仅推出 GeForce RTX 5090 一款显卡,计划明年再推出 Blackwell 架构的其他游戏显卡。

根据最新细节曝光,代号为GB202的旗舰产品 RTX5090 的CUDA内核数量将增加50%,达到24576个;此外内存带宽也将通过使用32Gbps GDDR7提升至52%,高于当前RTX4090的GDDR6X;更重要的升级是时钟速度,预计提高15%,这将使RTX5090的频率提升至2.9GHz,在游戏工作负载中轻松超过3GHz。

英伟达今年计划仅推出RTX5090显卡,透露了哪些信号?

视频还透露了英伟达这次仅推出一张RTX5090显卡主要有两方面的因素,一是有助于RTX40系列显卡库存能得到进一步清理;二是未来英伟达将专注于产出高利润的AI GPU,优化其资源分配和战略定位。

英伟达将显卡重心从游戏显卡转向AI GPU,透露出哪些信号呢?

AI GPU和游戏显卡的不同之处

尽管AI GPU和游戏显卡都是基于图形处理单元(GPU)架构,但二者在硬件设计和功能上存在不同的追求。

首先,AI GPU通常针对机器学习和深度学习任务进行优化,它们拥有大量的张量核心,专门用于处理复杂的数学运算,如矩阵乘法和向量计算,这些是深度学习算法中的基本操作。相比之下,游戏显卡会有更多针对图形渲染优化的CUDA核心,如光线追踪和着色器处理等。

以V100和RTX4090为例,专为深度学习而设计的V100拥有超过2500个CUDA核心和超大量的张量核心;而针对游戏应用的RTX4090,拥有超过10000个CUDA核心,并且支持光线追踪和着色器处理等提升游戏体验的关键技术。

英伟达今年计划仅推出RTX5090显卡,透露了哪些信号?

其次,AI GPU往往需要更大的内存带宽和容量来处理大量的数据集和模型。游戏显卡虽然也需要较高的带宽来处理高分辨率和复杂纹理,但通常不会像AI GPU那样需要极致的内存配置。再以V100和RTX4090为例,V100配备了32GB HBM2内存,而RTX4090拥有24GB GDDR6X内存。

再者,在价格方面,AI GPU的价格往往高于游戏显卡的价格。一般来说,AI GPU是面向人工智能企业推出的,为日益扩大的人工智能模型训练、推理、落地需求提供大量算力支持,而游戏显卡面对个人游戏玩家,价格更加亲民。

因此,不少人工智能公司会选择在算力租赁平台按年或月租用AI GPU的方式来缓解资金不足的情况。其中,好评如潮的AnyGPU算力云平台能按小时或天租用显卡,不仅有适用于深度学习的V100、A100GPU,还有资源充沛的RTX4090、RTX3080Ti等游戏显卡,满足不用的需求。

英伟达今年计划仅推出RTX5090显卡,透露了哪些信号?

最后,在功耗与散热方面,由于深度学习任务负载通常更密集,因此专门的AI GPU会设计有更高的功耗和散热需求。游戏显卡则会更注重能效比,对功耗和散热需求相对较低。

总的来说,AI GPU是人工智能时代下的产物,伴随着人工智能的热潮加剧,市场对AI GPU的需求呈指数式爆炸增长。英伟达转移重心至AI GPU正是顺应人工智能发展趋势,大力发展人工智能所需的稀缺算力,加速人工智能产业进步。

除了将重心放在AI GPU研发上,英伟达还在大力拓展东南亚数据中心,先后在马来西亚、新加坡、印尼等东南亚国家建设AI开发中心,满足人工智能产业日益增长的计算需求。除了英伟达追逐人工智能产业发展,谷歌、英特尔也纷纷推出AI芯片,用于人工智能加速任务。