首页 365速发国际 >新闻资讯 校园风采 365速发
Loongson正式宣布了接下来的三代GPGPU图形卡!从7年前对RX550进行基准测试直到进入XNM并与CUDA兼容
2025-07-01

Loongson最近举行了一次大新闻会议,该会议正式启动了Longson 3C6000 Seriz Server处理器,Longson 2K3000/3B6000M对工业和终端处理器的控制,甚至是下一个代价CPU Microchitection评论。同时,Loongson还审查了其在GPU图形核心领域的发展历史,并首次揭示了多样性和产品计划的未来技术。 Loongson的主要业务是CPU总体目标的处理器,制作GPU的最初目标非常简单,它可以解决Longson CPU的支持问题,因为当时,进口的低端GPU芯片的供应是不稳定且平稳的,且嵌入式GPU不适合桌面市场。通过其自己的CPU和GPU,Loongson是Maaaalso发展自我支持的,系统优势的形式并降低了系统成本。早在2016年,Longson GPU项目就启动了,这可能比许多人想象的要早。2017年,进行了图算法调查。 2018年,进行了一般的建筑设计,并进行了模拟器结构的设计; 2019年,完成了模拟器验证,逻辑和设计结构的阶段移至逻辑和结构设计阶段。 Loongson 2K2000 Longson 7A2000在2020年,出生于Longson的第一个GPU LG100,在Longson 2K2000处理器中使用,并且性能接近AMD R5 230,Longson完成了完整的GPU结构设计集和验证。计算能力在同一区域下增加了一倍,并且还用于固定功能投保人和可编程管道的Loongson 7A2000早期阶段,这些功能直接进入管道体系结构。终端。从一开始。完成,用于此时发布的Loongson 2K3000/3B6000M。借助路线图的酌情权,它还将具有LG210升级的迭代版本,该版本预计将在后来使用Longson 2K3000/3B6000M使用。Longson 2K3000/3B6000M中的联合LG200 GPU使图形性能翻了一番,像素填充速率从2GP/s到4GP/s,质地填充速率从2GT/s增加到8GT/s。它还支持OpenGL 3.3,OpenGL ES 3.1和OpenCL 1.1。 LG200还首先支持AI计算和速度的一般加速,并且运行AI活动(例如目标识别,大语言模型等)没有问题。可以说是Longson的第一个GPGPU产品。正式声称,FP16单位浮点的性能为900MHz的230.4 Gflops(每秒2304亿倍),INT8整数的性能为7.2个上衣(每秒7.2亿次)。实际上,其频率最高可达2.2-2.5GHz。如果适用,则FP16浮点和INT8整数的性能分别可以达到256 Gflops和8个顶部。可以说GPGPU是图形处理器历史发展的第四阶段。它结合了一般C呈现一个肩膀的兼容和图形,这也是现代GPU的主要特征。对于Loongson,CPU指导通常已经完成,GPU仍处于教学阶段,尤其是API支持。前面太多了。下一步将逐渐支持OpenGL 3.2/4.0和OpenCL 3.0(尽管通常很酷),并且将添加新的Vulkan1.1。什么?你说directx吗?这是一个封闭的标准。除非您购买诸如PowerVR Imageation之类的外国IP许可,否则暂时无法实现纯自我开发的国内GPU。在性能方面,Loongson GPU将继续升级体系结构,充分实现基本操作,然后扩展功能和性能,全面的优化和潜在的录制,逐渐实现图形管道的可扩展性以及单位区域的能量和性能的组成。这就是Loongson所说的“首先连接,然后是专家”,也就是说,首先是GPU,然后制作专用的GPGPU,尤其是在AI方面。当然,在此阶段,它主要针对AI Thatroyal的结束,以满足日常申请。至于云方面的AI训练,这是AI加速卡的工作,Loongson不会以某种方式认为它。 Longson的未来GPGPU也将分为三个步骤,而全新的Longson 9A系列也可以称为LG300系列。 Longson GPGPU架构设计看起来与Nvidia相似。它也分为许多GPC(图形处理簇),并通过L1N网络交织在一起。通过L2N网络,所有GPCS Plus 2缓存都连接到每个顶级模块,包括内存控制器,教学处理器,显示控制器,视频编解码器视频控制器和PCIE控制器。 LCL龙链也可以将两种硅晶圆都互连,以大大扩展芯片和性能量表。 WAITAP,GPC由GP图形管道和许多SP strea组成M处理器,每个流处理包括纹理单元和许多向量单元。每个矢量单元包括16个FP16单位浮点单元,1个FP32双精度浮点单元和1个张量张量单元(仅AI单元)。还确定了每个单元的性能指标。应该强调的是,即使loongson gpgpu是自我开发的,也没有关闭。该原则应与主流兼容并接受开放资源。作为加速计算平台,Longson GPGPU将具有所有功能。计算API不仅支持传统的OPENCL,而且建议与CUDA兼容(目前尚不清楚如何完成)。它可以支持整个AI场景,例如培训,推理和安排货物,这些商品涵盖了所有云侧字段,侧面以及侧面。此外,图形API将遵循两个主要的OpenGL和Vulkan Industries,并支持加速视频和编解码器的支持er更多格式。 Loongson 9A1000:它进入了设计阶段的结束,并尽快完成并于2026年推出。这将是Loongson的第一个GPGPU芯片。这样,它可用于独立的图形卡和AI加速卡。它具有相对较低的定位和低成本。它的性能几乎等同于AMD RX 550 7年的入门级图形卡,但它支持表面段,计算着色器和其他功能。但是,Graphics API仅支持OpenGL 4.0(RX 550 OpenGL 4.6)。集成的视频编解码器模块以支持最典型的H.264和H.265。就AI推理性能而言,预计INT8整数格式将达到32-40的顶部。 Loongson 9A2000:于2027年推出,它将实现主要性能并实现台式机和服务器的全部操作。通过优化建筑和材料,可以大大提高性能单位比率,并且可以通过ABO提高整体性能UT 4次,例如FP16浮点可达到5个TFLOPS,INT8整数达到160个顶部。它还将首次支持双硅晶圆互连,其性能在同一过程中达到国际高级水平。在图形API方面,它可以支持OpenGL 4.6。张量单元支持包括BF16在内的更多数据格式,并且已发出虚拟化支持。 Loongson 9A3000:没有时间表,它将首次影响高端和高性能。像Loongson CPU一样,该过程正在出现XNM。预计频率将大大提高,并且性能将恢复3-5倍。 [本文的结尾]如果您需要打印,请确保指示来源:Kuai技术编辑:Shangfang Wenq

Copyright © 2024-2026 365速发国际_365国际速发平台官网 版权所有

网站地图

鄂ICP备36659856号

友情链接: