前不久,龙芯中科举办“2025 龙芯产品发布暨用户大会”,龙科多工作室受邀参加,并且专访了董事长胡伟武。期间,他特别谈了龙芯GPGPU设计能力。
具体观点如下:
我们2K3000处理器,集成了自己的GPGPU核。在我看来,从设计的复杂度来说,通用CPU最难,其次图形GPU,AI处理器(GPGPU)说实话比较容易。如果CPU复杂度是1,图形处理器复杂度,可能有0.3-0.4,但AI芯片复杂度对我来说,不到0.1,就是矩阵乘法、卷积运算,需要堆料。
那么AI领域,我们现在做的9A1000,硅面积可承载的算力,又提高了50%,快流片了。这个做完之后,我们评估,算力密度跟英伟达可比了。也就是说,如果我有跟它一样的工艺,一样的硅面积,一样的带宽,我的算力不会比它差。所以,这个结构技术已经突破了。
现在更重要的,就是市场,跟应用怎么结合,市场上怎么突破。我早上说了,龙芯是从端侧开始,在各种装备、设备控制领域用的很多,比如说无人机。像2K3000芯片,用的非常广,有几个T的AI算力,整个芯片的性价比较领先。别人做不出像我这样的性价比芯片,它面向的场景已经够用了。所以,我们先从端侧入手,2K3000是2号系列,还是CPU。
我们真正的GPGPU,实际上是9号系列,为什么叫9系列呢,因为9跟GPU中g(小写)较像,所以叫9号系列。9A1000快流片了,面向低成本,比如说面向AI PC,几十个T算力就行。9A2000开始完善一下,9A3000就开始堆料。所谓堆料,没有什么东西,给我足够的晶体管,给我足够的缓存带宽,就往上堆了,跟CPU不一样,因为它这个应用方法很固定,图形GPU也比它复杂。
1、本文只代表作者个人观点,不代表星火智库立场,仅供大家学习参考; 2、如若转载,请注明出处:https://www.xinghuozhiku.com/519656.html