-
科工力量:性能接近国际巨头后,龙芯将迎来什么?
【文/科工力量专栏作者 铁流】
日前,龙芯发布了用于服务器市场的的3D5000系列芯片,引发关注。
3D5000与3C5000属于同一代CPU,是采用Chiplet技术把两片3C5000芯片互联和封装在一起,进而获得一片32核CPU,这种方式也被称为“胶水32核”。就性能而言,龙芯3D5000的IPC接近AMD Zen2的水平,全芯片性能与同主频下的32核AMD Zen2架构CPU接近,对于大部分应用已经是够用了。
在2023年,性能更强的龙芯6000系列CPU将要问世,龙芯在IPC上与英特尔、AMD的差距将会进一步缩小,真正阻碍龙芯在市场上推广的要素将不再是CPU性能,而是软件生态。
龙芯5000系列是自主CPU里程碑
2019年,龙芯3A4000四核处理器亮相。龙芯3A4000是继3A3000之后的新一代处理器。3A4000既升级了新内核GS464V,IPC大幅提升;又通过在原有28nm工艺上深入磨合优化,改进电路和物理设计方法,在制造工艺与3A3000相同的情况下,将性能提升了一倍。就3A4000的IPC而言,已经从3A3000的7/G达到了9.8/G,AMD的Zen大致也就在10/G水平,龙芯3A4000的GS464V是一款可以与第一代Zen匹敌的内核。
3A5000的内核是基于GS464V进行小改,IPC为10.6/G,采用12nm工艺,主频为2.2G至2.5G,后期流片的有2.7G主频版本,SPEC06定点成绩超过26(GCC,@2.5Ghz),这对于自主CPU而言已经是非常不错了,即便和引进的CPU相比,其定点和浮点性能仅次于海光,超过其他引进的X86和ARM CPU。
龙芯3A5000与龙芯3C5000、3D5000属于同一代CPU,3C5000采用LoongArch指令集,16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。就SPEC2006测试来看,单核定点浮点Base分均大于10/G,单芯片分值超过200。可满足通用计算、大型数据中心、云计算中心的计算需求。该处理器通过芯片级安全机制可为等保2.0、可信计算、国密算法替代、网络安全漏洞防护等提供CPU级内生支持。
3C5000最大特点是单核性能强,特别是unixbench这种看重单核和内存性能,多核加速比很低的测试,龙芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到这个成绩。从公开的数据来看,3C5000的性能在信创市场足够用了,而且16核的核心是使其部署比较灵活。
龙芯3D5000则是把两个3C5000封装到一起的胶水32核芯片,集成了64MB的L3 Cache,支持最多8个DDR4-3200 DRAM,可以通过HyperTransport接口构建至多四路处理器,因此单机可以支持多达128核。在性能方面,龙芯3D5000单路和双路服务器的SPEC CPU2006 Base实测可以超过400分和800分,预计四路服务器的分值可以达到1600分。可以说,龙芯3D5000主要针对一些对性能有更高要求的场景,只要软件生态跟得上,完全可以替换掉英特尔至强CPU。
龙芯6000性能将再次飞跃
相对于一些技术引进CPU在引进海外技术后CPU IPC增长缓慢,性能提高基本依靠购买更好的EDA工具和买台积电更好的工艺。龙芯一直致力于提升CPU微结构设计水平来提升CPU的性能,没有盲目去堆核心数量。这种稳扎稳打的做法使龙芯在过去10年中IPC提升了3-4倍,在桌面CPU上成效立竿见影。
CPU的IPC在过去10年中提升了3-4倍,这使龙芯可以在制造工艺上落后技术引进的某ARM CPU一代的情况下,依然可以依靠CPU微结构设计水平做到性能持平或略优于技术引进的某ARM CPU。当龙芯与引进的某ARM CPU采用相同工艺时,龙芯可以凭借其IPC上的优势在性能上领先某ARM CPU。
龙芯3A5000
3A6000和3A5000采用相同制造工艺,龙芯依靠其设计能力把CPU性能大幅提升,主要是拉大框架,比如把4发射改成6发射等等。从此前公布的仿真成绩看,定点相对于3A5000提升30%,浮点相对于3A5000提升60%,这种提升是非常骇人的——如果仿真成绩与最终成绩相当,那么,3A6000 SPEC06单核定点Base分大于13/G,浮点Base分大于16/G,基本达到AMD Zen2水平。如果3A5000为2.5G至2.8G,那么,3A6000的 SPEC06单核定点Base分大于35,浮点将大于45。
从公开信息看,在使用相同工艺的情况下,3A6000性能比3A5000提升40%—60%,芯片面积缩小20%,12nm的3A6000对标7nm的AMD Zen2。做最保守估算,3A6000 SPEC06单核定点Base分为32分(@2.5G)至35分(@2.8G)。这个性能对于信创和日常使用而言都已经明显过剩了。
必须说明的是,仿真往往是不准确的,有的公司会高估,有的公司会低估,从龙芯这几年发布的信息看,龙芯是偏保守的,实测成绩只会比仿真成绩好,以最近流片回来的2K2000来看,实测成绩比龙芯仿真成绩高了20%至30%,这大大超乎龙芯的预期。龙芯2k2000的LA364性能基本追平ARM A76,充分展示了自主路线的发展潜力和发展活力。
3C6000是16核服务器芯片,内核是LA664,与3A6000相同。3D6000则是两片3C6000封装在一起构成32核服务器CPU,可以匹敌搭载Zen2核心的AMD EPIC。只要软件能跟上,商业市场已经没有性能短板了。
龙芯下一代7000系列CPU,进一步提升CPU核性能,IPC瞄准Zen3和12代酷睿,计划采用7nm工艺,SPEC06定点Base最保守估算是40分,届时,会有24-32核的3D7000(7nm)和48-64核3E7000(两片封装)。
-
本文仅代表作者个人观点。
- 责任编辑: 一鸣 
-
英特尔推出多次延期的处理器,中国“五朵云”到场支持
2023-01-12 23:59 观网财经-科创 -
“芯片卡脖子要紧,软件卡脖子一样要紧”
2023-01-11 15:29 观网财经-科创 -
我国空间新技术试验卫星第二批科学与技术成果发布
2023-01-11 14:19 航空航天 -
“最薄”非线性量子光源首次实现
2023-01-10 07:45 科技前沿 -
“人造太阳”基础物理研究取得新进展
2023-01-07 07:38 能源战略 -
中兴通讯:目前没有造车计划,定位是汽车核心技术提供方
2023-01-05 16:58 TMT观察 -
首个国产ECMO套包获批上市
2023-01-05 09:16 医学 -
激光退火仪在国内首条量子芯片生产线上投入使用
2023-01-04 11:12 科技前沿 -
如何在月球上建造基地?最新研究提出可利用月球这种特殊地貌
2023-01-03 15:36 航空航天 -
日均通关量翻一倍,数智化如何为中老磨憨公路口岸“解堵”?
2023-01-03 12:19 人工智能 -
“文昌发射场将建设载人登月工位、重型火箭工位”
2022-12-31 16:18 航空航天 -
倪光南:openEuler在支持RISC-V方面,已进入世界先进行列
2022-12-30 11:15 观网财经-科创 -
54战54捷!中国航天2022年度发射任务正式收官
2022-12-29 15:00 航空航天 -
乡村教师40岁从零自学代码,带出全国大奖学生
2022-12-29 13:47 中西教育 -
全球最大规模“沙戈荒”风电光伏基地项目在库布其沙漠开工建设
2022-12-29 07:59 能源战略 -
“相信中国人一定能做出全世界最好的屏幕”
2022-12-28 18:28 观网财经-科创 -
一款国产新冠口服药完成三期临床,预计最快明年2月上市
2022-12-28 09:32 医学 -
荣耀赵明:平板与苹果仍存较大差距,有信心逐步拿回国内份额
2022-12-27 19:02 手机 -
我国成功发射高分十一号04星
2022-12-27 16:59 航空航天 -
2023年首批国际项目将入驻中国空间站
2022-12-24 13:11 航空航天
相关推荐 -
又酝酿对中国光伏开刀?欧洲业界警告:不要重蹈覆辙 评论 140佐科宣布:正式启用! 评论 228“没有中国参与,解决方案难以想象” 评论 82“生日快乐,中国!”华春莹连发11组对比照片 评论 206最新闻 Hot
-
“豪华黄金周”出境游火爆,中国游客获得“VIP待遇”
-
又酝酿对中国光伏开刀?欧洲业界警告:不要重蹈覆辙
-
得知美国“援乌预算”被搁置,乌克兰连忙降温:我们理解
-
胜选后他明确表态:停止对乌军援,我们的人民正面临更严峻问题
-
佐科宣布:正式启用!
-
“没有中国参与,解决方案难以想象”
-
埃尔多安怒了:再也不指望他们
-
美参议员强行加戏:这样做等同于对台湾宣判死刑
-
iPhone 15热到不能碰?苹果回应
-
英国将首次向乌部署军队?苏纳克急为新防长灭火
-
又一个北约国家,立场要反转了?
-
“生日快乐,中国!”华春莹连发11组对比照片
-
投票关键时刻警铃炸响,“我寻思这是门呢…”
-
“在全球南方,几乎每个人都认为有替代西方的选项”
-
拜登回应政府“续命45天”:拿不出钱也得援乌
-
欧盟能做,中国做不得?
-