国产CPU六剑客,能否撑起中国CPU的一片天?
中央处置器(CPU),望文生义,是底层硬件根底设备中的核心。
当前CPU支流芯片架构为Arm和x86,均为国外主导,国产化率较低。颠末多年开展,国产CPU初步构成六大厂商齐头并进的格局,以鲲鹏、飞扬、龙芯、兆芯、海光、申威为代表,一批优良国产CPU企业快速兴起。
此中,龙芯中科、海光信息在2022年先后登岸科创板,海光信息自上市后不断是科创板市值更高的芯片半导体公司。截至2023年1月16日收盘时间,海光信息总市值967亿元,龙芯中科总市值为352亿元。
按指令集架构,国产CPU厂商接纳的道路可分为四类:x86、Arm、MIPS、Alpha。
▲从指令集架构看CPU市场格局
x86是当前PC及办事器市场的支流架构。海光信息、兆芯都接纳x86架构IP内核受权形式,可基于公版CPU核停止优化或修改,长处是性能起点高、生态壁垒低,但因为依赖海外企业受权,自主可控风险偏高。
相较x86,走Arm道路自主化水平更高。华为鲲鹏、飞扬都获得了Armv8永久受权,可自行研发设想CPU内核和芯片,也能够扩大指令集。不外Arm将不再向那些国产CPU厂商供给Armv9的永久受权,因而接纳Arm架构仍存持久隐患。
龙芯中科、申威别离走的是MIPS、Alpha道路,自主可控水平相对更高,但偏小寡。
此外,与Arm、MIPS同源的RISC-V也正在鼓起。因其相对精简的指令集架构(ISA)以及开源宽松的BSD协议近年来开展较快,国内阿里平头哥、国芯科技等企业推出了基于RISC-V架构的相关嵌入式CPU产物。
本期我们保举国金证券的陈述《中流击水—六大国产CPU厂商阐发》,揭秘六大国产CPU厂商的最新开展格局。
01.
华为鲲鹏:垂曲生态的指导者,
国产办事器CPU黑马
华为自研芯片有五大类,包罗办事器芯片鲲鹏系列、手机SoC芯片麒麟系列、人工智能芯片昇腾系列、5G基站芯片天罡系列、5G末端芯片巴龙系列等,以及凌霄芯片、NB-IoT芯片、视频编码解码芯片以及SSD控造芯片等一系列公用芯片。
▲华为芯片全景图
此中鲲鹏处置器基于Armv8指令集永久受权,自主研发设想处置器内核,兼容全球 Arm生态。华为围绕鲲鹏处置器打造了“算、存、传、管、智”五个子系统的芯片族,实现全场景处置器规划。当前其鲲鹏芯片族正沿着“量产一代、研发一代、规齐截代”的战略持续晋级产物。
2019年,华为发布鲲鹏920处置器。该芯片撑持Armv8.2指令集,是行业内首款7nm数据中心Arm处置器。鲲鹏920由华为自主研发,接纳多发射、乱序施行、优化分收预测等多种手段提拔单核性能。
鲲鹏920拥有64个内核,集成8通道DDR4,能够供给多个接口,主频可达2.6GHz,总内存带宽更高可达1.5Tb/s,撑持PCIe 4.0及CCIX接口,总带宽640Gbps。华为 Cache一致性总线(HCCS)的480Gbps片间互联撑持最多4颗鲲鹏920互联和更高 256个物理核的NUMA架构,包管了鲲鹏920超强算力的高效输出。
▲鲲鹏920处置器关键特征
此外,鲲鹏920在Memory子系统上也停止了大量的优化,接纳当前典型的3级Cache的架构,对Cache大小以及延时停止了优化设想。
非x86架构芯片中,鲲鹏920芯片在算力维度方面优势领先,且开展至今已经到达能够与x86芯片相婚配的性能。参照鲲鹏920差别核心下与竞品芯片的比照,其在48核时,整数打平英特尔旗舰级办事器芯片至强8180(28核、2.5GHz频次),功耗低20%;在64核心时,比过英特尔至强8180 33%摆布。
华为也在构建openEuler开源社区,高效推进处置器深度优化。openEuler开源社区以 Linux kernal、GNU等为上游社区,按期同步上游社区立异功效,并针对鲲鹏处置器停止深度优化,供给完好OS开发情况和上下流生态验证情况,使开发者和用户高效开展需求适配、生态集成和测试认证。
▲OpenEuler开源社区
鲲鹏计算财产生态不竭扩大。鲲鹏计算财产是基于鲲鹏处置器构建的全栈IT根底设备、行业应用及办事,包罗PC、办事器、存储、操做系统、中间件、虚拟化、数据库、云办事、行业应用以及征询办理办事等。
▲鲲鹏计算财产首批厂家
该道路是华为提出的六大数字手艺生态之一,除鲲鹏外还包罗昇腾、HMS、鸿蒙、华为云、MDC(智能驾驶计算平台)。此中鲲鹏是华为面向政企市场,与处所政府和合做伙伴配合打造鲲鹏财产生态、构建具有国际合作力的通用计算手艺道路。
华为鲲鹏得到了处所政府的鼎力撑持。2020年4月,成都会印发《关于加快培育开展鲲鹏财产工做计划的通知》,明白2025年成都鲲鹏财产规模超越500亿元,并成为全国领先的鲲鹏软件生态基地、鲲鹏硬件造造基地和鲲鹏应用示范基地,该案例为鲲鹏财产系统的推进供给了重要模板。
02.
飞扬:PKS生态系统主导者,
党政市场占有率高
另一家接纳Arm架构的国产CPU玩家飞扬,由中国电子信息财产集团、天津市滨海新区政府和天津先辈手艺研究院于2014年结合成立。
2020年以来,飞扬对高性能办事器CPU、高效能桌面CPU、高端嵌入式CPU三条财产线停止了全面的品牌晋级。
高性能办事器CPU产物线同一以飞扬腾云S系列停止定名,高性能桌面CPU产物线以飞扬腾锐D系列停止定名,高端嵌入式CPU产物线同一以飞扬腾珑E系列停止定名。
▲飞扬腾云S2500性能提拔明显
其2020年发布的腾云系列新一代可扩展多路办事器芯片腾云S2500与FT 2000+比拟性能大幅提拔。在整机性能方面,双路的SPECint分值为本来的2倍,四路的SPECint 值为本来的3.5倍;在散布式数据库性能方面,双路办事器的tpmc值线性提拔至本来的2倍,四路的tpmc值线性提拔至本来的4倍;在云桌面撑持方面,双路办事器撑持虚拟机70个,是本来的2.5倍,四路办事器撑持140个,是本来的5倍。
比拟上一代产物FT-2000/4桌面处置器芯片,最新飞扬高效能桌面CPU腾锐D2000的性能大幅跃升,带宽达18.7GB/s,SPECint分值为97.45,SPECfp分值为94.62,接近本来的2倍,在计算才能上得到进一步提拔,并兼顾桌面末端与边沿办事器。此外,腾锐D2000与FT-2000/4产物管脚兼容,用户能够实现现有系统的原位拔插代换、无缝兼容。此设想可以大幅降低产物研发成本,同时降低整机合做伙伴的开起事度,加快开发进度。
▲腾锐D2000与飞扬其他产物的性能比照
在生态建立方面,飞扬与1600余家国内软硬件厂商打造完好生态系统,与6大类 1000余种整机产物、2600余种软件和外设完成了适配;基于飞扬桌面CPU的末端已构成了较为完好的生态图谱,可笼盖从整机硬件、根底软件到上层的应用;基于飞扬桌面CPU的末端产物已可以实现海量安卓应用的运行,基于飞扬CPU的软件生态也在不竭丰硕和完美。
飞扬是PKS系统指导者。PKS系统最早由飞扬CPU(Phytium)和麒麟操做系统(Kylin)构成的“PK系统”开展而来。依托飞扬全新的硬件级平安机造,以相关可信手艺为支持,PK系统交融“S-Security”的立体防护平安链,晋级为PKS系统,并全球初创将“可信计算3.0”手艺融入到CPU、操做系统和存储控造器中,实现底层构架的素质平安,并成为国内首个计算机软硬件根底系统尺度。
比照鲲鹏与飞扬的生态构建,能够发现,鲲鹏手艺道路比PKS道路有较明显的手艺和产物优势,PKS手艺道路比鲲鹏手艺道路有较明显的平安优势。
▲鲲鹏计算财产与PKS手艺道路对照表
鲲鹏在硬件末端、云平台、人工智能、中间件等方面具有绝对优势,但在平安方面略逊一筹。PKS道路的一个显著特点是“注入平安”,即“PKS”系统中的“S”,将平安贯串从CPU、OS底层到产物办事应用,不断到供给链平安保障的全过程,为信创工程供给内生平安、过程平安和供给链平安的全流程办事。
03.
海光信息:领跑国产办事器CPU,
科创板半导体股市值第一
海光信息成立于2014年,主营产物包罗CPU和DPU(属于GPGPU),营收规模和增速都位居国产CPU企业的前排。
因为x86架构在办事器CPU的市占率超9成,海光信息CPU兼容x86指令集,使得其具备较高的应用兼容性、较低的迁徙成本,有望受益于x86完整的生态系统。
该公司在2021年实现初次盈利,背靠中科曙光、AMD两家巨头。
国产高性能计算龙头企业中科曙光,是海光信息的第一大股东,也是海光信息的优良客户源。曙光办事器中应用海光产物的比例超越30%,为海光芯片的放量打下了深挚根底。
海光信息的x86受权来自全球第二大x86处置器供给商AMD公司。2016年,AMD和海光信息合资成立了成都海光微电子手艺有限公司和成都海光集成电路设想有限公司,受权海光微电子x86指令集和Zen架构,AMD获得2.93亿美圆的受权费。
海光集成电路购置海光微电子的IP受权,以此为根底开发CPU。海光集成电路与海光微电子的股权构造包管了公司在躲避了英特尔的x86受权限造的同时,又使得海光x86 CPU成为内资公司开发的产物,满足了国度财产政策和立异的需求。
其产物基于AMD Zen1架构,产物性能起点较高。比照英特尔在2020年(与海光7285 同期)发布的6款至强铂金系列产物(可以反映英特尔2020年发布的支流CPU产物的性能),在典型场景下,海光7285已接近国际同类高端产物程度。
▲海光7285与英特尔至强铂金系列产物比照
海光CPU次要面向复杂逻辑计算、多使命调度等通用途理器应用场景需求,兼容国际支流x86处置器架构和手艺道路,具有先辈的工艺造程、优良的系统架构、丰硕的软硬件生态等优势,并内置公用平安硬件,撑持通用的可信计算尺度,可以停止主动平安防御,更大程度制止平安破绽和隐患,满足信息平安的开展需求。
▲海光CPU次要规格和特点
面向企业计算、云计算数据中心、大数据阐发、人工智能、边沿计算等浩瀚范畴,海光信息供给了多种形态的处置器,满足互联网、电信、金融、交通、能源、中小企业等的普遍应用需求。
电信和金融是其产物应用最多的两个范畴。基于前期电信、金融、互联网等行业对其产物的承认,海光信息在电信运营商集采、金融行业入围等方面市场份额增长较快,其产物在相关重点行业销量逐步提拔。
04.
兆芯:合资CPU的探路者,
掌握三大核心手艺
兆芯于2013年由台湾威盛与从属于上海市国资委的上海联和投资公司所合资成立,威盛持股20%,上海国资委持股80%,总部位于上海张江,在北京、西安、济南等地设有子公司。
威盛与英特尔穿插受权协议,拥有设想、消费x86芯片权力,手艺受权来自威盛。2020年10月26日,威盛做价2.57亿美圆将部门x86手艺出卖给兆芯,兆芯拥有了部门x86手艺产权。
目前兆芯同时掌握中央处置器、图形处置器、芯片组三大核心手艺,具备相关IP自主设想研发的才能,已胜利研发并量产多款通用途理器产物,构成PC/嵌入式处置器“开先”、办事器处置器“开胜”、IO拓展芯片/芯片组三大产物系列,产物性能不竭提拔,到达国际支流同等程度。
此中,兆芯开先KX-6000系列处置器是国内率先实现主频3.0GHz关键打破的国产通用途理器。
▲兆芯产物系统与处理计划
兆芯通用途理器具备优良的操做系统和软硬件兼容性,生态系统成熟,撑持构建台式机、条记本、一体机、云末端等多品种型的桌面整机以及办事器、存储等产物。在嵌入式范畴,也已经有差别规格基于兆芯通用途理器的工业主板、模块化电脑、工业整机、Box PC、工业级办事器、收集平安平台等产物陆续推出。
开先KX-6000/开胜KH-30000系列处置器是业内第一款完好集成CPU、GPU、芯片组的SoC单芯片国产通用途理器,那为整机系统的开发供给了较大的便当前提,同时也更利于控造成本。那两个系列处置器的单芯片性能比拟上一代产物提拔了多达50%,同频下性能功耗比则是上代产物的3倍。
▲兆芯产物系列
英特尔处置器横向比照,8核心的KX-U6780A产物性能与第七代的4核心英特尔i5整体程度仍存在差距,尤其是单核性能不敷7代i5一半,但整数性能方面临英特尔i5实现了反超。
▲兆芯KX-6000系列处置器横向比照
在财产链合做方面,兆芯积极协同财产合做伙伴,为政府、金融、教育、交通、能源、收集平安、医疗、通信等行业供给多样化的产物息争决计划,助力客户应用实现光滑迁徙。目前,基于兆芯新一代处置器(KX-6000/KH-30000),已有20余款差别形态的桌面PC及办事器产物,30多种工业主板、工业电脑模块和嵌入式计算平台,以及30多种收集平安平台相继推出。
05.
龙芯中科:自主可控水平高,
主力CPU产物进入快速增长阶段
龙芯中科是中国科学院计算所自主研发的通用CPU,接纳自主LoongISA指令系统,兼容MIPS指令,所有IP模块皆为自主设想,拥有片内平安机造、可信性高。
龙芯处置器以32位和64位单核及多核CPU/SoC为主,次要面向高端嵌入式、小我电脑、办事器和高性能机等应用。
2002年8月降生的“龙芯一号”是我国首枚拥有自主常识产权的通用高性能微处置芯片。龙芯中科从2001年至今共开发了1号、2号、3号三个系列处置器和龙芯桥片系列,在政企、平安、金融、能源等应用场景得到了普遍应用。
其产物系统分为三大系列,龙芯1号系列为低功耗、低成本的公用嵌入式SoC或MCU 处置器,次要按照需求定造;龙芯2号系列为低功耗通用途理器,接纳单芯片SoC设想,应用场景面向工业控造与末端等范畴,定位可类比英特尔的凌动系列;龙芯3号系列为高性能通用途理器,凡是集成4个及以上的64位高性能处置器核,与桥片配套利用,应用场景面向桌面和办事器等信息化范畴,对标英特尔的酷睿/至强系列。
▲龙芯中科产物系统
龙芯中科自主研发的LoongArch,具有较强的扩展性和自主性。LoongArch包罗根底架构部门和向量指令、虚拟化、二进造翻译等扩展部门近2000条指令,具有较好的扩展性。LoongArch指令系统从整个架构的顶层规划,到各部门的功用定义,再到每条指令的编码、名称、含义,都停止了自主设想,具有充实的自主可靠性。
此外,LoongArch充实考虑兼容需求,在定义时充实考虑了MIPS、x86、Arm、RISC-V等次要指令系统的特征,摒弃了传统指令系统中部门不适应当前软硬件设想手艺开展趋向的陈旧内容,吸纳了近年来指令系统设想范畴诸多先辈的手艺开展功效。
同原有兼容指令系统比拟,LoongArch不只在硬件方面更易于高性能、低功耗设想,并且在软件方面更易于编译优化和操做系统、虚拟机的开发。
▲LoongArch架构优势
基于自主指令系统(LoongArch)的3A5000/3B5000,是龙芯当前重点开展产物。
龙芯3A5000/3B5000是面向小我计算机、办事器等信息化范畴的通用途理器,基于LoongArch的LA464微构造,进一步提拔频次、降低功耗、优化性能;在与龙芯3A4000处置器连结引脚兼容的根底上,频次提拔至2.5GHz,功耗降低30%以上,性能提拔50%以上。龙芯3B5000在龙芯3A5000的根底上撑持多路互连。
▲龙芯3A5000/3B5000产物参数
从龙芯3A5000在SPEC CPU 2006 BASE性能测试中的表示来看,龙芯3A5000单审定点为25.1分,单核浮点为26分,比拟英特尔i5 9500六核14nm有不小差距,但单审定点与国产Armv8四核7nm处置器八两半斤,单核浮点略优。龙芯3A5000比照国产 Armv8八核14nm处置器的单审定点则超出跨越近10分,单核浮点则超出跨越近1倍。
多线程测试中,英特尔i5 9500六核14nm处置器仍然表示更佳,而龙芯3A5000的多审定点与多核浮点均高于国产Armv8四核7nm处置器,因为国产Armv8八核14nm处置器核心数量上具有必然的优势,因而定点和浮点的分数要高于龙芯3A5000和国产 Armv8四核7nm处置器。
龙芯3A5000在支流内存带宽测试法式Stream Copy的子项性能测试中表示超卓,表示超越英特尔i5 9500六核14nm处置器。其Copy单线性能获得16864分,多线性能获得21873分。国产Armv8八核14nm处置器和国产Armv8四核7nm处置器分数相差不大,但整体表示比龙芯3A5000稍逊一筹。
龙芯承袭独立自主和开放合做的运营形式,从指令集/IP核受权、到芯片级/主板级开发以及系统内核应用等方面临生态伙伴停止全方位的开放撑持。目前龙芯的信息化合做伙伴到达上千家,能够供给基于龙芯从端到云的完好处理计划,相关软硬件开发人员数万人。
龙芯开源社区是龙芯CPU的根底软件生态建立平台,由龙芯中科组织并结合财产链合做厂商、国际开源软件社区及开源喜好者配合参与建立。社区以“开源、开放”的形式停止办理,设置BIOS、Linux内核、GCC编译器、Java虚拟机、阅读器、媒体解码库、图形桌面、KVM虚拟机等重要根底软件项目。颠末多年建立,信息化应用中的支流编程语言和开发情况已在龙芯平台上得到撑持。
▲龙芯的开源社区建立
06.
申威:特种范畴的指导者,
为“国之重器”中国超算供给大脑
成都申威成立于2016年,依托国度信息平安开展战略,次要处置对申威处置器的财产化推广。
申威处置器以Alpha指令集为根底停止拓展,高度自主可控。Alpha指令集由美国DEC公司研造,次要用于64位的RISC微处置器。DEC公司后被美国惠普收买,无锡江南计算所购置了Alpha指令集的所有设想材料。江南计算所基于本来的Alpha指令集,开发出了更多的自主常识产权的指令集,并研造了申威指令系统,推出了申威处置器。
申威处置器是在国度“核高基”严重专项撑持下,由上海高性能集成电路中心研造的全国产处置器。首颗申威处置器代号“SW-1”,于2006年研造胜利,基于DEC公司Alpha架构,接纳130nm造程,主频为900MHz。
▲申威次要产物系列
出于平安性能以及常识产权角度,申威在研发出第一代基于Alpha指令集的CPU后,将指令集替代为自研的自主可控申威64位指令集,完全区别于原有Alpha指令集。
申威处置器专注于高性能计算,尤其是在办事器范畴,浮点运算算力与同期外国处置器相当。申威SW26010是中国首个接纳国产自研架构且性能强大的计算机芯片。
▲申威26010性能比照
申威26010处置器的峰值性能大于每秒12.5千万亿次浮点运算成果,峰值速度、持续性能、性能功耗比排在世界前列。
在2016年法兰克福世界超算大会上,国之重器“神威·太湖之光”搭载该处置器登顶国际TOP500超等计算机榜单之首,并成为全球首台峰值计算速度超越十亿亿次的超等计算机。随后,我国科研人员依托“神威·太湖之光”的应用功效初次荣获“戈登·贝尔”奖,实现了我国高性能计算应用功效在该奖项上零的打破。
申威8A芯片接纳最新的第四代申威处置器核心(简称Core4)。Core4核心继续接纳超标量流水线构造,撑持乱序发射、乱序施行、揣测施行,并初次接纳SMT手艺,撑持每个核心同时运行两个线程。
比拟上一代4核CPU申威421,申威831在功耗相当的前提下,性能提拔2倍以上,下一代产物申威4E比拟申威831性能再提拔50%以上,与英特尔中端桌面处置器相当;申威下一代办事器产物威鑫8A与英特尔中端办事器处置器相当。
▲末端处置器性能比照(SPEC分值)
颠末持久不变的研发,基于系列申威芯片的各类产物也逐步增加,在保障特种范畴应用和国度战略使命的前提下,跟着其产物手艺的日益成熟,其生态也不竭完美。
▲申威生态
颠末多年开展,六大国产CPU支流玩家,各具优势,也各存短板。考虑到产物性能和生态优势,短期内海光信息、华为鲲鹏、飞扬在市场化道路上估计更为好走。但目前尚未见哪家在高自主化水平、高商用市场承受水平方面做到两全,国产化道路仍然盘曲漫长。在自主可控持久需求的驱动下,国产CPU龙头需更有定力,肩负起可持续的手艺立异研发重任,才有才能参与到更持久的国际合作中。
来源:芯工具
若有侵权,请联络删除
发表评论