宣布扩大阵线 SerDes IP之后,4月24日,在联发科深圳办公室,联发科举行了一场小型的媒体会,联发科副总经理暨
近年随着以比特币为代表的虚拟货币市场的火爆,催生了一大批生产“挖掘”虚拟货币设备的“矿机”厂商,其中最为知名的要属比特大陆了。而比特大陆之所以能够在矿机市场异军突起,则主要得益于其自主设计的针对比特币矿机的ASIC芯片。因为相对于CPUGPU来说,采用专用的ASIC芯片来“挖矿”更具效率。以比特大陆的Antminer S9矿机为例,其内部集成了189个 ASIC芯片(BM1387),而且采用的是台积电16nm FinFET制程。同样,目前主流的矿机厂商都采用的是定制的ASIC芯片。这也使得ASIC芯片开始被大众所熟知。但是ASIC芯片并不仅仅能被用于“挖矿”,还被用于包括人工智能在内等众多领域。
那么什么才是ASIC芯片?它与我们常见的CPU、GPU等通用型芯片相比又有何不同?
早在1981年3月,Sinclair公司推出了一款8位个人电脑ZX81,其所采用的Z80处理器则被认为是最早的ASIC原型。实际上ASIC是Application-Specific Integrated Circuit(应用型专用集成电路)的缩写,是一种专用芯片,是为了某种特定的需求而专门定制的芯片的统称。比如专用的音频视频处理器,同时目前很多专用的AI芯片业可以看作是ASIC的一种。
CPU与GPU都是我们常见的通用型芯片,它们在各自领域都可以高效地完成任务,但当同样应用于通用基础计算领域时,设计架构的差异直接导致了两种芯片性能的差异。
CPU作为通用处理器,除了满足计算要求,为了更好的响应人机交互的应用,它要能处理复杂的条件和分支,以及任务之间的同步协调,所以芯片上需要很多空间来进行分支预测与优化(control),保存各种状态(cache)以降低任务切换时的延时。这也使得它更适合逻辑控制、串行运算与通用类型数据运算。
而GPU拥有一个由数以千计的更小、更高效的ALU核心组成的大规模并行计算架构,大部分晶体管主要用于构建控制电路和Cache,而控制电路也相对简单,且对Cache的需求小,只有小部分晶体管来完成实际的运算工作。所以大部分晶体管可以组成各类专用电路、多条流水线,使得GPU的计算速度有了突破性的飞跃,拥有了更强大的处理浮点运算的能力。这决定了其更擅长处理多重任务,尤其是没有技术含量的重复性工作,比如图形计算。由于深度学习通常需要大量的训练,训练算法并不复杂,但数据非常量大,而GPU的多内核、并行处理的优势,使得其相比CPU更适合深度学习运算。
FPGA(现场可编程门阵列)是一直可编程的半定制芯片,其与GPU一样具有并行处理优势,并且也可以设计成具有多内核的形态,当然其最大的优势还是在于其可编程的特性。这也意味着用户可以根据需要的逻辑功能对电路进行快速烧录。即使是出厂后的成品FPGA的逻辑块和连接,用户无需改变硬件,就可通过升级软件来配置这些芯片来实现自定义硬件功能。
相较于我们常见的CPU、GPU等通用型芯片以及半定制的FPGA来说,ASIC芯片的计算能力和计算效率都直接根据特定的算法的需要进行定制的,所以其可以实现体积小、功耗低、高可靠性、保密性强、计算性能高、计算效率高等优势。所以,在其所针对的特定的应用领域,ASIC芯片的能效表现要远超CPU、GPU等通用型芯片以及半定制的FPGA。这一点,我们从前面提到的“矿机”市场所采用的芯片的变化上就能够看到。
在比特币诞生之初,由于单位时间内比特币的产量较多NG体育平台,对于算力要求也不高,所以早期人们大都采用的是电脑的CPU来“挖矿”。随后来大家发现用GPU“挖矿”效率更高,于是便转向开始采用GPU来挖矿。直到2013年左右,低成本灵活性强的FPGA才被用于挖掘比特币。而随着挖掘比特币所需的算力越来越高,以及挖掘成本(主要是电费)的提升,主要的矿机厂商都开始采用能效更高的ASIC芯片取代了GPU/FPGA来运行比特币SHA-256哈希算法。正因为这些ASIC芯片是针对运行SHA-256哈希算法而设计的,这也使得它在挖掘比特币的能效上要远高于CPU/GPU/FPGA。
当然,ASIC芯片的缺点也很明显,因为其是针对特定算法设计的,一旦芯片设计完毕,其所适应的算法就是固定的,所以一旦算法发生变化就可能将会无法使用。比如近期,比特大陆发表了一种基于新款ASIC芯片的矿机蚂蚁矿机 X3,主要是针对门罗币(XMR)以及依赖 CryptoNight 算法的加密货币。但是随后门罗币随即发出反制声明,将改变核心算法以对抗ASIC算力的入侵。如果门罗币的核心算法真的改变的话,那么比特大陆的这款新的ASIC芯片的能效将会大打折扣,甚至可能会面临效能低下的尴尬局面。另外由于是专用的芯片,所以如果出货量不大的话,那么芯片成本就会比较高,当然出货量越大成本会越低。
同样对于人工智能应用来说,由于目前人工智能技术还是处于发展当中,大量的算法不断涌现和持续优化,而且这种变化以各自的方式在加速。而ASIC芯片由于其在设计之时就是针对特定算法进行固化的,所以无法做到适应各种算法。虽然一些手机芯片厂商开始在SoC当中集成专用的AI内核(比如麒麟970的NPU),但是其主要还是只能针对一些特定的AI算法进行加速。而对于其他的算法还需要依赖于SoC当中的CPU、GPU来实现。
特别是在云端的服务器/数据中心,目前更多的还是依赖于CPU、GPU以及可重复编程和可重新配置的FPGA来进行人工智能运算和推理。
不过在联发科副总经理暨智能设备事业群总经理游人杰看来,虽然CPU、GPU等通用型芯片以及FPGA可以适应相对更多种的算法,但是特定算法下ASIC的性能和效能要更高。另外,虽然FPGA的便定制特性比ASIC芯片更加灵活,但部署FPGA所付出的成本也要比ASIC更高。而随着软件、算法的成熟和稳定,相关厂商必然会进一步追求性能和能效的最佳化,未来ASCI的应用将会越来越广泛。
而对于未来ASIC是否会取代FPGA的问题,联发科智能显示暨客制化芯片事业部行销处处长彭建凯则表示:“我认为ASIC与FPGA之间并不会是谁取代谁,而是会长期共存。因为技术总会在不断的发展,在面对一个新的技术和应用的时候,算法会不断的进行快速升级,在这种情况下FPGA会更为合适。而对于那些软件、算法已经比较成熟和稳定的领域,ASCI会更为适合。比如,人脸识别、语音识别厂商,在新的技术应用之初,通常会选择FPGA,这样可以不断的进行微调升级,而等到完全算法成熟需要大规模部署之时,必然会采用ASIC来提升能效。4G运营商在部署网络之初,量不够大的时候,采用FPGA就可以符合市场的要求,但是等到技术成熟,需要大规模部署时,ASIC会成为最佳的选择。毕竟FPGA的频宽不够,运算能力也不够。”
从整个产业发展的变迁来看,之前的诺基亚时代是以芯片为核心,产品与应用均是封闭的生态;而到了安卓时代,安卓操作系统开始上升为核心,芯片和产品是封闭的,应用是开放的;而到接下来的物联网/人工智能时代,随着用户需求的越来越多元化和差异化,应用领域将会成为核心,而不同应用领域差异大、场景复杂、产品种类量丰富、方案的定制化成倍增长,当前现有的芯片很难完全适配,也很难用类似现在手机行业的通用芯片的方式解决所有问题。同时操作系统和处理架构也将会根据细分市场来重新定义,芯片和产品都将走向定制。
另外需要指出的是,虽然通用型芯片适用范围广,对于厂商来说也更为简单易用,但是也造成了市场上产品的同质化,随着市场竞争的日趋激烈,越来越多的厂商开始寻求差异化。而采用独特的芯片则可以给厂商带来较大的差异化。与此同时,众多新的应用和特殊需求的出现,也需要独特的芯片来满足市场需求。这也正是ASIC的机会所在。
从目前众多行业巨头的布局来看,都在积极的布局定制化芯片,特别是在AI芯片布局方面,已经成为了众多行业巨头的重心,因为包括深度学习、机器学习、大数据分析及判断、自动决策等各种AI应用如雨后春笋般出现,而针对不同应用打造的特殊应用芯片(ASIC)需求也自然呈现爆发态势。
比如苹果除了有针对自己的iOS应用生态自研的A系列处理器之外,多方消息显示苹果还在定制自己的电源管理芯片、GPU芯片和基带芯片。苹果最新的A11 Bionic芯片当中也已经开始加入定制的AI内核NPU。另外,值得一提的是华为的麒麟970当中也加入了采用寒武纪的IP的NPU内核。
谷歌针对AI很早就设计了自己的TPU芯片,之前的Alpha Go就有采用。此外,谷歌自己的手机Pixel 2也首次采用了自研芯片Pixel Visual Core以提升拍照性能。
在2015年英特尔以167亿美元收购了FPGA生产商Altera之后,2016年英特尔又以4亿美元收购了机器学习初创公司Nervana。经过一年多的整合之后,英特尔会在去年推出一款专为深度学习而打造的神经网络处理器Nervana(NNP),并计划将其用于自己的数据中心业务当中。另外,在2016年9月,英特尔收购了专注于计算机视觉方面的AI芯片公司Movidius,该公司拥有自主设计的Myriad系列 VPU,被众多的厂商广泛应用。比如大疆的Spark无人机、谷歌Clips相机等。
去年10月,微软设备部门全球副总裁Panos Panay接受CNBC采访时也确认了微软正在为下一代HoloLens MR头戴设备研发AI芯片,并表示微软不仅拥有一支专注的IC设计团队,而且还与芯片制造商和其他合作伙伴共同开发。
今年年初有消息称亚马逊已经在为旗下的 Echo 音箱以及其他搭载亚马逊旗下的虚拟助手 Alexa 的硬件产品开发专用的AI芯片。
今年4月,从Facebook的招聘信息显示,Facebook正在大力招聘ASIC & FPGA设计工程师和负责管理ASIC的开发的经理,组建一个新的团队设计自主AI芯片。
国内互联网巨头阿里从2015年开始布局自研芯片,特别是在物联网和AI领域投入巨大,今年全资收购的杭州中天微曾发布过基于AliOS软硬件框架的 3 款云芯片(Yun on chip),包括计算机视觉芯片、融合接入安全的MCU平台芯片、以及AliOS 的NB-IoT物联网安全芯片。不久前,阿里巴巴旗下的达摩院也宣布正在研发一款名为Ali-NPU的神经网络芯片,按照设计,Ali-NPU性能将是现在市面上主流CPU、GPU架构AI芯片的10倍,制造成本和功耗仅为一半,性价比超40倍。据悉,Ali-NPU主要是为解决图像、视频识别、云计算等商业场景的AI推理运算问题,提升运算效率、降低成本。
由于这样的例子太多,所以这里我们就不再一一例举。需要说明的是,除了众多厂商对于AI的热捧推动对于ASIC需求的暴涨之外, 其他一些对于芯片性能和能效要求较高的市场(比如前面提到的物联网市场以及“矿机”市场)对于ASIC的需求也是在快速增长当中。
联发科智能显示及定制化芯片事业部市场总监彭建凯也表示:“区块链、AI/ML/DL、超大规模数据中心、智能汽车都是当下非常火爆和快速增长的几个市场,这些领域对于芯片的性能和能效的要求都是非常高的,需要强大的芯片来支持。随着这些技术的成熟,未来对于ASIC芯片的需求也将会越来越大。”这也是联发科加大对于ASIC业务投入的一个重要原因。
资料显示,当前中国已有近2000家IC设计公司(包括具备设计能力的科研院所),但真正涉足IC设计服务的企业不多。而且一款芯片从设计到工艺制造、到封装测试、到终端应用涉及非常多的环节,每一个环节都需要有相关的关键IP和丰富技术经验作为支持。显然,一些传统的IC设计公司在这方面具有很大的优势。而随着ASIC市场的兴起,以联发科为代表的传统IC设计厂商开始开放IC设计能力,提供ASIC定制服务也是必然。
其实早在2012年,联发科就开始有开展ASIC业务,到现在联发科已经专门成立了负责AISC业务的显示暨客制化芯片事业部,足见对于ASIC业务的重视。经过多年的积累,目前联发科的ASIC业务已涉及企业级与超大规模数据中心、超高性能网络交换机、路由器、4G/5G基础设施、人工智能、深度学习应用、需要高频宽和长距离互联的新型计算应用等众多领域。据了解,联发科2017年就有为某国际知名厂商定制芯片,另外微软似乎也是联发科ASIC业务的客户。今年4月17日,联发科与微软联合推出了一款支持微软Azure Sphere物联网操作系统的系统单芯片 (SoC) –MT3620,提供内置安全与连网功能的微控制器(MCU) 类型的物联网产品。
另外,特别值得一提的是,就在4月初,联发科技推出了业内首个,进一步扩大了其ASIC产品阵线G SerDes解决方案基于数字信号处理(DSP)技术,采用高速传输信号PAM4,具有一流的性能、功耗及晶粒尺寸(Die-area)。主要面向大规模数据中心等需要超高频宽和长距互联的新型计算应用等。
这里额外补充一下:SerDes是Serializer/Deserializer的简称,顾名思义是指串化器和解串器。但是,SerDes系统除了串化器和解串器,还包括发送端的驱动级和接收端的模拟前端。发送端驱动级将串化后的信号送入信道;而在信道的另一端,接收器的模拟前端将接收到的模拟信号转化为数字信号。
联发科的7nm 56G PAM4 SerDes IP不仅支持基于PAM4的每波长56Gbps的高速传输速率,还具有长距离传输信号不失真的特性,具有一流的性能、功耗和晶粒尺寸,并且已通过7nm 和16nm原型芯片实体验证,确保该IP可以很容易地整合进各种前端产品设计中。
“我们从2011年开始研究SerDes,从10G到28G 到现在的56G ,我们已经逐步赶上,更高速的112G也在研发当中。目前我们的56G SerDes可以支持128lane ,可以做到6.4Tbps的总带宽,全球目前仅有两三家公司可以提供这样的性能。”游人杰非常自豪的表示:“联发科具有业界最广泛的SerDes产品组合,可以为ASIC 设计提供从10G、28G、56G 到 112G的多种解决方案。”
不过需要指出的是,联发科最新的56G PAM4 SerDes IP不会单独对外授权,只会在为客户进行ASIC设计服务时提供。这也正是联发科前面所提及的可以提供的独有的ASIC IP之一,也是联发科ASIC的一个竞争优势所在。
联发科智能显示暨客制化芯片事业部行销处处长彭建凯表示,联发科的ASIC服务不仅可以为客户提供独特的IP或技术,比如高速SerDes等NG体育平台,也可以为客户提供联发科公司现有的主要产品线的核心技术IP,比如CPU/GPU、HDD/存储器、汽车/工业、模拟/高压射频、高速SerDes、音视频等IP。同时还可以根据客户的需要整合客户自己的IP,提供SoC集成设计服务,此外联发科还可以提供量产服务,包括后端设计和量产支持等,可以帮助客户降低费用,缩短时间周期。
在ASIC服务的商业模式方面,联发科支持多种合作模式,包括从最前端到最后端,不同阶段可以提供不同服务。
“我们可以提供一站式的服务,客户只需要有一个好的idear或者明确的需求,剩下的事情都可以交给我们来做。我们有很多ASIC所需的关键IP,我们有20多年的IC设计和量产经验,这也使得我们可以提供一站式的服务。如果客户有自己的特殊IP,或者自己的IC已经设计完了,但缺少关键IP(比如服务器IP),联发科可以提供关键IP,负责整合。当然,联发科也可以单纯的提供后端的物理设计、封测、产品量产方面的支持,但这不是我们的关注点。”对于联发科ASIC服务的商业模式,游人杰这样介绍到。
过去联发科的产品主要是通用型芯片,一颗芯片推出会耗费比较多的时间和精力来调研和设计开发,以适应很多不同用户的需求,由于潜在客户众多,所以出货量可以相对比较容易的达到一个可观的数字,但是由于公开市场的竞争比较激烈,所以利润率也比较低。而一旦芯片开发出来,却没有客户采用,那么将损失惨重。比如此前联发科耗费大量资金和人力开发出来的10nm Helio X30只有魅族一家品牌客户采用,而且出货也是极其有限。
相比之下,ASIC芯片是为特定的客户开发的芯片,从一开始就已经是有了明确的客户,联发科只需根据客户的需求来进行设计服务即可,虽然在这样的模式之下,联发科开发出来的ASIC芯片只能卖给这家客户,开发成本较高,如果出货量不大的话,单颗芯片的成本也将比较高,但是这些成本基本都是由客户来承担的,更何况这些ASIC芯片可能还采用了联发科的关键IP和各项技术服务,所以对于联发科来说,只要不出现失误基本都是稳赚不赔的生意。
众所周知,从2016年下半年到2017年上半年,联发科在智能手机市场遭遇了不小的挫折,直到去年下半年Helio P23/P30系列的推出才开始走出低谷。不久前联发科还乘势推出了支持人工智能的Helio P60,并且已在市场上取得不错的反馈。不过,需要注意的是,智能手机市场在经历了多年的高速增长之后,整体市场已经开始出现饱和甚至下滑的趋势,手机芯片市场的竞争也开始与智能手机市场一样,开始由增量市场的竞争转向存量市场的竞争,而这种竞争无疑是更为惨烈的。
而相比之下,ASIC的需求正呈现快速增长的态势,而且其生意模式决定了ASIC业务基本是稳赚不赔的,在这种形式之下,联发科开始释放更多的资源到更具价值的ASIC业务上也确实是明智之举。
联发科副总经理暨智能设备事业群总经理游人杰也明确表示:“ASIC是接下来联发科一个重要的成长的业务,一个新的成长的引擎NG体育平台。”
前面我们有提到,包括阿里巴巴、亚马逊、Facebook等互联网巨头都计划推出自己的ASIC芯片,显然他们也都是联发科的潜在的重要目标客户。但是,需要注意的是,不少互联网巨头也开始通过收购芯片设计公司来设计自己需要的ASIC芯片,比如阿里巴巴近期就收购了中天微。那么这种趋势是否会对联发科的ASIC业务产生不利的影响呢?
“如果你的需求只是想喝一杯鲜奶,那么你没必要养一头奶牛。你养一头奶牛也可以,可以满足你一家人的喝奶需求,但是你没有必要买一个农场。”对于芯智讯提出的这个问题,游人杰打了这样一个比喻。确实,如果阿里的需求足够大NG体育平台,那么他可以收购一家芯片公司来专门为自己做芯片设计,但是芯片设计涉及非常多的环节,中天微也只是做芯片设计,其所拥有的IP也是有限的,而且阿里也不可能所有的IP都自己来开发,更不可能还去收购晶圆厂、封测厂等,所有整个链条上的事情都自己来做。而对于更多的中小型客户来说,往往在寻找相关的IP组合上可能就会浪费很长的时间。
游人杰认为:“互联网公司收购芯片公司,其实更有利于联发科的ASIC业务开展,正因为他们自己来做芯片了,所有才会对芯片设计懂得越多,而懂得越多,就会使得我们沟通起来更加的容易,才会更加了解我们的价值。联发科拥有20多年的芯片设计经验,拥有ASIC所需要的非常多的关键IP和技术、先进制程和制造工艺、Know-how经验。特别是在先进制程方面,联发科有很多的手机客户,所以才能够支撑联发科去投下个先进制程。可以说我们大量的资源都投入到了前期的IP开发,我们现在也是单独的事业部来全力负责。这也使得我们能够接到很多客户的需求NG体育平台。客户需要定义出更好的IC架构,对于性能和功耗有更高要求,需要关键IP和技术支持的时候,自然会选择更专业的、长期的、可靠的合作伙伴。”
对于联发科ASIC业务未来的展望,游人杰表示,“我们希望未来5-10年内,ASIC业务的营业额能够做到相当大的一个规模。”虽然游人杰并未给出具体的数字,不过,芯智讯认为,其所描述的的规模,应该不亚于现在联发科手机芯片业务的规模。显然,未来联发科的ASIC业务或将成为与联发科手机业务并驾齐驱的一大业务。
文章出处:【微信号:icsmart,微信公众号:芯智讯】欢迎添加关注!文章转载请注明出处。
架构分析 /
渲染优劣分析 /
等核心区别是其底层逻辑运算单元的连线及逻辑布局未固化,用户可通过 EDA 软件对逻辑单元和
? /
的功能结合到单核架构中。这与 Intel 和 AMD 的典型设计不同,后者有独立的
一体化核心设计 /
了几种模型架构,不过该领域仍处于早期发展阶段。 还有专门用于特定应用的集成电路 (
汇总梳理 /
是两种常见的计算机处理器,它们在结构和功能上有很大的区别。在这篇文章中,我们将探讨
更快? /
遵循的是冯·诺依曼体系结构,指令要经过存储、译码、执行等步骤,共享内存在使用时,要经历仲裁和缓存。 而
? /
电子发烧友网报道(文/周凯扬)随着AI计算开始有着风头盖过通用计算开始,不少
,谁才是AI计算的最优解? /
和内存知识科普 /
【米尔NXP i.MX 93开发板试用评测】05.OpenWRT的构建-构建完成和烧录