NG体育近年来摩尔定律“失速”,使得中央处理器(CPU)的性能增长边际成本急剧上升。有研究数据表明,现在CPU的性能年化增长率(面积归一化之后)仅有3%左右。然而,人们对计算的需求依然爆发性增长。
在此背景下,包括人工智能(AI)芯片在内的专用计算芯片陆续登上历史舞台,绽放光芒。眼下,以数据为中心的专用处理器“DPU”正成为专用计算芯片的“新贵”。美国芯片巨头英伟达公司甚至将其定位为数据中心继CPU和图形处理器(GPU)之后的“第三颗主力芯片”,掀起了行业热潮。
和CPU、GPU“三足鼎立”,DPU真有如此大的潜力吗?它的应用场景有哪些?我国能抓住DPU发展机遇吗?近日,由中国科学院计算技术研究所(以下简称中科院计算所)主编,中科驭数(北京)科技有限公司、中国计算机学会集成电路设计专业组、计算机体系结构国家重点实验室联合编写的行业首部《专用数据处理器(DPU)技术白皮书》(以下简称《DPU技术白皮书》)发布。结合上述问题,《中国科学报》联系采访了主要编写人员一探究竟。
“DPU最直接的作用是作为CPU的卸载(offload)引擎,其效果是给CPU‘减负’。”《DPU技术白皮书》主编ng体育下载app、中科院计算所研究员鄢贵海告诉《中国科学报》,作一形象比喻,DPU提供了数据中心一把“杀鸡”的工具,节省的是CPU这把“牛刀”,以释放CPU算力,留给更需要它的业务负载。
接管CPU的网络协议处理任务,就是一个很好的例子。鄢贵海说,比如在数据中心仅线G的网络,大概就需要一个8核高端CPU一半的的算力,而如果是40G、100G甚至更高速的网络,性能开销更大。
云计算巨头亚马逊云服务(AWS)形象地称之为“数据中心税”——还未运行业务程序,接入网络数据就要占去许多计算资源。
“DPU诞生的使命就是承载网络虚拟化、硬件资源池化等基础设施层服务,以释放CPU的算力到上层应用。”《DPU技术白皮书》编委会成员、中科驭数高级副总裁张宇解释说,将“CPU处理效率低下、GPU处理不了”的负载卸载到专用的DPU,就能实现对“数据中心税”的抵消,从而有助于提升整个计算系统的效率、降低整体系统的总体拥有成本。
张宇介绍称,DPU主要处理网络数据和输入输出(IO)数据,并提供带宽压缩、安全加密、网络功能虚拟化等功能。“这些可以说是离我们普通用户每天感知到的各种应用最远的功能了。而这些基础功能是实现日常应用更高效、更安全、更实时的保障。”
一种是“Data”,DPU被称为“数据处理器”;一种是“Datacenter”,DPU译作“数据中心处理器”;一种是“Data-centric”,相应的,DPU可叫作“以数据为中心的处理器”。
中科院计算所研究员、中国计算机学会集成电路设计专业组副主任李晓维向记者解释说,这三种说法,乍一看意义差不多,但各有侧重:“数据处理器”既区别于信号处理器、基带处理器等“信号”处理,也区别于专门处理图形图像类数据的GPU,而是把各类时序化、结构化的数据放在核心位置;“数据中心处理器”只是偏重于描述DPU的应用场景,但显然它无法指代所有“服务于数据中心的处理器”;第三种说法则体现了DPU的设计理念,体现了计算架构从“以控制为中心”向“以数据为中心”的演进。
“以上三种关于DPU的说法,从不同角度反映DPU的特征,都有一定的可取之处,我们认为可以作为不同的三个维度来理解DPU的内涵。”李晓维说。
“随着‘软件硬件化’成为常态,异构计算的潜能将因各种DPU的普及而彻底发挥出来。”《DPU技术白皮书》编委会成员、中科驭数联合创始人兼CTO卢文岩认为,新一代的DPU不仅可以作为运算的加速引擎,还具备“控制平面”(即追求数据处理功能的覆盖面)的功能,能更高效地完成网络虚拟化、IO虚拟化、存储虚拟化等任务,彻底将CPU的算力释放给应用程序。
“可以说,DPU的出现将让各行各业的业务层数字化应用更全面、更流畅、更绿色。”卢文岩说。
从市场规模角度来看,根据Fungible公司和英伟达公司的预测,用于数据中心的DPU量级将达到和数据中心服务器等量的级别。
“服务器每年新增大约千万量级,一台服务器可能没有GPU,但一定会有一颗或者多颗DPU,好比每台服务器都必须配网卡一样。”鄢贵海说,服务器每年新增大约1500万台,每颗DPU以1万元计算,这将是千亿量级的市场规模。
在这个千亿量级市场中,国际传统芯片巨头如英伟达、英特尔、Marwell、博通等厂商,都在积极布局DPU产品研发。
这些芯片巨头的布局并不意外,他们或有智能网卡研发基础(如博通)继续延伸技术触角,或通过并购专用加速芯片公司(如英伟达、英特尔)补充其在DPU领域的技术能力。相比它们,更值得一提的是,亚马逊旗下的AWS和阿里云两大云计算巨头,早已注意到数据中心开销问题,并已有了良好实践。
据《DPU技术白皮书》显示,2013年,AWS研发了Nitro产品,将为虚拟机提供远程资源、加密解密、故障跟踪、安全策略等服务程序的资源开销,全部放到专用加速器上执行,“轻量化管理程序+定制化硬件”的上场一举节省30%CPU资源。几乎在同期ng体育下载app,阿里云也着手研发“神龙架构”(X-Dragon系统)ng体育下载app,以硬件化的MOC卡统一支持网络、IO、存储和外设的虚拟化,如今“神龙架构”已经更迭到了第4代。
“可见,DPU其实在行业内已经孕育已久,从早期的网络协议处理卸载,到后续的网络、存储、虚拟化卸载,其带来的作用非常显著,只不过在此之前DPU‘有实无名’,现在是时候迈上一个新的台阶了。”鄢贵海表示。
可喜的是,国内一些围绕DPU技术的创业公司也逐渐崭露头角。除了参与编写《DPU技术白皮书》的中科驭数之外,还有云豹智能、星云智联、芯启源、云脉芯联等新近成立的科技创业公司,展现出良好势头。
以中科驭数为例,这家创始团队来自中科院计算所的初创企业,在DPU理论基础、数据中心架构方面有着深刻理解,工程实现经验也因一些来自亚马逊、赛灵思、华为等核心骨干的加入,得到了很好的积累。2019年,中科驭数完成第一代DPU芯片的流片,预计将于2022年推出第二代DPU芯片“K2”。
“我们认为DPU的潜力确实是巨大的。”在鄢贵海看来,从技术发展的角度来看,DPU的出现有一定的必然性——上层应用对于算力的需求在过去5年急剧增长,使得DPU的应用场景很多,它将广泛分布在5G、云计算、大数据、数据中心和边缘计算等领域。
而从工业和信息化部今年发布的《新型数据中心发展三年行动计划(2021—2023年)》中,鄢贵海更是看到了新型算力芯片难得的历史发展机遇。
该计划明确提出要加快提升算力算效水平,“推动CPU、GPU等异构算力提升,逐步提高自主研发算力的部署比例”“加强专用服务器等核心技术研发”“树立基于5G和工业互联网等重点应用场景的边缘数据中心应用标杆”等要求和措施。
“虽然国内厂商在芯片产品化的环节相比国外一线厂商还有差距,但是在DPU架构的理解上是有独到的见解的,而且我国目前在数据中心这个领域,无论是市场规模、增速还是用户数量,相较于国外都有巨大的优势。”鄢贵海认为,国内厂商有望充分利用这一“应用势能”,加快发展步伐,在DPU这个赛道与国外厂商“逐鹿中原”。
“目前要解决DPU标准化应用,还存在一定挑战。”鄢贵海解释道,由于数据中心本身的复杂性,各大厂商一方面采用商用现货组件(即COTS)来构建系统,追求低成本,一方面又设法分层服务化,打造面向不用类型客户的标准化产品,但除此之外的所有技术实现几乎都是“八仙过海,各显神通”——如AWS有Nitro,阿里云有MOC。
“有的厂商强化IO能力、有的关注路由转发、有的重视存储卸载、有的关注安全加密,不一而足。”鄢贵海说,而上层负载不同,也必然对底层架构有各异的需求,这也许是目前DPU标准化面临的最大挑战ng体育下载app。
广西中医药研究院中药资源团队在开展全国第四次中药资源普查和广西第一次林草种质资源普查中,发现石山油桐、美脉假糙苏、线叶度量草、广西割舌树、洞生香草、广西肺筋草6种高等植物新物种。
2023年我国公民具备科学素质的比例达到14.14%,这一最新调查数据意味着什么?对我国经济和社会发展有何重要意义?与世界主要发达国家20%~30%的公民科学素质水平相比,我国公民科学素质仍有不小差距,未来提升公民科学素质,还有哪些挑战?
从国家知识产权局获悉,《2023年中国专利调查报告》近日发布。报告显示,2023年,我国发明专利产业化率达39.6%,较上年提高2.9个百分点,连续五年稳步提高。
绿色是生命的象征、大自然的底色,良好生态环境是美好生活的基础、人民共同的期盼。
中国科协16日发布第十三次中国公民科学素质抽样调查结果。结果显示,2023年我国公民具备科学素质的比例达到14.14%,比2022年的12.93%提高了1.21个百分点,我国公民科学素质呈现提速增长趋势。
施工人员在做桥梁前移施工准备。呼兰河上,桥墩破冰器分外醒目;庆安制梁场的智能化保温棚内,一榀榀桥梁在蒸汽中凝固成型;哈伊高铁全线建成通车后,将不断满足广大群众的出行需求,为加快建设我国向北开放新高地贡献力量。
近日,中国科学院理化技术研究所研究员王树涛、副研究员时连鑫团队研发出新一代针对黏性渗出液,如糖尿病足渗出液的单向导液伤口敷料。该研究为高黏性渗出液引起的伤口愈合困难问题提供了可行的解决方案,在医用敷料、渗液管理等领域具有广阔应用前景。
作为一种新兴的林业信息化科技创新手段,智慧林业需要加强顶层设计,统筹指导与管理。回顾智慧林业的发展历程,我们不难发现,智能化革新已经成为现代林业发展的重要标志。
习指出“科技创新能够催生新产业、新模式、新动能,是发展新质生产力的核心要素”ng体育下载app,同时强调“强化企业科技创新主体地位”。从内涵及本质要求来看,新质生产力由“技术革命性突破、生产要素创新性配置、产业深度转型升级而催生”。
在15日举行的2024春季核能可持续发展国际论坛上,中国核能行业协会副理事长兼秘书长张廷克介绍,截至目前,我国商运核电机组共55台,总装机容量5703万千瓦,仅次于美国、法国,位居全球第三;在建及已核准核电机组38台,总装机容量4480万千瓦。
最近几年,每隔一段时间,在北京大学生物医学前沿创新中心从事博士后研究的张冲就会发一个朋友圈。出于对新发现的严谨,团队决定与突变印记领域资深学者、杜克-新加坡国立大学医学院教授Steven G. Rozen联系,进一步扩大合作。
这是我国自主设计建造的首艘大洋钻探船“梦想”号。我国深海探测将以“梦想”号为重要平台,构建深海地质地球物理探测和钻探技术装备体系,为人类认识、保护、开发海洋作出新的更大贡献。
创造一个超大深冷“冰箱”,提供20K(开尔文,20K即零下253摄氏度)以下甚至2K(零下271摄氏度)的超低温环境,并保证百瓦级到万瓦级连续稳定工作——大型低温制冷装备凭借这一能力,被称作“超级低温工厂”。
本工作中,研究团队在前期光热电探测器相关工作的基础上,在具有长波红外吸收能力的柔性聚酰亚胺衬底上构建了碲基热电异质结薄膜,制备出可集成、柔性、可穿戴长波红外光热电探测器。
4月13日至14日,第十三届“吴文俊人工智能科学技术奖”颁奖典礼暨2023中国人工智能产业年会在苏州举行,展示了我国人工智能的发展前沿。
中国工程院院士、鹏城实验室主任高文凭借在图像处理、模式识别、多媒体、虚拟现实、计算机视觉、大规模人工智能系统等领域的贡献,荣获吴文俊人工智能最高成就奖。
不只是北京正负电子对撞机,上海光源、高能同步辐射光源等大科学装置的运转也离不开大型低温制冷装备。
随着石岛湾高温气冷堆核电站示范工程建成并投入商运,我国高温气冷堆产业链已初步形成,具备产业化推广条件。
4月13日至14日,第十三届“吴文俊人工智能科学技术奖”颁奖典礼暨2023中国人工智能产业年会在苏州举行,展示了我国人工智能的发展前沿。
4月12日,由该院自主研制的130吨级可重复使用液氧煤油发动机圆满完成两次起动地面点火试验。至此,这台发动机已完成15次重复试验和30次点火起动,累计试验时长突破3900秒,重复试验次数突破我国液体火箭主发动机试验次数纪录,为后续可重复使用运载火箭首飞奠定基础。