边缘云塔式服务器怎么用和单路塔式服务器怎么用的区别?

内容由公众号半导体行业观察(ID:icbank)原创授权转自半导体行业观察作者:张健keya当下,市场对云计算的需求量越来越大,基于传统数据中心的企业级计算已经难以满足应用需求。从软件角度来看,现在的需求更多的是朝向云原生的,如微服务这类计算模型,而不是以前那种企业级内部的计算模型。
此外,现在有越来越多的边缘侧数据中心,在延时、功耗等方面的要求与以前有很大不同。这样,超大规模的云,包括边缘云计算需求的增长,对CPU的部署密度和能耗要求越来越高。总体来看,新兴的云计算具有三大特点:一是要具备可预测的高性能;二是整个平台的可扩展性,包括内核、I/O和内存等;三是需要非常高的密度和非常好的能效。这样,市场需要一种新型的、专门针对云的计算能力,这就需要很多高效的CPU内核,需要具有高能效的基础设施,以及非常好的可扩展性。而且新一代面向云的计算架构需要更加开放,因为只有更加开放,才能有更好的创新。在这样的背景下,多家厂商正在打造完全面向新一代云计算的CPU,以满足上面提到的需求。在这些厂商当中,有传统的x86阵营,也有新兴的Arm阵营。而在数据中心和云服务CPU方面,Arm产品一直都颇具争议,以前,在数据中心应用中,Arm做过一些尝试,在之前的那些尝试当中,相应的IP、内核等与x86相比,确实存在着一定的差距。也正是应为如此,在过去几年,Arm一直致力于推进可用于数据中心的高性能、高能效的内核的研究,以推动Arm性能的不断改善。随着经验的积累,这些IP能够提供的服务器CPU性能出现了快速提升。还有一点也很重要,那就是随着台积电7nm制程技术的成熟,Arm阵营可以使用体积更小、能效更高、速度更快的晶体管了。Arm在终端设备领域已经取得了巨大的成就,在此基础上,它在服务器这块的生态系统建设也在不断成熟,所有大型的操作系统,如Linux、BSD、windows都能够支持Arm。另外,虚拟化工具如docker、vmware、KVM和kubernetes都可以在Arm上运行了,还有编程语言、工具,如CUDA和Java都可以支持Arm了。基于Arm开发新的CPUAmpere是一家刚成立两年多的公司,一直致力于打造面向云计算和边缘的新一代Arm处理器。该公司研发的目标是开发面向云计算的新一代云原生CPU,这里的“云”是指从超大规模的云到分布式边缘云。Ampere的团队经验非常丰富,在服务器领域平均具有20多年的积累,特别是专注于服务器里面的云,在服务器市场当中,如前文所述,针对云的服务器是比较特殊的。Ampere团队设计过很多代的服务器处理器,出货量在市场上都是非常大的。这个团队对整个行业的合作伙伴生态环境非常了解,包括IP供应商、软件供应商等。Ampere公司产品高级副总裁Jeff Wittich表示:“我们在设计理念方面也非常有优势,这使我们的迭代非常快,而且向市场推出产品的节奏也非常一致。在设计方面,我们非常注重仿真,还有虚拟平台。这使我们对流片非常有信心。”在Ampere产品与Intel差异化竞争方面,Jeff Wittich表示:“有一个最大的差异点,我们的产品在设计时,是纯粹针对云的计算模型设计的,因此,与其它CPU相比,我们能提供针对云的性能和特点的专属设计。另外,我们设计的CPU能够和行业里的GPU、FPGA供应商合作,这样就能非常灵活地为客户提供他们所需要的解决方案组合。”由于是基于Arm架构,Ampere使用了相对于x86而言简单的指令级,功耗更小,而且整体效率更高。精简指令集(RISC)已经能够提供非常好的性能了,而且功耗非常低,目前来看,已经能够提供运行云计算的所有性能要求了。80核的Ampere AltraAmpere Altra则是一款基于Arm v8.2+架构的云原生处理器,据Jeff Wittich介绍,该CPU是世界上第一款,从一开始的设计、制造就是完全面向云,为满足新的云对云计算需求的处理器。Ampere Altra单路具备80核,都是64位Arm的CPU内核,每核最高频率是3.0GHz,所有内核都能在turbo模式下持续运行,这在所有核满负荷的云计算工作流中都能实现。该CPU利用Monolithic die(单芯片设计)工艺,所有核在Mesh网络下相互连接,还能提供非常高的内存带宽和内存密度。据Jeff Wittich介绍,与传统服务器CPU架构相比,Ampere的80个内核架构具有以下创新点:一是单线程,单线程的目的是为每一个用户提供稳定、可预测的性能,此外,在云计算领域,单线程还能够提供非常好的安全隔离;二是架构进行了优化,以提供最多数量的内核,我们这个核数比市场上同类处理器的核数都多,而且是基于Mesh网格化部署的,密度非常高,能够提供非常好的一致性和非常高的效率;三是内核能效非常高,内核优化的结果是只让内核提供云计算所需要的性能,传统那些非云计算所需要的功能特性就不再提供了,这样就减少了耗电量,提高了每个核的功耗效率。这里具体谈一下单核单线程的设计,通过消除单物理核多线程设计中多用户共享资源引起的 “相邻干扰” 问题,可提供100%的可预测性能。这是一种非常好的用户隔离机制,因为执行引擎、寄存器、一级、二级缓存都是内核独享的,不用与其它核分享,这样可以减少来自于相邻核的干扰和“攻击”,降低了侧信道攻击风险,现在,侧信道干扰已经成为一个非常重要的行业痛点。总之,单核单线程的设计,能够保证在运算或执行的时候具备一致性的、可预测的性能。该处理器还能提供很高的可扩展性,这是基于领先的每核功耗性能,其每瓦性能是业内最高的,从边缘到超大规模云,在不同部署环境下提供多种可选的处理器配置,它还能提供多路支持,非常灵活的I/O连接以及高带宽。Altra可提供很大的一级、二级缓存,能减少延时,除了每个核专属的L1和L2缓存之外,在整个系统级别还有一个32MB的大缓存。Altra处理器提供八个DDR4通道,每个通道能插两个DIMM,运行的时候能够提供单路200GB/秒的速度。他还提供单路4TB的内存或者双路8TB的内存容量。此外,还有非常好的I/O子系统,还提供四个支持CCIX协议、x16的PCIe接口,用于缓存一致性连接,单路128个PCIe Gen4通道,两路192个PCIe Gen4通道,这是目前行业最高的。用户可以将四个支持CCIX协议的设备连接到该CPU上。除此之外,该CPU还提供两个128BT的SIMD单元用于浮点计算。现在,云计算中的AI推理能力越来越重要,Altra提供int8和FP16的支持,可以提高AI推理加速性能。对比x86传统上,Arm处理器与x86处理器相比,最大的劣势就是性能,但是,随着Arm的研发推进,目前其处理器性能有了大幅度的提升,再加上其固有的低功耗特性,竞争力提升不少。Jeff Wittich就Altra处理器与AMD的64核EPYC,以及28核的Intel 至强(Xeon)处理器做了对比,对于一些基于云特别多的应用,如搜索、AI推理、解码、数据库等,Altra能提供非常好的性能。Jeff Wittich表示,Altra不仅仅性能更高,功耗也更低。每瓦特性能比EPYC和至强都要高。这样不仅可使整个数据中心的容量不断增大,还能横向扩展到边缘侧。对于一些以能耗为中心(power-centered)的应用,如存储网页游戏、云游戏、存储边缘云等,这是一个非常好的解决方案。此外,由于单核功耗很低,所以每个机架能部署的核数密度比任何其他解决方案都要高,每个机架能够部署3500多个Altra内核。每一个机架的单核密度,比AMD的EPYC高38%,比Intel至强高173%。Jeff Wittich称其单机架性能是目前市场上最好的,而且单机架内核密度也是最大的。由于性能更好,功耗更低,所以Altra处理器的总体应用成本(TCO)也更低。Jeff Wittich称Altra的TCO比EPYC高41%,同样的总体应用成本情况下,所带来的性能,比EPYC高41%。和Intel至强相比,包括其2月24号公布的最新版本相比较,Altra的单位总体应用成本比它高63%。产品路线图关于产品发展路线,Jeff Wittich表示:“由于我们积累了大量经验,比较有信心,所以我们会保持每年推一款新产品的节奏,并能够使处理器的性能不断提升。今年推出的是Ampere Altra,我们计划2021年推出Mystique这个新产品,Mystique核数更多,性能将更好,并且与Altra平台兼容。我们也制定了2022年的计划,推出名为Siryn的新产品,Siryn要比之前的两款产品核数更多,性能更好,功耗更低,而且还会有更多基于云的设计特色。客户与生态Altra处理器现在已经有样机出货了,主要有两款,一个是双路的Mt. Jade,另一个是单路的Mt. Snow,有很多客户在试用,目前能够公开的是微软和甲骨文(Oracle),据悉,这两个客户的反馈非常好,Ampere上周收到了他们的书面声明,表达了对Altra处理器的支持。此外,中国的一些厂商也在试用该产品。在客户拓展和生态系统建设方面。过去一年,Ampere一直在与最主要的云服务商合作,如微软、甲骨文等。Jeff Wittich表示:“我们预计今年下半年会有部署,我们规模量产是在2020年中。Ampere之所以赢得了客户认可,是因为我们深入这个行业很长时间,并且非常投入地进行创新,能够在性能、可扩展性和能效等方面保持领先。”*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。推荐阅读Arm的关键一战
4月27日,算能在福州举办的“算丰赋能·生态大会·2023”上,正式发布了新一代大算力服务器算丰SE8,峰值算力高达416TOPS。大算力、大路数、大并发算丰SE8基于国产自研AI芯片BM1684X打造,具备大算力、高密度等特点,峰值算力高达416TOPS,支持混合精度计算,浮点算力高达208TFLOPS,支持416路高清视频全流程解析,支持416路高清视频硬件解码以及156路硬件编码。相比上一代产品SE6,SE8实现了算力翻倍,密度翻倍,编码能力提升近5倍,可以灵活应对大路数、大并发业务场景算力需求。算丰SE8低功耗、小体积、少开发SE8采用低功耗设计,典型功耗不超过300W,同样体积下相比上一代产品SE6能效提升100%。采用模块化堆叠设计,乐高式灵活拼接,支持独立部署或组合部署,HDMI、千兆网口、USB等功能接口全新升级,支持SATA硬盘存储扩展,可满足不同路数场景下的算力需求。SE8将最大化复用SOPHON.TEAM算法生态成果,所有基于算丰BM1684X部署的网络模型,都可以实现平滑迁移,支持设备BMSSM本地管理和BMC本地设备状态监控,同时也可以通过http://SOPHON.NET,实现多设备的统一管理及单芯片级别的算力调度,简化应用开发工作,加速商业化落地。全场景、大机头、大生态SE8支持以算力服务器、算法一体机等形态部署,实现公安、交通、园区、生产、仓储、防火、矿山、港口等大并发业务全场景覆盖,为千行百业智慧赋能。本次发布的SE8推出了高密度、大机头两个版本,其中高密度版采用BM1684X为主控,支持麒麟操作系统,提供极致大算力加持,承载大并发分析需求;大机头版采用国产CPU为主控,支持麒麟、统信操作系统,大幅提升主控能力,承载大应用运行需求。除了高密度、大机头版之外,生态伙伴也基于算丰BM1684X打造了大算力服务器新品。Firefly的CSA1产品最大支持256路AI视频分析,支持算力节点可选,支持BMC以及丰富的功能外设;强云创新S1UX产品最大支持416路视频分析,1U机架式,支持冗余电源,支持丰富的功能拓展。生态伙伴的产品极大丰富了基于BM1684X的大算力服务器产品体系,为大路数场景提供多元化的算力产品选择。SE8系列产品的发布,将为AI应用落地走向大算力时代提供澎湃算力支持。本文使用 文章同步助手 同步

我要回帖

更多关于 单路服务器 的文章