束缚的容量一直是数据中心的最大浪费,多年来,我们添加了越来越聪明的虚拟化类型-硬件分区,虚拟机及其虚拟机管理程序和容器-以及利用它们的系统管理工具。如今,随着虚拟存储和虚拟交换到所谓的SmartNIC的加入,一定数量的硬件虚拟化也在进行。
这种发展的下一步是分解和可组合性,可以用许多不同的方式来考虑。我们在下一个平台上喜欢的比喻是粉碎群集中的所有服务器节点,然后将所有组件重新缝合在一起具有在外围传输和内存总线级别工作的软件抽象-通常称为可组合性。您也可以将其视为使系统的主板具有可扩展性和延展性,不仅仅局限于一台服务器的外观,而是可以制造出庞大的硬件池,这些池可以允许无数并发的物理硬件配置(通常是通过PCI-Express总线)可以即时创建并根据工作负载进行重新配置。这样,CPU,内存,闪存,磁盘存储以及GPU和FPGA加速器就不会紧紧地位于实际位于其中的节点上。
有很多公司正在尝试这样做。在大型OEM中,惠普(Hewlett Packard Enterprise)具有Synergy系列,戴尔(Dell)具有PowerEdge MX系列及其Kinetic策略。思科系统公司首次尝试使用其UCS M系列计算机实现可组合性。DriveScale 通过特殊的网络适配器提供了一定程度的服务器可组合性,该适配器允许计算和存储在机架规模上跨节点独立扩展,类似于英特尔,戴尔,百度,天蝎联盟,阿里巴巴和腾讯正在进行的类似项目,以及由Facebook带头的Open Compute Project。瞻博网络(Juniper Networks)收购了HTBase,为其网络设备提供了一些可组合性,而Liqid于2017年6月退出了隐形市场,它自己的PCI-Express交换结构将组件托架链接在一起,并使它们可组合到逻辑服务器中。TidalScale 于几个月后的2017年10月退出了隐形市场,它创建了一种所谓的HyperKernel,将多台服务器组合到一个巨型系统中,然后可以将其雕刻成具有可组合组件的逻辑服务器。LXC或Docker容器用于创建软件隔离,而不是使用VM来分解此超级服务器。在过去的一年中,GigaIO凭借自己的PCI-Express交换机和FabreX架构不断发展壮大。
有很多不同的方法可以使这种可组合性猫皮肤化,并且尚不清楚哪种方法将占主导地位。但是我们的猜测是,与Cisco,Dell和HPE尝试将其可锻铸铁一起使用的专有方法相比,DriveScale,Liqid和TidalScale的软件方法将会流行。作为HPE在这里的创新者,可能不足以赢得市场,而且看到HPE抢购其他公司之一,然后戴尔抢购任何一家HPE没有收购的公司,我们也不会感到惊讶。再说一次,HPE的Synergy铁产品线的年收入运行率已经达到15亿美元,拥有3,000个客户,并在今年年中以78%的速度增长,因此HPE认为它已经有了正确的答案。
一方面,利奇(Liqid)并不希望被收购,事实上,它刚刚在第二轮融资中筹集了2800万美元,使迄今为止筹集的资金总额达到5000万美元;资金由Panorama Point Partners牵头,Iron Gate Capital和DH Capital参与其中。经过三年的硬件和软件开发,Liqid需要更多的现金来建立其销售和营销团队以追逐机会,还需要投入大量资金进行研发,以保持Liqid Fabric OS,受管理的Fabric Switch和Command Center管理软件向前发展。
Liqid的联合创始人兼首席执行官Sumit Puri对The Next Platform表示:“我们现在有少量大客户构成了我们很大一部分收入。” “这些是我们从开始时就开始的客户,我们已经将他们扩大到我们希望所有客户成为的规模,其中一些人向我们展示了大规模的项目。我们正在进行许多概念验证,其中一些将相对较小,并且永远不会成长为七位数的客户。其中一些会。”
Puri不会对交换机和软件的价格进行具体定价,这些交换机和软件会将带有外围设备的服务器机架变成可组合的逻辑服务器堆栈,但他表示,传统集群成本的增加值约为5%。占基础架构总成本的10%。但是可组合性意味着可以使用正确的逻辑服务器设置(正确数量的CPU,GPU,FPGA,闪存驱动器等)来配置每个工作负载,从而使群集上的2倍至4倍的利用率可以提高利用率达到行业平均水平。普里说,数据中心的利用率在全球范围内平均约为12%(包括计算和存储),而Liqid认为最好的是Google(该行业中最好的),其数据中心的利用率平均为30%。根据Puri所说,Liqid堆栈可以将其利用率提高到90%。那就是大型机级别,而且差不多。
潜在客户管道拥有数千名客户,这就是为什么需要资金的原因。人们需要抓住这个机会,即使HPE在过去五年中一直在谈论可组合性,它仍不是系统的主流方法。
与大多数分布式系统一样,如果基础架构出现问题,则在建立一个大型基础架构池与创建多个隔离的池之间存在压力,以限制爆炸区域。典型的大型企业可能具有大小不等的计算,网络和存储盒,其大小范围从半机架,满机架或多达一个,拖甚至三机架,但很少大于或小于该机架。他们倾向于在Pod上部署应用程序组并通过Pod升级基础架构,以使扩展基础架构比同时配置几台服务器更容易且更具成本效益。
在Liqid目前即将完成的交易中,客户希望拥有一个800个节点的群集,但只希望让200个节点挂在Liqid PCI-Express结构上,因为它不想支付“可组成性税” ”,如Puri所说,在所有这些系统上。随着时间的流逝,该公司可能会将Liqid结构扩展到剩余的600台服务器中,但是在未来几年(以及三到四年后),将有更多新服务器在未来几年内添加它们短期内,那些没有可组合性的旧机器将被简单地从集群中删除。
Liqid认为,在许多不同的情况下,可组合性正在蓬勃发展。需要注意的重要一点是,基本假设是将组件聚合到各自的机箱中,然后Liqid交换机中的PCI-Express结构可以根据需要重新聚合,将服务器中的特定处理器绑定到特定的闪存或Optane存储,网络适配器或机箱中的GPU。当然,在给定服务器上连接的设备数量绝不能超过允许的数量,因此,不要以为使用Liqid开关可以使一个CPU突然挂掉128个GPU。您只能做BIOS所说的事情。但是您可以根据需要做更多或更少的事情。
Liqid结构不仅限于PCI-Express,而且在距离和水平比例比PCI-Express交换所提供的低延迟更重要的情况下,还可以通过以太网和InfiniBand附件进行扩展。Liqid的堆栈确实需要在物理级别进行分解,这意味着外围设备必须组合到各自的机箱中,然后使用PCI-Express光纤或通过以太网的NVM-Express或通过RDMA网络的GPUDirect链接在一起,以将闪存和GPU链接到计算元素。
下周在丹佛举行的SC19超级计算机会议上,Liqid将展示其产品开发的下一阶段,在该阶段中,不必将硬件汇总到物理层中,然后进行组合,而是使用混合CPU的标准服务器。而用于计算和闪存的GPU和FPGA,以及用于存储的Optane,将能够仅使用Liqid软件将其资源分类,合并和组合,然后将其分类到池中,然后将其全部打包到工作负载中。当然,您获得的性能将受到用于重新聚集组件的网络接口的限制–以太网的速度将比InfiniBand的速度慢,而PCI-Express的速度将慢,并且对于许多应用程序,唯一的真正影响将是负载的加载时间。应用程序和数据。任何在计算和存储元素之间需要大量来回交互的应用程序都希望使用PCI-Express。但是,这项新功能将使Liqid可以进入所谓的“棕场”服务器环境,并为其带来可组合性。
那么可组合性在哪里起飞呢?毫无疑问,Liqid成功的第一个主要领域是针对以GPU为中心的工作负载,传统上,GPU通常被锁定在服务器节点内部,并且大部分时间都不使用。分解和可组合性使他们可以在处理工作负载时保持忙碌状态,并且硬件配置可以根据需要快速更改。如果将虚拟化或容器层放在重新聚合的硬件之上,则可以移动工作负载并根据需要更改硬件。实际上,这就是公司现在感兴趣的事情,即在液态硬件之上使用VMware虚拟化或Kubernetes容器环境。可组合的裸金属云也在增加,如下所示:
Liqid最近还与ScaleMP合作,因此它可以在可组合基础架构上提供虚拟NUMA服务器,因此可以更好地与TidalScale竞争,后者是其同名可组合体系结构的核心。
也有关于在5G和边缘基础架构上使用Liqid的讨论-但每个人都在努力采取行动。