洛神升级攻略 洛奇技能修炼攻略
本文作者宗志刚(华明)在网络领域工作了15多年。现任阿里云网络产品线高级技术专家,负责阿里云网络洛神平台的技术规划、架构设计和网络元产品研发。在过去的云栖大会上,宗志刚做了洛神3.0:新一代云网络平台应用-云-边-端集成的主题共享,详细阐述了阿里云新一代洛神云网络平台的技术架构升级。本文根据作者的演讲内容进行了整理。
云网络的发展历程到目前为止,阿里云网络产品已成第三代。
云网络1.0时代,主要实现数据中心云化后多租户隔离的网络,其技术特点是云Region大规模内部实现overlay网络。
随着企业云步伐的加快,越来越多的企业云,尤其是大型和超大型企业。由于全球服务的要求,云网络不仅要支持数据中心内的网络,还要支持多个数据中心的全球互联网。同时,云/云之间的流量激增,企业的业务也丰富多样。现阶段的网络,我们称之为云网络2.0时代。
在技术上,它支持跨域网络的虚拟化。同时,为了提供性能更高、灵活性更好的网络,软硬件集成和云原始模式的弹性结构开始在云网络中大规模应用。自2020年以来,云网络产品和技术逐渐走向边缘和应用,支持5G/IoT我们将应用云定义为云网络3.0时代。
洛神:飞天云操作系统的核心组件阿里云网络产品技术平台称为洛神,是阿里云飞行操作系统的核心组件之一,负责网络虚拟化,计算虚拟平台龙、存储虚拟平台盘古和物理资源管理平台基础共同构成飞行核心基础,向上支持构建阿里云丰富IaaS、PaaS产品。
洛神平台总体架构:SDN NFV洛神·云网络平台的整体技术架构是非常典型的SDN NFV架构,底部是物理网络基础设备,提供网络最基本的连接能力;向上是转发表面,洛神平台使用各种资源转发数据表面,如传统x86裸金属服务器,国产化ARM CPU,还有可编程芯片的可编程芯片;在转发数据面上,构建了一个NFV平台,叫CyberStar该平台用于管理底层不同的转发资源,提供弹性资源扩展能力、异构屏蔽能力等统一抽象能力,提高上层业务网络元的研发效率;在此基础上,是业务网络元本身的转发逻辑。在控制面,洛神平台采用集中式SDN实现各网元业务安排的控制器。在控制面,洛神平台采用集中式SDN控制器,实现每个网络元的业务安排。此外,为了确保整个网络的高效运行和运行,洛神平台还建立了一个内部称为齐天平台的智能运行和维护分析平台,依靠大数据驱动,实现网络的智能运行和运行。
洛神2.0平台是目前在网络运行的阿里云网络规模部署的。简单来说就是三位一体网络:
首先,云网络一体化:主要原因是阿里云网络资源覆盖全球化,目前有24个Region,75个可用区,280 个POP接入节点;
其次,软硬一体化:主要体现在数据表面,使用FPGA以及可编程芯片,大大提高了数据面转发性能VPC网关单位可达3.2T,不仅能满足大型客户的转发性能需求,还能提高大象流的吞吐量和网络的可靠性;
最后,基于洛神的阿里云网络的应用网元CyberStar NFV平台,可实现阿里云网元任意规格分钟级的弹性。
洛神3.0、构建应用-云-边-端集成的智能云网络自2020年以来,我们启动了洛神3.0的研发,其关键场景是应用-云-边-端集成的智能网络。网络的核心价值是连接-连接应用程序、连接端、连接不同地区和类型的网络;应用-云-边-端集成的连接场景总结为三种主要连接方式:
广泛的连接:从过去的云网络到更广泛的区域、边缘、连接IoT结合中心云、本地云、边缘云。深度连接:这是网络的纵向连接,以满足不同场景(包括应用程序和应用程序之间)的连接,特别是在生态服务部署到云之后。极简主义连接:网络是一个极其复杂的分布式系统,但应用和IT运维人员希望看到一个简单的网络。应用-云-边-端集成场景对云网络技术提出了更高的要求,总结如下:
性能较高的网络管理能力:由于网络边界大大扩大,网络节点大幅增加,环境变化较大,但体验要求没有降低,对网络管理能力提出了更高的要求。更灵活的网络转发设备:由于区域不同,特别是边缘场景,环境差异巨大,如何适应不同场景的转发需求,网络转发设备需要更灵活。更简单的网络互联协议:网络互联应该很简单。应用程序关注业务逻辑。当云应用程序与其他应用程序或端连接时,如果太复杂,则无法大规模应用程序。更智能的网络维护技术:网络边界扩大,与应用的连接更紧密,覆盖范围更广;网络维护工作量和复杂性急剧增加,网络维护压力也大大增加,需要使用更智能的网络维护技术来减少网络的运行和维护&运营投入。洛神3.0针对云网络3.0时代应用场景的技术要求,开启了相关技术的研发,并取得了一些阶段性成果:
网络控制器集成云端,极端性能云边缘集成,中心云延伸到边缘,包括客户IDC;为了提高体验和统一运维,需要VPC从中心延伸到边缘,而不是独立的数据中心,这需要网络控制系统仍然统一,但管理系统管理的网络范围和实例数量将大大增加,管理链路的环境将增加大量的复杂性。在这种环境下,开发了洛神平台的控制系统,最重要的变化之一是我们统一的各种网关的南方,利用新的内存数据库抽象网关不同对象之间的关系,实现联动分销和批量分销,以提高控制的处理性能,如单一支持VPC千万例,亿级配置,每秒刷新千条路由的能力。
云端集成,网关设备多功能集成在数据方面,边缘场景非常多样化,导致一定的复杂性,但有一个共同点,空间有限,对成本敏感,但功能特性不能少,流量模型也多样化。此时,洛神云网络平台VPC网关设备已经整合。这里的整合不仅仅是简单地部署在物理设备中,层的转发资源也被池化,以便及时处理不同的资源模型。同时,还应确保结构上的解耦与中央云的网关结构一致。
面向应用生态的连接技术以上主要是一些网络连接广度的技术。在纵向深度上,简化了应用程序的连接,提高了阿里云洛神CyberStar以平台为基础,将服务链的能力集成到平台中CyberStar平台的网元可以很简单的连接,比如最近公测的NAT FW用户不需要配置任何路由,只需要检查集成的产品选项,就可以实现NAT和FW自动排水大大简化了应用的连接复杂性。
大数据驱动的智能运维分析最后,网络连接更广泛、更深,网络边界扩大,网络运维运行的复杂性将大大提高,网络控制面是单网元,是垂直部件,但网络是网络,需要整体视角,如网络元转发流量下降,是自己的问题还是底层vswitch问题,还是EIP问题;比如版本发布变更,业务是否全部恢复,都需要全局视角。针对这些场景,洛神平台升级了齐天大数据智能分析系统。齐天系统已开发并稳定运行多年。以前更多的是内部使用,以确保整个洛神云网络的顺利运行,护送我们提供的云网络产品和服务;从洛神3.0开始,我们还推出了产品服务——NIS网络智能服务采用与齐天大数据系统相同的架构。
齐天大数据分析平台这是齐天大数据平台的整体架构。相关监控数据将收集到数据中间平台层,标准化数据格式,统一数据访问接口。最后,云网络智能算法平台使用相关算法模型对这些数据进行清洁和分析,获取异常检测、相关性、根源定位和网络优化信息,并通过API传输给网络运维工程师和云用户。
综上所述,阿里巴巴云网络洛神平台正走向云网络3.0时代,开启应用-云边-端一体化的技术升级和探索。对于网络的横向延伸,将扩大网络的边界,云边-端在网络侧融合。网络的纵向延伸使应用和生态更加紧密。同时,采用智能方法,加快网络智能管理,向云用户输送智能能力,使网络更加简单。洛神3.0来了!阿里云资深专家升级了云网络平台的技术架构