关于算力网络和算网融合技术的研究

(整期优先)网络出版时间:2022-09-27
/ 2

   关于算力网络和算网融合技术的研究

张旭辉 

中国通信建设集团设计院有限公司第四分公司  数据交换部   河南省郑州  450052

摘要:数字化发展带来信息数据呈爆炸式增长,海量数据需要到云或者边缘进行存储、聚合分析实现数据价值转化,目前不同领域、不同网络、不同资源池间的入口开通、管理控制、资源调度各自独立,算力与网络较难实现统一协同。流动的数据源与可能同样流动的算力源之间的动态匹配连接问题更为复杂,算力的智能随选能力需网络进行适配,算网融合技术研究迫在眉睫。

关键字:数字化 边缘云 算网融合

1概述

算力作为释放数据优势、推动数字经济创新发展的重要数字基础设施,已经纳入国家战略规划。《十四五信息通信行业发展规划》中明确提出,到2025年数据与算力设施服务能力显著增强的目标。要形成数网协同、数云协同、云边协同、绿色智能的多层次算力设施体系,算力水平大幅提升,人工智能、区块链等设施服务能力显著增强。东数西算中云和网络的规划、枢纽节点的部署与网络运营商的规划部署,需要逐步形成一致,同时算力网络建设逐步向集约化、规模化、绿色化方面的发展。

2关键技术

算力网络是从资源最佳匹配角度出发,利用underlayoverlay方式,将算力与网络资源和能力协同起来,满足业务对算力的随选需求。通过算力网络,实现业务资源随行、按需使用,通过资源调度实现削峰填谷,平抑业务潮汐效应等。通过融合算力与网络资源,形成以网络为中心的资源平台,联合泛在计算资源平台能力,构建算网融合技术平台能力。

基于underlay方式,在算力路由节点中整合计算与联接信息,通过网络路由信息同步给网络中的其余算力路由节点。CFN[1]就属于underlay算力网络实现方案。Underlay方式算力网络需要节点设备支持新协议,会影响现网。

基于overlay方式,网络节点在获取算力信息后通过overlay技术将信息传递到目标节点,为目标节点提供算力服务。利用SRv6APN6SFC实现算力网络方案[2]Overlay方式算力网络需要端侧设备支持CFNSRv6,节点设备支持IPv6协议,现网影响较小。

3算力网络技术方案

1)算力网络功能架构

功能架构从算力网络需求出发,在编排管理层的协作下,通过算力网络控制层收集资源层资源信息,提供给服务层进行可编程处理,并根据返回结果实现资源占用建立网络连接。在该架构中,各层相互协作,为用户提供多样化的服务模式,实现资源的最优化配置。

算力网络服务层中包含各种提供给用户的服务功能,如实现用户、平台与资源节点的交易等功能。

算力网络控制层从资源层收集信息,并将其发送到服务层以进行进一步处理。从服务层收到处理结果后,控制层将占用资源并建立网络连接。控制层通过资源层整合了算力资源、联接资源及更多服务资源,通过提供整合后的资源满足符合用户的业务要求。算力网络控制层提供多种对资源层的控制能力,满足不同规模、不同客户对资源的需求。北向接口实现与业务层对接,满足业务对资源的需求。南向接口实现与资源层对接,完成各类资源的收集、分配与调度。东向接口与编排管理系统对接,支持并落实运营方运管维策略。通过控制面感知业务需求,进一步映射为算力需求,结合网络、算力状态,动态、按需生成算力调度策略。

转发层根据业务请求/算力请求,结合网络状况和计算资源性能状况,进行动态算力匹配,算力作为link state注入网络,数据面基于SRv6源路由实现网络和算力的可编程,带内的iOAM扩展综合考虑网络和算力的监控,实现网络/算力状态可感知的业务路径的灵活调整。

算力网络资源层是资源位置。包括通常在资源节点(云计算节点,边缘计算节点等)中使用的资源,如服务器、交换机、路由器、磁盘阵列、安全产品等。

算力网络编排和管理层可以实现算力网络的编排,安全,建模,OAM功能,具体如下:

负责算力网络资源和服务的编排和管理;

负责应用与安全相关的控件,以减轻算力网络环境中的安全威胁;

可以根据服务类型进行算力建模;

实现了算力网络的操作,管理和维护。

算力网络交易平台包括消费者中心、供应者中心、管理中心控制台,分别为算力网络消费者、算力网络提供者、算力网络运营者提供交易服务和管理功能。

2CFN路由协议

CFN协议用于用户数据与算力联接,位于网络层之上的 CFN 薄层,将当前的计算能力状况和网络状况作为路由信息发布到网络,网络将计算任务报文路由到相应的计算节点,实现用户体验最优、计算资源利用率最优、网络效率最优。

Underlay网络之上构建出CFN算力路由层,实现算力路由标识、控制、状态路由通告、寻址、表项建立等功能。CFN可以为数据分配最优算力,实现数据与算力最优联接,通过网络协议分发计算节点的算力信息,综合算力信息和网络信息,为数据提供最佳的算力分配及网络连接,将数据灵活调度到最优的算力节点上,实现数据与计算资源之间的高效、高质量连接。分布式的算力作为算力网络中的内生资源,通过

DynCast拉通联接成网,实现边缘计算高可靠性、系统整体利用效率最优。

3AI推动算力从云逐步下沉到端

AI技术发展迅速,推理与训练分开部署加速算力资源下沉,对网络更加依赖。端侧AI带来算力需求,随着端之间互动增多,多位置之间算力需要网络协同。异构计算将无处不在,网络可以提供更高的协同效率。

45G实现端--云算力持续性服务

伴随5G发展,车联网、IOT等新业务陆续成熟,对算力本地化、应用响应时延提出更高要求,需要业务无中断。5G ToB市场加速边缘DC/MEC部署,漫游用户需要边缘算力提供持续服务。C-V2X需要更多可持续算力开展业务创新。

5)计算能力

单核算力将持续提升,如骁龙865算力达15T,但芯片工艺到3nm后将越来越难加工;多核算力随着核数与频率提升将面临更复杂的芯片架构设计与功耗控制;提供算力的芯片类型层出不穷,异构计算需求将逐步增多;算力提供方越来越多,算力资源使用效率参差不齐且存在峰谷效应。在计算芯片领域,国产化芯片较领先产品差距较大,但通过算力网络联接更多计算服务,通过架构创新可减小技术差距带来的算力缺口,形成云--端多级算力协同供给体系,可以支撑实现更多需求侧业务体验提升,同时促进计算资源使用效率普遍提升,加速算力基础设施发展与建设。

4结语

随着以AI为代表的智能技术发展,越来越多的业务对融合型资源提出需求,要求资源融合供给满足业务体验,应用驱动算力持续增长,网络技术需协同发展。计算从云计算走向边缘计算,再从边缘计算走向泛在计算。算力由通用向异构演进,由单点向泛在持续演进,促进了网络和计算的深度融合。算网融合是借助以网络为中心协同各种算力资源,通过智能化统一调度和编排管理实现高效算力,将对信息通信网络和计算模式进行重构。面向计算网络深度融合的发展趋势,需要从新架构、新协议、新接口等方面协同演进,构建算网一体化新型基础网络,逐步推进算网融合。

参考文献

[1]算力感知网络的需求及应用场景.

[2]中国联通算力网络白皮书.