书名:迈向自智网络时代:IP自动驾驶网络
ISBN:978-7-115-66521-8
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
主 编 李振斌 曾昕宗
副 主 编 陈林坤 李向伟
责任编辑 郭 家
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
本书以IP自动驾驶网络概念为切入点,系统阐述自智网络背景下的IP承载网演进,网络运维过程中的网络管理,网络维护工程师、网络设备、网络管控系统与业务运营系统之间的交互过程,以及系统架构建议和关键技术方案,力求清晰地呈现IP自动驾驶网络的方案和技术全貌,帮助读者深入理解IP承载网面临的挑战和相关的技术演进方案。
本书面向IP承载网的运营管理人员、IP网络产品相关的设计开发人员、IP网络技术的研究人员,以及对数据通信技术感兴趣的广大读者,旨在帮助读者全面了解IP自动驾驶网络,助力IP承载网技术和产业的发展。
主 编: 李振斌 曾昕宗
副 主 编: 陈林坤 李向伟
执行主编: 李长礼 许亚杰
委 员: 赵 耀 杨 杰 杨赞伟 吴 钦 汪嘉城
尹志东 吴 波 李静雅
技术审校: 黄 河 王富国 张 勇 温瑞勇
李振斌:华为首席协议专家。负责华为IP领域的协议研究和标准推动工作。2000年加入华为,在10多年的时间里,作为架构师和系统工程师等先后负责了华为IP操作系统VRP和MPLS子系统的架构、设计与开发工作,2015—2017年担任SDN架构师,负责控制器的研究、架构设计与开发等工作。自2009年起,积极参与IETF标准创新工作,持续推动了SDN南向协议、SRv6、5G承载、Telemetry和APN等的协议创新和标准化,主导和参与编写的IETF RFC/草案累计100余篇,申请专利170多项,主编《SRv6网络编程:开启IP网络新时代》《IPv6网络切片:使能千行百业新体验》《“IPv6+”网络技术创新:构筑数字经济发展基石》等多本技术专著。2019—2023年间曾担任IETF互联网架构委员会(Internet Architecture Board,IAB)委员,承担互联网架构管理工作。
曾昕宗:华为运营商IP领域高级专家,自2005年起专注IP领域的工作。曾担任MPLS和PCE领域的设计师和技术负责人,先后担任IP领域网络控制器产品Agile Controller-WAN和iMaster NCE-IP的首席架构师。对运营商IP领域的应用场景和解决方案有全面、深入的理解,特别是在MPLS、SRv6等技术体系下的协议演进与实现,以及网络运维系统的架构设计等方面,具有丰富的实践经验。
陈林坤:华为iMaster NCE-IP产品解决方案首席专家,负责华为运营商IP网络运维解决方案的设计工作。从2007年开始,一直从事网络运维系统领域的工作,先后参与了DMS、iManager U2000-IP、iMaster NCE-IP产品的核心功能开发与设计。对于运营商IP领域的组网场景与企业广域网络场景及运维解决方案有深入的理解与丰富的设计经验。
李向伟:华为数据通信运维领域产品软件总工程师,负责产品的软件架构设计和规划。从2006年开始一直在数据通信网络管理软件领域工作,先后主导华为iManager U2000-IP和iMaster NCE-IP产品的软件架构设计与开发。在运营商IP网络运维系统的架构设计及软件实现技术方面,具有深刻的见解和丰富的实践经验。
本书不仅为我们呈现了一幅IP自动驾驶网络的完整画卷,更深入地剖析了IP承载网所面临的挑战和相关的技术演进方案。通过阅读本书,读者可以全面了解IP自动驾驶网络的理念、技术和实践,掌握未来网络发展的脉络,为推动Net5.5G技术进步和产业发展贡献自己的力量。希望本书能够成为广大读者了解IP自动驾驶网络技术的宝贵资料,为通信行业的未来发展注入新的活力。
——中国通信标准化协会理事长 闻 库
华为组织撰写的《迈向自智网络时代:IP自动驾驶网络》一书,从系统架构、标准发展、应用场景和关键技术等多个维度深入阐述与分享了华为在该领域多年的研究成果。作为一位长期关注IP自动驾驶网络与网络智能化发展的研究者,我深感本书的出版恰逢其时,它为我们提供了丰富的理论知识和实践案例,对与自智网络相关的产学研用有重要的参考和借鉴价值。我相信,本书的出版将有助于激发研究人员、工程师和企业家的创新灵感,推动IP自动驾驶网络与各行各业的深度融合和广泛应用。同时,我也希望广大读者能够从中汲取智慧和经验,践行科技创新理念,共同为构建更加智慧、高效、安全的下一代互联网贡献自己的力量,助力新质生产力的发展。
——中国联通研究院副院长 唐雄燕
《迈向自智网络时代:IP自动驾驶网络》不仅是一本技术指南,更展现了对未来网络形态的思考与探索。我由衷地向广大读者推荐本书,无论您是工程师、研究人员,还是企业管理者,本书都将在您探索自智网络的道路上,带给您启发和灵感。希望本书能激发更多人对IP自动驾驶网络的关注和兴趣,共同推动数据通信产业乃至整个通信行业的持续创新与发展。
——华为NCE数据通信领域总裁 王 辉
通信技术作为人类进步的阶梯,自古以来便肩负着文明交流的使命。从古代的烽火狼烟、飞鸽传书,到现代的无线电波、光纤传输,通信技术的每一次革新都极大地推动了人类社会的发展。如今,我们正处于一个数字化、网络化、智能化交织的时代,IP网络以其独特的灵活性、可扩展性和易接入性等,成为推动这一变革的核心力量。
随着5G的成熟和Net5.5G概念的提出,IP承载网作为信息社会的基础设施,其演进方向备受关注。Net5.5G所定义的六大关键特征——跨域网络智能化、绿色超宽、高韧性低时延、IPv6增强、广域异构物联和泛在网络安全,不仅为我们描绘了一幅未来网络的宏伟蓝图,也对IP承载网的技术创新和服务能力提出了更高的要求。
然而,技术的演进并非一帆风顺。移动互联网业务的快速发展,带来了市场格局的深刻变革。运营商面临着收入增速放缓、投资回报下滑的挑战,原有的利润空间被新兴的OTT厂商不断侵蚀。如何使IP承载网更好地创造价值,为运营商和服务提供商带来双赢,成为一个亟待解决的问题。
正是在这样的时代背景下,本书应运而生。本书由华为资深工程师团队编写,他们凭借在路由器设备、网络管控系统等领域20多年的丰富经验和深厚积淀,将自动驾驶网络的概念引入IP承载网领域,系统地探讨了网络规划与建设、网络维护、业务运营等各个环节中人与系统之间的交互,以及系统的架构建议和关键技术方案等。
本书不仅为我们呈现了一幅IP自动驾驶网络的完整画卷,更深入地剖析了IP承载网所面临的挑战和相关的技术演进方案。通过阅读本书,读者可以全面了解IP自动驾驶网络的理念、技术和实践,掌握未来网络发展的脉络,为推动Net5.5G技术进步和产业发展贡献自己的力量。
希望本书能够成为广大读者了解IP自动驾驶网络技术的宝贵资料,为通信行业的未来发展注入新的活力。
中国通信标准化协会理事长
数字经济时代,以人工智能生成内容为代表的人工智能技术正在推动下一代互联网的创新发展。自智网络作为下一代互联网的重要特征之一,其核心依托IPv6技术的演进,并深度融合人工智能等新一代信息技术,引领和推动数字信息基础设施的新一轮变革。自智网络通过引入人工智能、大数据等先进数字技术,实现网络的智能化运维和管理,使网络具备自我感知、自我优化、自我决策和自我演进的自智能力。
中国联通作为网络智能化创新的先行者,近期目标是到2025年实现L4自智网络。自智网络也称为自动驾驶网络,其发展可以类比智能汽车的发展,分为不同的等级。L1的手工网络需要工具辅助,L2的半自动网络基于固定规则实现自动化,L3可以实现基于预测的自动化,L4通过系统自决策实现意图驱动的智能化,L5的自智网络则可实现完全无人化。目前我们正处于从L3到L4的发展阶段,网络实现了部分的自动化,并朝着高度智能化快速演进。当前自智网络发展还面临多方面的挑战:一是自智网络需要依赖先进的算力、算法和模型等来实现自我感知和自我决策;二是不同行业和不同场景对自智网络的需求不同,保证多场景的适应性是难题;三是产业链相关各方的协同面临挑战,自智网络标准体系和产业生态有待完善。对此,产业链相关各方需要加强合作与沟通,共同努力,推动网络智能化技术不断创新和进步,加快实现高等级自智网络。
华为组织撰写的《迈向自智网络时代:IP自动驾驶网络》一书,从系统架构、标准发展、应用场景和关键技术等多个维度深入阐述与分享了华为在该领域多年的研究成果。作为一位长期关注IP自动驾驶网络与网络智能化发展的研究者,我深感本书的出版恰逢其时,它为我们提供了丰富的理论知识和实践案例,对与自智网络相关的产学研用有重要的参考和借鉴价值。我相信,本书的出版将有助于激发研究人员、工程师和企业家的创新灵感,推动IP自动驾驶网络与各行各业的深度融合和广泛应用。同时,我也希望广大读者能够从中汲取智慧和经验,践行科技创新理念,共同为构建更加智慧、高效、安全的下一代互联网贡献自己的力量,助力新质生产力的发展。
唐雄燕
中国联通研究院副院长
在全球数字化潮流的推动下,通信网络作为信息社会的基石,正以令人瞩目的速度不断进化。从最初的语音通话到如今的万物互联,每一次飞跃都凝聚着技术的创新与突破。作为支撑这一切变革的关键基础设施,IP承载网正迈入一个全新的阶段——自智网络时代。本书正是对这一时代的深刻洞察与对未来蓝图的详细描绘。
在过去的几十年里,IP承载网承载了世界上绝大部分的信息流动,从互联网到企业专网,再到家庭宽带,它支撑着日益复杂的应用场景,成为连接世界的中枢。本书以IP承载网为核心,深入剖析自动驾驶网络在IP领域的实施框架、技术架构、应用场景,以及未来发展趋势等。作者团队凭借多年的经验积累和对行业趋势的深刻理解,以严谨的逻辑和创新的视角,构建了一个完整而清晰的IP自动驾驶网络知识体系。
作为华为数据通信NCE网络产品线的负责人,我深刻感受到自智网络对行业未来发展的重要性。自动驾驶网络不仅是IP承载网智能化的核心路径,更是提升网络效率、提升服务体验、提高网络安全性和可靠性的关键手段。通过自动化和智能化技术,IP承载网将能够应对海量设备连接、高速数据流动和多样化服务的需求,全面提升网络的韧性和适应能力。
华为始终致力于实现“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”的愿景。IP承载网作为这一愿景的重要组成部分,必须变得更加智能化和自动化,以应对未来海量连接、高可靠性、高质量、安全可信、绿色节能等多方面的挑战。我们希望通过自动驾驶网络的创新,推动网络不断演进,满足万物互联时代的多样化需求。
《迈向自智网络时代:IP自动驾驶网络》不仅是一本技术指南,更展现了对未来网络形态的思考与探索。我由衷地向广大读者推荐本书,无论您是工程师、研究人员,还是企业管理者,本书都将在您探索自智网络的道路上,带给您启发和灵感。希望本书能激发更多人对IP自动驾驶网络的关注和兴趣,共同推动数据通信产业乃至整个通信行业的持续创新与发展。
让我们携手并进,迈向自智网络时代!
王辉
华为NCE数据通信领域总裁
“通信”作为人类的基本需求,一直伴随着人类社会的发展而有序演进。在数字化、网络化、智能化的当下,通信所承担的职责也从“丰富人们的沟通和生活”,向着“构建万物互联的智能世界”转变。以IP为特征的数据通信,也凭借其灵活、易扩展、易接入等特征,成为整个通信技术体系里重要的组成部分。
时代在快速变化,机遇与挑战并存。IP承载网作为每个国家的核心基础设施,承载着更快地推动技术进步和更好地服务于国计民生的双重职责。随着5G的成熟以及Net5.5G概念的提出,IP承载网的演进正在加速。Net5.5G定义了数据通信网络的六大关键特征:跨域网络智能化、绿色超宽、高韧性低时延、IPv6(Internet Protocol version 6,第6版互联网协议)增强、广域异构物联及泛在网络安全。在这一技术背景下,探讨IP承载网的演进方向,以支撑未来网络的发展,显得尤为重要。与此同时,移动互联网业务的快速发展也带来了新的挑战。运营商面临收入增速放缓以及股东投资回报长期跑输市场平均水平的问题,原有运营商的利润不断被OTT(Over The Top,指互联网公司越过运营商,发展基于开放互联网的各种视频及数据服务业务)厂商侵蚀。在这样的市场环境下,如何使IP承载网更好地创造价值,为运营商和服务提供商带来双赢,成为产业界关注的问题。
网络的机遇与挑战提供了需求,快速发展的数字化和智能化技术提供了方法,自动驾驶网络的概念应运而生,其目标是创建一个高度智能化、自动化和高效的网络环境,使网络能够像人脑一样,具有自我学习和自我调整的能力,从而在不断变化的环境中持续提供卓越的服务。本书以IP自动驾驶网络的概念和技术为基础,详细介绍自动驾驶网络在IP承载网领域的应用。本书内容涵盖网络规划、建设、维护、优化和运营的全生命周期,探讨如何演进和建设下一代IP网络,并分析在此过程中面临的挑战及解决方案。
● 第1章:IP自动驾驶网络综述。本章介绍为什么把自动驾驶网络的概念引入IP网络,以及定义什么是IP自动驾驶网络,并从目标、代际特征、架构原则和流程方法等方面阐述IP自动驾驶网络的实施框架,最后介绍产业和标准体系里IP自动驾驶网络的相关进展,帮助读者建立针对IP自动驾驶网络的全面知识体系。
● 第2章:IP自动驾驶网络的典型应用场景。本章围绕IP承载网的特征,以及IP承载网在网络规划、建设、维护和优化等环节的关键特性,介绍引入自动驾驶网络技术后的典型应用场景。通过这些具体的场景,希望能让读者对IP自动驾驶网络有一个具体的了解。
● 第3章:IP自动驾驶网络的系统架构。本章重点描述IP自动驾驶网络如何实现,首先基于应用场景识别挑战和问题;接着引出自动驾驶网络的系统架构,包括整个自动驾驶解决方案的构成,对具体组成部分的能力要求,以及给出在IP自动驾驶网络演进过程中,某些能力不具备的情况下的实施策略。
● 第4章:IP自动驾驶网络的关键技术。本章介绍IP自动驾驶网络关键技术的要点以及演进路径。
● 第5章:IP自动驾驶网络的应用与实践。本章结合典型的实践案例,介绍目前IP自动驾驶网络的现网实践及实际成果,希望能以这些实践为基础,激发更多的创新应用和方案。
● 第6章:IP自动驾驶网络的未来展望。本章畅想自动驾驶网络的未来图景,希望IP承载网可以更好地服务人们的工作和生活。
2018年9月,自动驾驶网络的理念在日内瓦举办的UBBF(Ultra-Broadband Forum,全球超宽带高峰论坛)上被首次提出。这一理念与汽车领域的自动驾驶概念虽应用场景迥异,但核心目标殊途同归,二者均利用现代技术实现更高的自动化水平,以提高效率、安全性和性能,减少人为错误为共同目标。自动驾驶网络的方案和技术自此开始快速发展。2019年,TM Forum(TeleManagement Forum,电信管理论坛)发布了首个自智网络产业白皮书,自动驾驶网络的理念也在业界专家的推动下,以AN(Autonomous Networks,自智网络)的名称被正式提出,自智网络的产业和技术发展进入了快车道,从产业共识,到标准体系,再到产业实践,自智网络的分级定义快速迭代演进。
华为作为最早加入此领域的解决方案供应商,从2019年10月开始,就开始把自动驾驶网络的概念引入网络建设和维护中。本书后文也将以自动驾驶网络为描述主体,代表应用了自智网络技术和解决方案的网络系统。通用的IP(Internet Protocol,互联网协议)网络是指使用IP进行数据传输的网络,但是IP的概念太过宽泛,从终端设备到骨干网的传输设备,从数据中心网到企业园区网,从互联网访问到语音通话,只要是使用IP(协议)的,都可以是IP网络的一部分。IP承载网作为整个IP网络体系里的核心部分,通常由运营商或大企业运营,负责传输实时通信数据、互联网流量、企业应用等多种数据。本书以IP承载网为基础,展开介绍自动驾驶网络的技术方案,后文提到的IP网络,如无特别说明,也指IP承载网。
本章根据IP承载网的演进过程,首先介绍IP自动驾驶网络的产生以及自动驾驶网络带来的价值;接着从自动驾驶网络的演进、架构,以及如何实施和推进等几个问题出发,详细介绍实施自动驾驶网络的框架全景;最后全面呈现产业界当前针对IP自动驾驶网络的相关标准及其发展情况。
IP承载网、无线/有线接入网和光传送网是网络架构中具有不同功能、扮演不同角色的3个关键组成部分,它们在技术特征、应用场景和设计目标上有明显的区别,但又相互协作,共同构建了现代通信网络的基础。无线接入网以Wi-Fi(Wireless Fidelity,无线保真)、4G/5G等无线通信和连接技术为基础,主要用于移动通信和无线互联网接入;有线接入网通过传统的拨号接入、以太网接入、宽带接入等方式连接用户和互联网;光传送网以光纤通信技术为基础,提供极高带宽、远距离传输的数据传输服务;IP承载网作为承载IP的网络层,负责在网络之间传输数据,以IGP(Interior Gateway Protocol,内部网关协议)/BGP(Border Gateway Protocol,边界网关协议)/MPLS(Multi-Protocol Label Switching,多协议标记交换)等网络互联协议为基础,使用路由器、交换机和其他网络设备来管理数据传输。相对于无线接入网和光传送网,IP承载网具有高度的灵活性和可扩展性,能够适应不断变化的业务需求,但也带来网络拥塞、时延和安全威胁等挑战。
IP承载网的发展经历了从简单的连通性网络到高度复杂的智能化网络系统的过程。随着技术的不断演进和网络需求的多样化,IP网络基础设施和运营方式也在持续进化。
在IP承载网的发展历程中,早期阶段的核心在于保证基础的连通性网络,这一时期的关键进展奠定了互联网的基础。可以从以下3个维度来看待这一阶段的演进。
(1)ARPANET和TCP/IP:互联网的起源
互联网的起源可以追溯到20世纪60年代末,最初的网络项目ARPANET(Advanced Research Projects Agency Network,高级研究规划局网络)是由DARPA(Defense Advanced Research Projects Agency,美国国防高级研究计划局)资助的,旨在研究分布式网络技术。ARPANET的目标是通过分散的网络结构,实现可靠的通信。它于1969年首次在美国西海岸的4个节点之间建立了网络连接,使用了分组交换技术,以确保即使某些节点失效,网络仍然可以继续运作。
20世纪70年代,TCP(Transmission Control Protocol,传输控制协议)/IP逐渐发展起来,成为ARPANET的核心通信协议。TCP/IP的关键理念是将数据分成小包,进行独立传输,然后在目标节点重新组装。这种灵活的方式使得网络的可靠性和容错能力得以提升。TCP/IP为后来的互联网协议奠定了基础,成为全球网络通信的通用标准。
到1980年,世界上既有使用TCP/IP的美国军方的ARPANET,也有很多使用其他通信协议的各种网络。为了将这些网络连接起来,NSFNET(National Science Foundation Network,美国国家科学基金会网络)逐步建立和运营起来,通过在每个网络内部使用网络自己的通信协议,在和其他网络通信时使用TCP/IP的方式,NSFNET把多个网络互联起来,这确立了TCP/IP在网络互联方面的地位。到了20世纪90年代,随着浏览器技术的出现,WWW(World Wide Web,万维网)时代也拉开了帷幕。
(2)网络设备和基础设施:报文转发
在IP承载网中,负责处理IP报文转发的网络设备是整个网络的核心。早期的局域网仅使用网卡、集线器、交换机和网桥等设备,这些设备主要在物理层和数据链路层进行报文转发。1986年,思科公司推出了一款名为AGS(Access Gateway Server,接入网关服务器)的多协议路由器,首次实现了不同协议的计算机网络之间的数据传输。这一创新使原来不兼容的计算机网络能够通过路由器相互连接。
早期的路由器连接能力有限,能处理的业务量较小,因此对数据处理能力的要求并不高。随着技术的发展,路由器在网络基础设施中的地位逐渐上升,为更复杂的网络提供更高的性能和灵活性。
(3)路由协议的演进:控制网络通信
随着ARPANET和互联网的扩展,网络间的路由和数据传输变得越来越复杂。为了确保数据能够正确地从一个节点到达另一个节点,路由协议的演进至关重要。早期的路由协议主要是IGP,用于管理内部网络的路由。
其中,RIP(Routing Information Protocol,路由信息协议)是早期使用的主要协议之一。RIP通过每隔一定时间向网络中的其他路由器广播路由表,确保网络的路由信息更新。随着网络规模的扩大,现在被广泛使用的IS-IS(Intermediate System to Intermediate System,中间系统到中间系统)路由协议和OSPF(Open Shortest Path First,开放最短通路优先协议),也在20世纪80年代末诞生,更好地实现在复杂网络环境下的路由快速收敛以及避免路由环路。这些路由协议的演进,为网络的稳定和连通性提供了关键支持。
(4)网络结构的演进:从局域网到广域网
早期阶段的网络结构主要集中在局域网。局域网是指在较小范围内部(例如校园或企业内部)建立的网络。最初的局域网使用不同的连接方式,如同轴电缆直连和环形拓扑。
20世纪70年代末,以太网的出现改变了局域网的构造方式。它基于共享介质的网络架构,允许多个设备通过广播方式通信。以太网的主要特点是提供了一种简单、可靠且可扩展的连接方式。随着技术的发展,以太网技术逐渐取代了其他局域网技术,成为组网的主流技术。
在局域网基础上,城域网和骨干网的概念逐渐形成。城域网是指在城市范围内连接多个局域网的网络,而骨干网则是负责在更大范围内传输数据的网络。这些网络结构的演进,从局域网到城域网,再到骨干网,为互联网的扩展和全球连接提供了坚实的基础。
从20世纪90年代到21世纪10年代,IP承载网进入了快速发展的阶段,逐步成长为现代社会通信的核心基础设施之一。
(1)万物互联业务的发展
在20世纪90年代,互联网开始从学术和研究环境走向大众市场。ISP(Internet Service Provider,互联网服务提供商)的出现,使得家庭和企业用户能够方便地接入互联网。这一时期,电子邮件、万维网和文件传输等业务迅速发展,互联网的用户数量呈指数级增长。人们开始通过互联网进行电子商务、社交互动和在线娱乐等,这使得网络流量大幅增加,推动了IP承载网的发展。
万物互联的概念在这一时期开始迅速发展,随着互联网技术的普及,更多的设备和系统连接到网络。企业和工业领域开始引入网络化的设备,形成了早期的IoT(Internet of Things,物联网)。这些变化带来了新的网络需求,需要网络支持大量设备同时连接,并且确保数据传输的可靠性。
(2)网络设备和基础设施的发展
随着互联网技术的不断发展,网络设备的需求也愈加复杂。报文处理不再只是简单的转发,还需要支持QoS(Quality of Service,服务质量)、路由查找,以及二层帧头的剥离和添加等复杂操作。受限于处理器性能不足,早期路由器的查表转发能力无法满足日益增长的网络业务需求,因此ATM(Asynchronous Transfer Mode,异步传输方式)交换机曾一度成为互联网中的核心设备,取代了传统路由器在IP承载网中的地位。
到20世纪90年代末,互联网流量逐年成倍增长,路由器的性能得到显著提升,重新夺回了被ATM抢占的市场。千兆位/秒级别的路由交换机开始普及,逐渐形成了从接入层到汇聚层再到骨干层的多级路由设备体系。这一体系在当今网络中仍然被广泛采用。
在转发技术方面,ASIC(Application Specific Integrated Circuit,专用集成电路)技术成为制造硬件转发芯片的核心技术。ASIC芯片内含多个硬件表格和查找引擎,能够迅速检索路由表等关键信息,大幅提高数据转发速度。继ASIC之后,NP(Network Processor,网络处理机)实现了更高的灵活性。网络处理机具备可编程能力,由多个微处理器和硬件协处理器组成,支持并行处理。这一架构允许路由器通过软件控制处理流程,能够灵活应对流量调度、QoS、拥塞控制,以及路由表查找等复杂操作,显著提升了路由器的性能。
路由设备的架构也经历了从转发与控制功能由单一板卡完成的集中式架构,到转发与控制功能分别由独立的转发板和主控板完成的分布式架构,再到由多个节点协同完成转发与控制功能的多框集群架构等多种形式。这些架构变化使得路由设备能够支持多种业务和百吉比特级别的数据路由与交换能力,为现代互联网的高速发展提供了坚实基础。
(3)路由协议的发展
从20世纪90年代开始,路由协议的发展伴随着互联网的不断扩展和网络需求的变化,为现代互联网提供了坚实的基础,确保网络的可扩展性、可靠性和灵活性。
万物互联的重要协议——BGP不断丰富和成熟,成为自治域间建立通信连接的核心协议,把全世界的独立子网连接了起来。随着以IS-IS和OSPF为代表的动态IGP的成熟和完善,解决了自治域内复杂网络拓扑下网络扩展性和收敛速度方面的问题。MPLS技术的发展增强了网络可扩展性,并提升了流量工程能力。MPLS允许数据包携带标签,路由器可以根据标签进行快速的路由选择。这种机制提高了网络的传输效率,减少了传统路由协议的开销。此外,以IGMP(Internet Group Management Protocol,互联网组管理协议)和PIM(Protocol Independent Multicast,协议无关多播)为代表的组播协议也在这个阶段被广泛应用。组播是一种同时向多个目标发送数据的方式,特别适用于需要广播或分发数据的应用,如网络电视、在线教育等。
IPv6作为下一代互联网协议,也在1994年开始被提出和发展起来,IPv6不仅解决了IPv4(Internet Protocol version 4,第4版互联网协议)地址耗尽的问题,还简化了地址配置,提高了路由效率和可扩展性,同时可以更有效地处理移动性和安全机制。IPv6的出现,为互联网的进一步扩展奠定了基础。
(4)网络可靠性和质量的发展
随着互联网的广泛应用,用户对网络服务质量的要求不断提高。以IntServ(Integrated Service,综合服务)体系和DiffServ(Differentiated Service,区分服务)体系为代表的一系列QoS技术快速发展,从数据面的IP流的分类、计量和标记,缓存管理,队列调度,拥塞控制等,到控制面的MPLS TE(MPLS Traffic Engineering,基于MPLS的流量工程),再到管理面的SLA(Service Level Agreement,服务等级协定)建模、SLA接纳控制、SLA业务配置和SLA一致性监测与控制,QoS允许网络根据不同业务的优先级分配带宽,确保关键业务在高流量情况下能够正常运行。
与此同时,为了提高网络的可靠性,网络运营商开始引入冗余和备份机制。双路由器、多链路和备份线路等技术,使得网络即使在某些部分出现故障的情况下,仍能保持连通。网络管理和监控工具也得到发展,帮助网络管理员及时发现和解决潜在的问题。
(5)组网结构的发展
网络结构的演进也是一个重要的方面。随着互联网的扩展,城域网和骨干网的规模不断扩大,形成了更加复杂的网络拓扑。IP承载网基于网络层次划分,发展出包括接入层、汇聚层、核心层在内的城域网;基于承载业务划分,发展出固定业务承载网、移动业务承载网、数据业务承载网、综合业务承载网等复杂的网络形式。在这个阶段,网络结构的复杂性增加,IP承载网和接入网、光传送网深度互联,各司其职,组成了真正意义上的万物互联网络。
在当今全行业数字化转型的推动下,IP承载网正面临不断增长的通信和网络连接需求。SDN(Software Defined Network,软件定义网络)和NFV(Network Functions Virtualization,网络功能虚拟化)、云计算与数据中心、网络可信、大数据与AI、可持续性和绿色发展等方面的要求推动了IP承载网的持续发展。
(1)SDN与NFV
为了显著提高网络的可扩展性和灵活性,SDN和NFV应运而生。SDN使得网络能像通用软件一样,易于被修改,易于增加新业务,使网络更加敏捷。SDN架构的核心是在网络中引入一个SDN控制器,实现转控分离和集中控制,通过这个集中的控制器,把用户的需求转换为转发器的配置和转发指令,从而让网络可以快速响应用户多样化的需求,减少了对传统转发设备的依赖。NFV利用虚拟化技术在标准化的通用IT(Information Technology,信息技术)设备(如x86服务器、存储和交换设备等)上实现各种网络功能。NFV的目标是取代通信网络中私有、专用和封闭的网元,实现统一、通用“硬件平台+业务逻辑软件”的开放架构。NFV与SDN结合形成控制器加转发器的完整解决方案,为网络运营商提供了更高的灵活性,降低了网络建设和运营的成本。
随着网络规划、建设、维护、优化、运营等端到端流程的加入和丰富,原有网络运营体系中的网络管理、OSS(Operational Support System,运行支撑系统)、网络控制器等多个独立部件逐步融合,SDN和NFV的架构和技术被吸收和借鉴,演进到自智网络的架构体系。
(2)云计算与数据中心
云计算和数据中心的迅速发展,推动了IP承载网的演进。数据中心的规模不断扩大,需要更高的带宽和更可靠的网络连接。云计算通过将计算和存储资源集中化,实现了数据的集中管理和快速访问,网络需要具备更高的传输速度和可靠性,以确保云服务的质量。云计算的灵活性和弹性,需要网络具备更快速和敏捷的资源调配能力,支持更复杂的业务应用。
(3)网络可信
随着硬件性能的提升、软件功能的丰富,以及网络结构的复杂化,确保软硬件系统安全、可靠地持续运行成为一个重要挑战。另外,随着ICT(Information and Communication Technology,信息通信技术)产业对社会经济的支撑能力越来越强,IP承载网作为核心基础设施,也承载了越来越多的高价值业务与数据,如何保证IP承载网安全和可信地运营成为一个关键问题。在这个背景下,网络的可信性成为一个重要要求。
网络可信是指网络在满足业务需求之外,同时具备Resilience(韧性)、Security(安全性)、Privacy(隐私性)、Safety(安全性)、Reliability(可靠性)、Availability(可用性)这6个特征的确定性程度。韧性是指网络在受到攻击时能够承受并保持在有定义的运行状态(包括降级),且能够恢复并适应攻击以保证任务达成的能力。安全性指系统对恶意威胁的防护能力,确保网络中的信息保持机密性、完整性和可用性。隐私性指系统具备保护用户(含组织和个人)信息的能力,使得用户能够行使其个人信息的收集、使用、保有、披露和处置的权利和义务。安全性指系统失效不会导致不可接受的风险,不会危害自然人的生命或健康。可靠性指在给定的条件和时间范围内能无失效地执行要求的能力。可用性指系统能够按要求执行状态的能力。
网络可信通过一整套系统工程方法,从场景、特征与目标、执行流程、价值观等几个维度,让IP承载网提供值得信任的服务。
(4)大数据与AI
AI技术的发展使网络走向智能化成为可能。这一趋势不仅带来了更高效的网络管理和自动化,而且推动了网络性能、灵活性和安全性的全面提升。AI技术与网络的融合,促使网络系统具备自主决策和自我优化的能力,为未来网络的智能化奠定了基础。
通过机器学习和数据分析,网络能够实时监控自身状态,自动检测异常行为并采取相应措施,具备了自我修复和自我优化的特性,不仅减少了人工干预,还提高了稳定性;网络可以预测流量模式,动态调整资源,确保在高峰时期也能高效运行,提高了效率,减少了能源消耗;网络可以识别潜在的安全威胁,并自动采取措施,防止网络攻击,提升了安全性;网络运营商可以通过数据分析,为用户提供个性化服务,开发新的商业模式。
(5)可持续性和绿色发展
随着全球环保意识的增强,可持续性和绿色发展成为IP承载网的重要目标。网络运营商开始关注能源消耗和碳排放,寻找更加环保的网络解决方案。通过引入智能化的能源管理和优化策略,IP承载网可以降低能源消耗,支持绿色环保的发展理念。网络可以通过虚拟化技术和智能化调度,减少对物理硬件的需求,降低能源消耗。同时,绿色发展的理念也推动了网络设备的创新,推进研发更加节能的网络设备。
纵观IP承载网的发展,从一开始的基础连接功能,到如今的复杂服务能力,已经经历了显著的变化。最初,IP承载网的重点在于基本的连通性网络和数据传输,通过路由协议确保不同网络之间的通信。随着互联网的迅速普及,网络的规模逐渐扩大,网络的复杂性逐渐增加,IP承载网也开始引入更多的可靠性和可扩展性特征,例如MPLS技术和SRv6技术,以应对流量激增和网络拓扑的复杂性。
随着对网络质量和性能的要求不断提高,IP承载网发展出了支持服务质量和流量工程的能力,确保在高负载情况下维持稳定的网络性能。同时,为了应对日益严峻的网络安全威胁,网络提供了更高级的安全机制,包括防火墙、入侵检测和预防系统。
现如今,5G的应用逐步成熟,生成式AI技术不断推动着行业创新。IP承载网需要满足更加多样化和动态化的需求,尤其是在5G承载、云计算和物联网等领域,其关键能力将体现在更高的自动化和智能化水平等方面,以实现网络自我优化、自我修复和自我调整。
未来的IP承载网将成为一个高度自动化和智能化的自治系统,能够满足各种业务需求,并确保网络始终安全、可靠、绿色地运行。不妨设想一下未来网络的工作场景。
场景一,在城市的工业园区,一座新的智能制造工厂即将开建。当运营商将规划意图输入网络运营管理系统时,系统会自动生成最优的网络扩容方案,包括预算和实施计划。运营官审核计划后,系统自动生成详细的施工方案、网络布线和设备连接图等。随后,系统将任务分解给现场实施工程师。工程师在现场完成安装和上电,网络运营管理系统则自动完成设备配置、上线测试和验收等,确保网络扩容顺利完成并投入运营。通过紧密的人网协同,高效完成网络规划和建设。
场景二,在西藏的探险小队突遇事故,需要紧急开展骨折重建手术。网络运营管理系统立即开通了一条从当地诊所到上海某中心医院的手术专线,提供毫秒级的时延和99.999%的可靠性连接服务。通过这个网络连接,在上海的专家可以操控机器人远程完成手术,帮助探险小队转危为安。这种低时延、高可靠的网络服务,保障了关键时刻人的生命安全。深度的自动化,让网络服务与需求无缝衔接。
场景三,在网络运行中心,网络管控系统突然检测到从北京到上海的企业专线出现了转发丢包的情况。系统立即触发业务路由器进行精确故障诊断,发现上海某接入点存在恶意DoS(Denial of Service,拒绝服务)攻击。系统迅速计算并下发流量阻断策略,成功隔离了恶意流量,恢复了企业专线的正常运营。同时,系统还生成了故障分析和处置报告,供网络管理员审核。网络管控系统实时监测网络设备、板卡、光模块的运行情况,发现工作在北京机房的某设备光模块收发参数异常,存在故障风险。系统立即在凌晨的运维窗口内,驱动在机房内的机器人完成光模块更换,确保设备7×24h持续、健康运行。无人化的网络运行中心,网络零差错运行。
网络管控系统实时监控业务和网络流量情况,并预测未来的网络负载,在流量达到峰值前提前疏导网络流量,确保繁忙业务的稳定性。与此同时,在网络闲时,系统将流量汇聚到部分路由器,并将轻载的路由器降频运行,以节省电力资源。这种智能化的流量管理策略,不仅提高了网络的效率,还实现了绿色节能,符合可持续发展的理念。
IP承载网在向未来演进的过程中,需要一套完整的架构和方案支撑,IP自动驾驶网络实施框架应运而生。在这个框架下,围绕着IP自动驾驶网络能带来哪些好处,网络应该如何演进,需要什么样的架构和关键技术,以及如何推进和实施这几个核心问题,定义IP承载网的价值主张,网络演进的代际特征、架构和关键技术,具体的流程和实施方案等,逐步实现IP网络自智目标。
IP自动驾驶网络的实施需要一套完整的解决方案,包含多个维度。这一实施框架涉及人、产品、组织和流程等要素,每个要素之间都相互关联、相互影响。因此,实施框架的设计需要基于系统工程的方法,从战略到执行的各个层面进行定义,确保从概念到具体操作的一致性。通过自我迭代和持续改进,这个框架能够不断演进,以实现更高的自动化和智能化水平,并在这一过程中持续创造价值。鉴于IP自动驾驶网络的实施框架与通用自智网络的框架一致,仅在IP承载网的应用场景上有所差别,图1-1引用自TM Forum的“Autonomous Networks: Empowering Digital Transformation-Evolving from Level 2/3 towards Level 4”,并增加了IP承载网特有的业务内容。
图1-1 IP自动驾驶网络整体实施框架
整个自动驾驶网络实施框架以愿景和目标为出发点,无论是几项基本主张,还是分解出来的核心要素,具体的运营流程和实践,皆是为了实现愿景和目标。
本章将重点介绍IP自动驾驶网络实施框架的方法论。对于那些需要依据标准确定的内容,例如分级标准和评估方案等,我们将依照国际和行业的权威标准组织的标准,如TM Forum、CCSA(China Communications Standards Association,中国通信标准化协会)、ETSI(European Telecommunications Standards Institute,欧洲电信标准组织)等组织的标准,以及各运营商的行业及企业标准。本章不旨在重新制定一套标准规范,而是致力于解释和应用这些已有的标准。
IP自动驾驶网络的愿景定义如下:通过实现自配置、自修复、自优化的IP承载网基础设施,向网络用户提供零等待、零接触、零故障的使用体验。
在这个愿景中,主要包括两部分目标。一部分目标是面向网络运营和管理者,旨在通过无须人工干预的方式实现网络业务的自动受理和开通。通过自动化故障响应和处理机制,提高网络维护效率,确保网络的安全与可靠运行。同时,通过实时监控网络运行数据,持续优化网络性能,最大化网络效能。另一部分目标是面向网络用户,提供“零等待”体验:用户提出网络需求后,能够在极短时间内获得服务,无须长时间等待。网络故障将实现分钟级闭环处理,而一些成熟的业务则可达到秒级闭环处理。还提供“零接触”服务,无论是企业用户还是个人用户,均可通过电子商务化的自助服务平台进行订购、变更、维护、优化等操作,满足用户随时随地的服务需求。而“零故障”目标需要通过极高的业务可用率来实现,这不仅可以提高用户满意度,还可以减少用户投诉。未来,网络的可靠性将提升10~100倍,业务可用率普遍能够达到99.9999%。这些目标将引导我们实现一个高效、自动化且用户体验极高的网络环境。
为了实现上述愿景和目标,需要深入探讨和解决如下4个核心问题。
问题一,IP自动驾驶网络的好处是什么?这是关于“为什么”采用自动驾驶网络的问题。需要明确IP自动驾驶网络能为网络运营商和用户带来哪些具体的利益,如成本节约、效率提升、用户体验改善等。这个问题将在价值主张和成效指标部分展开解读。
问题二,IP自动驾驶网络应如何逐步演进?这是关于“做什么”的问题。需要规划IP自动驾驶网络从初级阶段到高级自动化阶段的具体演进路径,包括短期和长期的目标、阶段性成果以及可能的技术里程碑。这个问题将在代际特征和分级标准部分展开解读。
问题三,IP自动驾驶网络需要什么样的架构?这是关于“如何做”的问题。探讨构建IP自动驾驶网络所需的技术架构,包括必要的硬件设施、软件系统、数据处理和安全机制等。这个问题将在架构原则和目标架构部分展开解读。
问题四,IP自动驾驶网络如何实施和推进?这个问题涉及实施策略和方法。需要制订详细的实施计划,包括项目的启动、执行、监控和优化等,以及如何克服可能遇到的技术和管理挑战。这个问题将在流程方法和自智地图部分展开解读。
价值主张承接自动驾驶网络的愿景。为了实现IP自动驾驶网络的愿景,可以参考图1-2,定义和具体化IP承载网场景下的价值主张,并通过成效指标来支撑价值主张,逐层分解和定义,形成具备支撑关系的成效指标树。
图1-2 支撑价值主张的成效指标树
尽管每个网络运营商的价值主张应根据其特定的网络运营目标来设定,但我们认为在IP承载网的顶层价值主张方面存在普遍一致性。这一价值主张借鉴了TM Forum标准的定义。以下是IP承载网价值主张的典型示例,分为4个核心领域,以提升网络的整体价值。
(1)提升网络变现能力
● 通过能力封装和在线设计加载,缩短业务TTM(Time to Market,上市时间),助力运营商快速抢占市场先机或应对竞争。
● 提供NaaS(Network as a Service,网络即服务)和扩展服务型业务,实现SLA的变现,创造新增收入。
● 支持精准营销和装维服务,降低获客成本,优化现有用户的价值管理。
(2)提升用户体验
● 实现电商化服务,包括网络测速、在线变更和故障自检等功能,增强自助服务能力。
● 通过体验监测、流失预测及隐患预测等功能,提升SLA达标率,优化用户体验,减少故障和投诉。
● 构建业务开通和故障自处理能力,提升业务开通和故障处理的效率。
(3)提升资源效率
● 通过自动规划和自动配置,实现精准规划和快速建设,提升投资回报率和净资产收益率。
● 构建全网的智能编排和协同调度能力,充分利用现有网络资源,提升网络利用率。
● 推动网络与业务的联动,实现网络质量与节能的协同优化,提升能源利用效率。
(4)提升人员效率
● 通过提升网络运维效率,简化操作流程,提升人均设备维护量和业务支持量,缩短作业耗时。
● 通过专业化技能培训和课程赋能,助力员工转型、升级,从事市场拓展、模型训练等高价值工作。
为了将上述价值主张具体化,并使之成为可执行、可验证的指标,需要定义一套成效指标。这些指标将直接关系运营商的价值主张,并有效衡量自动驾驶网络给运营商、用户及整个行业带来的商业价值。这些量化指标将清晰地展示自动驾驶网络在演进和升级过程中创造的价值。
成效指标同样具有较强的定制性,需要根据各个IP承载网的具体情况由网络运营主体来定义。在此基础上,我们参考TM Forum标准的部分定义,提供满足IP承载网要求的通用成效指标,如图1-3所示。
图1-3 满足IP承载网要求的通用成效指标
通过对一级指标以及二级指标的分解来支撑四大价值主张。具体的组织和运营商在实际操作中,可以根据自身业务需求进一步细化和定制指标。例如,可以将二级指标“业务交付时长”具体化为“云专网业务开通时长”和“以太专线业务开通时长”等,以此精确描述各业务实例的性能。通过这种方法,不仅可以确保每项价值主张都有相应的执行标准和效果验证,还能够确保这些标准在实际应用中具有高度的适应性和实用性。这样的做法有助于推动自动驾驶网络技术的实际落地,并在整个行业中得到推广和标准化。
代际特征从“如何实施”的角度定义实施方案,旨在为自动驾驶网络的演进设定清晰的发展节奏。这样做可以在执行层面迅速建立共识。
不同的组织对代际特征有不同的定义,TM Forum基于人和机器的参与度,定义了图1-4(引用自TM Forum标准IG1218[1])所示的通用代际特征。
图1-4 通用代际特征
自智网络划分为L0~L5这6个代际,其中L0代表最低等级,L5代表最高等级,各等级的系统能力如下。
● L0——人工运维:系统提供辅助监控能力,所有动态任务都需要人工执行。
● L1——辅助运维:系统可根据预先配置,执行特定的重复性子任务,以提高执行效率。
● L2——部分自智网络:在特定外部环境中,系统可以根据预定义的规则/策略,面向特定单元使能自动化闭环运维。
● L3——条件自智网络:在L2的基础上,系统可以实时感知环境变化,并在特定网络专业领域中进行自优化和自调整,以适应外部环境。
● L4——高度自智网络:在L3的基础上,系统可在更复杂的跨多网络领域环境中,实现业务和用户体验驱动网络的预测式或主动式的闭环管理,从而进行分析并做出决策。
● L5——完全自智网络:电信网络演进的终极目标,系统具备面向多业务、多领域、全生命周期的全场景闭环自治能力。
IP承载网的自动驾驶代际特征和分级标准应围绕价值创造过程来具体化,并为每个过程定义相应的代际特征。以下内容概述了IP承载网价值创造过程中的5个主要阶段——规划、建设、维护、优化和运营,以及这些阶段包含的8个子过程。各子过程在不同等级的代际特征将被明确定义。
对于已广泛实现的前3个等级,即L0~L2,本节不过多描述,这3级整体代际特征如下。
● L0——人工处理:主要依靠经验,全面依赖人工操作。
● L1——工具协同:使用专业工具辅助人工,提高特定领域的工作效率。
● L2——网络自动化:人指挥网络运行,网络被动接收人的执行要求并自动执行,针对特定场景给出辅助分析,需要人工进行决策。
从L3开始,我们将详细定义各等级代际特征,这3级整体代际特征如下。
● L3——网络服务化:网络在人的监管下运行,基于人的意图执行功能,并做出分析和决策推荐,人必须保持交互并做出指挥。
● L4——网络智能化:网络根据意图运行,人的辅助不是必需的,网络基于意图完成功能执行和决策,人在执行流程外。
● L5——网络全自智:网络根据意图自主运行,实现IP承载网全场景分析、决策、自动化端到端自智。
此外,代际特征的定义还需考虑各运营商和网络的具体价值主张,因为不同的运营商和网络可能有不同的目标和需求。本节提供一个通用的特征定义框架,具体如表1-1所示,以帮助网络运营主体根据自身情况定制。
表1-1 L3~L5详细代际特征
价值创造 过程 |
价值创造 子过程 |
代际特征 |
||
---|---|---|---|---|
L3:网络服务化 |
L4:网络智能化 |
L5:网络全自智 |
||
规划 |
01网络规划 |
自动生成网络规划 |
预测网络发展,系统推荐规划 |
全部场景下,由系统自动识别规划需求,完成规划设计的需求映射、资源勘查、规划、设计、仿真、数据制作、数据下发、调测优化和业务验证的完整全流程闭环的智能化,当AI模型需要迭代时,支持在线学习自动优化 |
建设 |
02设计部署 |
系统辅助完成建设计划与验收,设备即插即用 |
系统驱动完成建设,自动验收 |
|
维护 |
03监控排障 |
网络状态实时多维(时间维度“历史+现在”,业务维度多类型数据分层)可视,网络故障实时发现,系统辅助诊断,系统辅助抢通与修复 |
网络状态可预测,问题提前预防,网络故障系统自动诊断,系统驱动完成抢通与修复 |
|
04例行巡检 |
系统辅助完成隐患分析,生成巡检报告 |
系统自动巡检,主动推送巡检报告 |
||
05网络变更 |
系统支撑完成变更评估与验收,升级不断服 |
系统驱动完成变更,变更零风险 |
||
优化 |
06网络优化 |
单目标优化 |
多目标优化,系统自动调优 |
|
运营 |
07业务开通 |
业务发放自动化 |
业务发放前仿真,发放后验证,免人工审核 |
|
08网络投诉 |
投诉系统辅助诊断与处置 |
投诉系统自动诊断与处置,投诉预警 |
为了更好地支撑各个流程和功能的实施、验收和评估等,还需要基于代际特征,将每个价值创造过程再细化成子功能,分别定义具体的行为标准。我们按照图1-5对每个价值创造过程做分解抽象建模。
图1-5 基于代际特征分解的行为标准模型
每个价值创造子过程都会被分解成需求输入阶段的意图管理部分,以及实施阶段的感知、分析、决策和执行等几个价值创造活动。
● 意图管理:理解用户业务和管理运维意图,并驱动感知、分析、决策和执行等,确保网络能持续满足用户的需求。
● 感知:通过IFIT(In-situ Flow Information Telemetry,随流检测)、IOAM(In-band Operation,Administration,and Maintenance,带内操作、管理和维护)等各种感知技术,感知网络的配置、控制、转发、性能、故障等状态,并持续管理这些状态。
● 分析:对网络当前状态及历史数据进行分析,结合用户意图生成满足用户需求的操作动作和执行策略选项与建议。
● 决策:基于AI,以及对执行结果的仿真,做出执行决策。
● 执行:通过配置、控制等各种方式,完成网络配置自动化以及网络集中控制等动作。
下面以表1-2为例,基于上述价值创造活动展开,定义具体的分级标准。完整价值创造过程的分级标准由TM Forum和CCSA等标准组织进行规范化,具体内容可参考各标准组织的定义,这里不赘述。
表1-2 监控排障活动的具体分级标准
价值创造活动 |
能力 |
分级标准 |
|
---|---|---|---|
L3:网络服务化 |
L4:网络智能化 |
||
意图管理 |
监控策略 |
系统预置监控模板及保障策略,运行时由人根据场景选择模板及保障策略,包括保障的业务范围、网络范围等,完成监控任务部署 |
系统根据业务级别和网络承载业务的情况,自动计算监控范围,以及部署监控任务 |
感知 |
异常识别 |
系统实时采集配置、控制、转发、性能、故障等状态,关联各个类型的数据,识别业务、网络的异常状态。 系统根据故障发生时间、网络拓扑、业务配置等,剔除异常噪声,包括去除重复告警、相关性告警聚类等,缩小后续处理范围 |
针对历史和实时的网络运行状态,预测业务和网络的异常状态,提前预警 |
分析 |
异常诊断 |
系统基于预置的策略和大模型能力,识别异常信息之间的关系,进行精确定位:将人工经验固化为AI特征或者知识图谱帮助识别异常信息之间的关系,自动查找关联信息,识别异常原因 |
系统自动学习新场景中的故障传播关系,持续增强异常诊断能力 |
方案生成 |
预置修复流程,系统自动匹配异常处理模式生成修复方案:系统根据定界、定位结果,自动匹配修复流程,生成修复方案 |
系统根据历史的异常处置和修复行为,持续学习和优化修复方案 |
|
决策 |
评估决策 |
系统提供仿真结果并推荐优选修复方案,网络工程师审核系统推荐的最佳方案,进行人工确认 |
系统自动完成仿真和决策:系统基于事前仿真计算结果,自动决策出最佳方案 |
执行 |
修复执行 |
系统根据决策后的异常处置方案,自动完成方案的全部步骤的执行,并根据策略出错回滚 |
系统自动执行异常处置方案 |
业务验证 |
系统自动完成异常处置后的功能验证,确保系统恢复正常,输出异常处置报告 |
同L3能力 |
有了完整的代际特征以及分级标准,如何评估同样是一个重要的话题,执行代际评估一方面可以快速掌握现状,用于制订优化改进计划,另一方面可以对实施计划做验收,确保目标达成。推荐采用表1-3所介绍的两种方法执行评估。
表1-3 自动驾驶网络分级评估方法
对比项 |
评估方法 |
|
---|---|---|
Inside-Out评估(详细评估) |
Outside-In评估(快速评估) |
|
评估对象 |
价值创造子过程 |
价值创造子过程 |
评估最小单元 |
针对价值创造子过程—价值创造活动—能力,单独评估每个能力项 |
针对价值创造子过程—价值创造活动—能力,通过调研问题评估 |
评估形式 |
矩阵式 |
问卷式 |
评估目的 |
详细评估/识别各能力的短板 |
快速评估价值创造过程的大致等级 |
评估工作投入 |
较大(每个价值创造子过程有50~80个评估项,每项有5~8个价值创造活动,每个活动评估10个任务) |
较小(每个价值创造子过程有5~10个问卷项) |
评估结果精度 |
高 |
中 |
应用场景 |
实施过程中的精细化评估,详细识别能力短板 |
摸底评估、短平快、Workshop等场景 |
详细评估方案通过对各个子项的评估结果做加权平均的方式得出总的等级;快速评估方案通过人工评估结果给出分级评估。这里针对“03监控排障”价值创造子过程给出快速评估的示例,如表1-4所示。
表1-4 03监控排障快速评估示例
价值创造子过程 |
价值创造 活动 |
能力 |
问题 |
选项 |
---|---|---|---|---|
03 监控排障 |
意图管理 |
监控策略 |
在异常监控策略设置方面,哪种情况更符合您当前的运维状况? |
基于分级标准设置选项,共L0~L5这6个选项 |
感知 |
异常识别 |
在异常识别方面,哪种情况更符合您当前的运维状况? |
||
分析 |
异常诊断 |
在异常诊断方面,哪种情况更符合您当前的运维状况? |
||
方案生成 |
在修复方案方面,哪种情况更符合您当前的运维状况? |
|||
03 监控排障 |
决策 |
评估决策 |
在修复方案的选择和决策方面,哪种情况更符合您当前的运维状况? |
基于分级标准设置选项,共L0~L5这6个选项 |
执行 |
修复执行 |
在修复执行方面,哪种情况更符合您当前的运维状况? |
||
业务验证 |
在修复后网络恢复正常运转评估方面,哪种情况更符合您当前的运维状况? |
基于以上每个问题的选择结果,计算每个能力的满足等级,比如某运营商网络对应的监控策略选择L3,异常识别选择L4,异常诊断、方案生成选择L3,评估决策选择L2,修复执行和业务验证选择L3,经过加权平均,“03监控排障”价值创造子过程评估为L3等级。其他价值创造子过程也做类似评估,汇总得出整个网络的综合评级。
代际特征和分级标准定义了黑盒功能,IP承载网作为一个复杂的体系,由运营系统、网络管控系统、网元、运营团队等多个独立的系统组成,需要将各个黑盒功能明确地分解到各个系统上,才能让各个系统协同工作,形成真正的IP自动驾驶网络体系。这个课题由自动驾驶网络的目标架构承载,目标架构定义如图1-6所示。
图1-6 目标架构定义
注:图片引用自“Autonomous Networks: Empowering digital transformation-from strategy to implementation”(IG1305)。
自动驾驶网络的核心特点在于利用自治域作为基础,实现数字业务闭环的自动化与智能化,包括业务、服务和资源的运营,其目标是优化用户体验、最大化资源利用率,并实现全生命周期的运营自动化与智能化。自动驾驶网络通过3个分层结构,针对不同的运营团队,实现分层的能力管理,并支持所有场景与业务需求。
● 资源运营层:主要为单个自治域提供网络资源和自动化能力。
● 服务运营层:面向多个自治域,提供IT服务以及网络的规划、设计、上线、发布、保障和优化运营能力等。
● 业务运营层:针对自动驾驶网络业务,支持用户、生态和合作伙伴的使能和运营。
为了实现层间的全生命周期交互,自动驾驶网络通过以下4个闭环实现端到端的自动驾驶网络功能。
● 用户闭环:涉及3个层级之间以及与其他3个闭环的交互,通过意图驱动的极简API(Application Program Interface,应用程序接口)实现,支持用户服务的交付。
● 业务闭环:涵盖业务运营层与服务运营层之间的交互,业务闭环在实现过程中可能会调用相关的服务闭环和资源闭环。
● 服务闭环:连接服务运营层与资源运营层的闭环,其实现可能触发相关的资源闭环。
● 资源闭环:针对自治域的网络及ICT资源运营之间的交互。
自动驾驶网络的业务涵盖多个层级和闭环系统,一方面,各个自治域系统独立完成本域内的功能闭环;另一方面,在面向最终用户提供服务时,需要多个自治域系统协同工作。因此我们在确定各个系统的功能和职责边界时,把单域自治、跨域协同作为IP自动驾驶网络方案设计的总体架构原则,参见图1-7。
图1-7 单域自治、跨域协同的总体架构原则
注:图片引用自“Autonomous Networks: Empowering digital transformation-from strategy to implementation”(IG1305)。
自治域作为基本单元,根据网络功能和运营需求实现特定环节的闭环自动化。这种方法不仅降低了技术复杂性,还有效屏蔽了不同厂商解决方案之间的差异,支持自动驾驶网络的端到端业务需求。
自治域的界定基于各运营商的具体网络运营需求和业务决策。自治域的配置可以依据多种因素,如业务类型、网络技术、部署地点及维护组织结构等。例如,从网络基础设施角度看,自治域实例可以分为接入网、城域骨干网、核心网、边缘网络和用户网络等;从业务角度看,可以分为SD-WAN(Software-Defined Wide Area Network,软件定义广域网络)、VoLTE(Voice over Long-Term Evolution,长期演进语音承载)、CDN(Content Delivery Network,内容分发网络)等。在典型的IP承载网中,通常涵盖一个或多个BGP的AS(Autonomous System,自治系统)域,将自动驾驶网络的自治域与IP路由AS域做合理的匹配,非常有利于网络资源层的功能聚合和闭环管理。
自治域运营的基本原理如下。
● 单域自治:各自治域根据业务目标独立运行于自动闭环模式,通过API抽象化,向用户隐藏域内的技术方案、运营流程和单元功能细节等。
● 跨域协同:通过意图简化接口,多个自治域可以与上层服务运营交互,实现跨域协同,从而有效管理网络/ICT服务的整个生命周期。
更详细的架构方案,还将在第3章展开,这里不赘述。
网络自动化及智能化的演进是一个复杂的系统工程,涉及运营商的多个组织和系统,以及多厂家设备与系统的互联互通与协同。以往的网络运营转型实践,由于部门墙、自下而上推进等原因,往往是点状创新实践,缺乏全局视角,不利于打通E2E(End-to-End,端到端)网络运营生产流程,不利于整体目标达成和商业价值实现,从而影响网络自智的进程。为了帮助运营商从全局视角,设定和分解自动驾驶网络演进目标,快速评估网络自动化、智能化所处阶段,规划能力建设方向和优先级,自智地图应运而生。通过构建自智地图,明确自动驾驶网络规划部署的实施范围和优先级,可以认为自智地图是推进各方面工作的沙盘。
构建自智地图时,可参考TOGAF(The Open Group Architecture Framework,开放组架构框架)的价值流分析流程,如图1-8所示,而价值流分析流程中的对象与IP自动驾驶网络场景下的对象之间的映射关系可参考表1-5。
图1-8 TOGAF的价值流分析流程
表1-5 自动驾驶网络场景下的对象映射
TOGAF相关对象 |
对应自动驾驶网络体系 |
---|---|
利益相关者 |
用户/前端、网络运维人员 |
价值 |
价值主张(用成效指标衡量) |
价值流 |
面向用户/前端、面向网络两类价值流 |
价值阶段 |
面向用户/前端:售前、售中、售后。面向网络:规、建、维、优 |
流程 |
价值创造过程 |
能力 |
价值创造子过程、价值创造活动、能力 |
可以看出,在构建自智地图时,需要先从“利益相关者”出发,基于核心价值流和价值阶段识别出对应的流程和能力基线,并结合运营商自动驾驶网络的自智等级以及业务/网络变化的趋势,给出实施优先级的建议,供实践者按图索骥,指导自动驾驶网络后续的价值流分析、短板识别及运营等相关活动。
为了帮助读者更好地理解和构建所在特定网络的自智地图,下面提供一个典型的IP承载网的自智地图样例,根据面向用户和面向网络两类价值流,分别展开定义每个具体的价值流对应的价值创造子过程,并且根据重要程度为每个子过程设定实施优先级,从而形成面向特定价值创造过程的自智地图,其中面向用户的价值创造过程自智地图参考表1-6,面向网络的价值创造过程自智地图参考表1-7。
表1-6 面向用户的价值创造过程自智地图
价值创造子过程 |
价值流 |
||||
---|---|---|---|---|---|
5G承载业务 |
云互联专线业务 |
入云专线业务 |
互联网专线业务 |
宽带上网业务 |
|
业务开通 |
高 |
高 |
高 |
高 |
高 |
业务保障 |
高 |
高 |
中 |
高 |
中 |
网络投诉 |
高 |
高 |
高 |
高 |
中 |
表1-7 面向网络的价值创造过程自智地图
价值创造子过程 |
价值流 |
||
---|---|---|---|
IP RAN (无线电接入网) |
Metro (综合承载网) |
IP Core (骨干网) |
|
网络规划 |
中 |
中 |
中 |
设计部署 |
中 |
中 |
中 |
监控排障 |
高 |
高 |
高 |
例行巡检 |
中 |
中 |
中 |
网络变更 |
高 |
高 |
高 |
网络优化 |
高 |
高 |
高 |
再完美的设计,若无法落实和实践,终究只是纸上谈兵。自动驾驶网络实施框架提供了通用的方法指导,供各网络运营主体参考,以制订具体的实施计划。
自动驾驶网络运营实践包括两个核心部分:自动驾驶网络战略规划和自动驾驶网络商业迭代。
● 自动驾驶网络战略规划:运营商集团层面进行网络自动化和智能化转型的顶层设计。核心任务包括明确公司级自动驾驶网络战略,与管理层互锁目标和承诺,实例化自动驾驶网络蓝图的4个要素,并确定产业贡献策略和技术创新方向,指导网络商业迭代的实施。
● 自动驾驶网络商业迭代:子网层面承接集团战略的具体实践过程,通过迭代循环加速战略落地和目标达成。
为了加快自动驾驶网络的规模化部署,业界总结了“商业迭代4步法”,即基于价值场景开展“基线评估—短板分析—方案设计—开发部署”的迭代循环。通过商业迭代,运营商可以推动自智等级和成效提升,实现端到端业务闭环和商业闭环。
(1)基线评估
基线评估是指明确运营商现网各专业/业务的自智等级和成效指标基线值,并设定提升目标,具体包括如下步骤。
第一步,面向选定的价值场景,按照既定的分级标准和成效指标,开展现网评估。
第二步,获得自智等级和成效指标基线值。
第三步,结合业务发展要求和投资计划,设定提升目标。
(2)短板分析
短板分析是指识别业务流程中的断点和自智能力短板,输出关键变革项,具体包括如下步骤。
第一步,分析基线和目标之间的差距,通过流程穿越,识别出现断点和短板的原因。
第二步,将自智等级和成效提升目标分解到流程的各个环节,输出关键变革项清单。
(3)方案设计
方案设计是指基于目标架构,对关键变革项进行分解,细化对BSS(Business Support System,业务支撑系统)层/OSS层/网络层(设备网络管理+网元)的功能要求,具体包括如下步骤。
第一步,将能力需求转化为功能开发需求。
第二步,通过应用架构设计和系统功能分配,输出流程变革需求、OSS/OMC(Operation and Maintenance Center,操作维护中心)/网元功能建设需求、系统开发清单和试点方案等。
(4)开发部署
开发部署是指在子网进行试点部署,验证效果并总结经验,然后在更多子网中推广,具体包括如下步骤。
第一步,以系统开发清单和试点方案作为输入内容,开展子网试点部署和转产。
第二步,通过跨子网复制推广,确保自智等级和成效提升目标,达成商业价值目标。
第三步,在产业内分享经验,进行标准化贡献。
通过详细的运营实践方法,自动驾驶网络的设计和规划能够有效转化为实际的网络部署和运营。这不仅确保了战略和目标的落地,还通过持续的商业迭代,实现了网络的自动化和智能化,从而推动整个行业的发展。
过去几十年来,标准化一直是业界实现不同系统之间互联互通的有效手段,3GPP(3rd Generation Partnership Project,第三代合作伙伴计划)、IETF(Internet Engineering Task Force,因特网工程任务组)、IRTF(Internet Research Task Force,因特网研究任务部)、TM Forum、ETSI、CCSA等标准组织开发的标准构筑了网络互联互通的标准基石,促成了网络如今的繁荣生态。伴随着自动驾驶网络在不同等级之间演进的过程,网络互联互通的标准也面临着新的局面,需要各标准组织协同定义自动驾驶网络相关标准体系。
当前,定义自动驾驶网络标准的组织涉及的领域较为广泛,纵观各个标准组织的相关标准,可以按照如下几个维度来划分。
● 国际标准/国内标准:主要从标准组织定位来划分。自动驾驶网络涉及的国际标准组织主要包括TM Forum、ETSI、IETF、IRTF等,国内标准组织主要是CCSA。
● 通用标准/领域标准:主要从自动驾驶网络标准覆盖领域与范围的角度划分。通用标准主要定义自动驾驶网络相关概念、通用架构、通用分级方法论、接口框架、关键技术等,是业界通用的自动驾驶网络相关标准,为领域标准提供方法论与标准框架参考;领域标准主要聚焦于标准组织所专长的专业技术领域,比如,3GPP主要定义移动通信网络领域相关的自动驾驶网络标准,IETF主要定义IP承载网领域相关的自动驾驶网络标准等。
2019年,TM Forum联合英国电信、中国移动、法国Orange、澳大利亚Telstra、华为和爱立信6个伙伴发布业界首个自智网络产业白皮书。随后,包括TM Forum、ETSI、IETF、IRTF与CCSA在内的各大标准组织,相继立项自智网络相关的课题和标准。各组织聚焦各自所负责的领域,开展标准工作,并借助Multi-SDO(Multi-Standards Development Organization,多方标准组织)推动AN技术合作会议的开展,使得自智网络标准体系逐步得到完善,初步形成了通用领域标准与专业领域标准协同的标准体系。这一体系从5个维度对标准进行了定义,包括分级、评估、架构、接口和关键技术等。图1-9展示了推动自智网络标准定义的各组织之间的协作关系。
图1-9 IP领域自智网络标准组织协作关系
可以看出,在自智网络的国际标准领域,TM Forum ANP(Autonomous Networks Project,自智网络项目)定义的标准系列已经成为整个体系的总纲。IETF专注于OPS Area(Operations and Management Area,运营与管理领域)的标准系列,其工作组定义了从网元到网络管控系统的一系列自智网络标准。IRTF的NMRG(Network Management Research Group,网络管理研究组),专注于自智网络的意图驱动技术、意图接口等方向的标准技术研究。ETSI的ENI ISG(Experiential Networked Intelligence Industry Specification Group,体验式网络智能行业规范工作组)围绕IP网络的分级评估、大模型数据处理以及功能编排技术开展标准技术研究;CCSA的各个技术工作委员会则围绕IP网络分级评估、网络数字孪生、大模型推理、训练和测评等方面开展标准技术研究,并制定相关标准。
这些组织的努力,不仅推动了自智网络技术的发展,也为未来网络的智能化和数字化转型奠定了坚实的基础。
作为一个全球性的行业协会,TM Forum致力于推动通信和数字服务提供商的业务转型和创新。该组织提供了一系列框架、工具和API,帮助成员公司优化业务流程、改善服务交付,并提升用户体验。
在国际标准体系中,TM Forum是较早发起自智网络标准定义的。自2019年7月启动自智网络项目以来,TM Forum已经发布了一系列指南和标准,为实现自智网络愿景提供了清晰的步骤和指导。如图1-10所示,TM Forum ANP标准框架分为三大主题:愿景、BA(Business Architecture,商业架构)和TA(Technical Architecture,技术架构)。这一框架从通用的角度定义自智网络的整体方法论和参考架构等,为各领域标准组织提供通用参考。同时,通过多方标准组织协同运作,使各个标准组织在自智网络标准核心理念上保持协同。
图1-10 TM Forum ANP标准框架
在TM Forum ANP标准框架中,比较关键的标准文稿如下[2-13]。
● 参考架构:IG1251(自智网络参考架构)和IG1230(自智网络技术架构)。
● 分级评估:IG1252(自智网络分级评估方法论)。
● 接口框架:IG1253C(意图生命周期管理和接口定义)。
● 关键技术:IG1253A(意图通用模型)、IG1253B(意图扩展模型)、IG1253D(意图管理能力简介)与IG1253E(意图在自动驾驶网络中的应用)。
TM Forum强调,自智网络的关键技术集中在意图接口、意图建模和能力描述上。意图接口的OpenAPI(Open Application Program Interface,开放应用程序接口)规范在TM Forum 921A中进行了详细定义,为那些需要深入了解TM Forum意图接口的读者提供了参考。
在IG1253[7]中,意图被定义为“对期望的形式化规范定义”,它包括对技术系统的要求、目标和约束等,这一定义凸显了意图在自智网络中的核心作用。
ETSI的ENI ISG主要致力于网络智能化运维相关标准的研究和制定,特别是在IP网络的分级评估,以及大模型数据格式和功能需求的定义方面展开工作。
参考TM Forum的通用自智网络分级标准,ENI ISG在2023年启动了IP领域的分级标准制定相关工作。到2023年底,ENI ISG已经在国际上顺利发布了针对IP广域网络的自动驾驶分级标准——ENI 035。同时,ENI 035标准也被国际知名的多厂商互通评测机构EANTC(European Advanced Networking Test Center,欧洲高级网路测试中心)采纳,作为参考标准,完成了对IP网络云网专线场景自动驾驶分级评估的测评,测评用例参考表1-8。在这次测评中,涵盖规、建、维、优、营5个阶段的建设、维护和优化3个环节,完成了对14个测试用例的测试,并发布首个厂商自动驾驶网络分级评估测评报告,报告显示,该厂商的自智网络等级已经达到L3.8。
2024年,ENI ISG开始启动数据中心分级标准研究和制定,目前该标准仍在立项阶段。
表1-8 IP网络云网专线场景自动驾驶分级评估的测评用例
场景 |
用例编号 |
描述 |
---|---|---|
业务发放 |
用例1 |
意图管理:业务开通意图翻译能力测试 |
用例2 |
感知:资源勘测能力测试 |
|
用例3 |
分析和决策:方案决策能力测试 |
|
用例4 |
执行:方案实施和验证能力测试 |
|
网络监控 和排障 |
用例5 |
意图管理:故障分析意图翻译能力测试 |
用例6 |
感知:业务故障感知能力测试 |
|
用例7 |
分析:业务定界定位能力测试 |
|
用例8 |
决策:故障评估决策能力测试 |
|
用例9 |
执行:故障方案实施和业务验证能力测试 |
|
网络优化 |
用例10 |
意图管理:网络路径优化意图翻译能力测试 |
用例11 |
感知:隧道质量检测感知能力测试 |
|
用例12 |
分析:优化方案识别能力测试 |
|
用例13 |
决策:调优方案决策能力测试 |
|
用例14 |
执行:方案实施和效果验证能力测试 |
随着更多生成式AI技术应用的发展和落地,2023年9月,ETSI的ENI产业联盟完成3项大模型相关的国际标准立项,如表1-9所示,这些标准涉及大模型数据格式和数据处理、编排功能,以及知识管理功能等。
表1-9 ETSI ENI大模型相关标准
标准分类 |
标准项目名称 |
项目等级/状态 |
---|---|---|
数据格式与 处理 |
LLM(Large Language Model,大语言模型)网络领域应用的数据源、数据类型和格式、数据处理方法以及相关网络系统的接口[14] |
国际标准/立项 |
功能需求 |
网络OAM(Operation, Administration, and Maintenance,操作、管理和维护)大型模型的编排功能需求[15] |
国际标准/立项 |
网络知识管理的功能模块、网络大模型知识网络运营流程[16] |
国际标准/立项 |
作为IP领域的核心国际标准组织,IETF专注于工程和标准制定的短期问题,而平行组织IRTF则专注于与互联网相关的长期研究问题。在自智网络的标准化进程中,IETF的工作重点涵盖网络自动化、网络可观测性和网络智能化等方面,IRTF聚焦于意图驱动网络和网络数字孪生的相关研究。相关技术工作主要在IRTF的NMRG以及IETF的OPS中展开。
IRTF NMRG主要聚焦自智网络相关标准技术的研究,包括意图驱动接口、性能管理意图模型、数字孪生网络架构研究、AI在网络管理中的研究等。例如,2017年,IRTF NMRG启动意图驱动网络定义标准化,采纳了意图驱动网络的理念,意图驱动也成为NMRG标准化的一个重要方向。2020年,IRTF NMRG启动网络数字孪生理念和架构标准项目,该标准主要探讨数字孪生在网络技术中的挑战和价值,并提出网络数字孪生的五大核心要素,分别是数据、模型、映射、接口和逻辑,同时给出了3层3域双闭环的参考架构,3层指的是物理网络层、孪生网络层和网络应用层,3域指的是数据域、模型域和管理域,双闭环指的是内闭环和外闭环。
IETF OPS是IETF中负责运营与管理领域标准制定的组织,其下的多个子工作组定义了自智网络相关标准。
● OPSAWG(Operations and Management Area Working Group,运维管理域工作组)是该领域的联合工作组,定义了自智网络模型驱动管理架构与相关YANG(Yet Another Next Generation,下一代数据建模语言)模型接口的标准,并发布了一系列连接业务网络模型标准,包括VPN(Virtual Private Network,虚拟专用网络)业务发放、VPN性能监控、业务接入点可视化和意图驱动业务保证模型等。同时,在2021年发布了基于模型驱动的业务和网络管理自动化框架[17],定义了自顶向下的业务发放流程及自底向上的业务保证。
● NETMOD(Network Model,网络模型)工作组主要定义与网络管理相关的接口元模型以及通用管理接口模型。
● NETCONF(Network Configuration Protocol,网络配置协议)工作组主要定义网络配置管理协议相关标准。
● IVY(Network Inventory YANG,网络存量YANG模型)工作组主要定义网络存量可视化相关标准,包括软件器件可视化、硬件器件可视化、网元位置可视化和拓扑关联映射等。
● NMOP(Network Management Operations,网络管理运维)工作组主要定义网络运维部署相关标准,包括Incident智能运维、Incident术语、网络异常检测、YANG Push与数据总线集成等。
● GREEN工作组主要定义绿色节能可视化标准,包括术语、指标定义和YANG模型标准等。
● ANIMA(Autonomic Networking Integrated Model and Approach,自主网络集成模型与方法)工作组主要聚焦于定义管理和控制自组织网络的操作协议和流程。
到目前为止,IETF自智网络关键技术主要涉及自动化、可视化、智能化3个方向。
在自动化方向,主要关注配置管理自动化相关的协议和接口标准。
● 自动化相关的协议包括NETCONF网络管理基础协议[18](RFC 6241)和RESTCONF网络管理协议[19](RFC 8040)、NMDA(Network Management Datastore Architecture,网络管理数据存储架构)[20](RFC 8342)、NMDA网络管理增强协议定义[21-22](RFC 8526、RFC 8527)、设备自动上线技术[23](RFC 8572)、YANG 1.1建模语言[24](RFC 7950)、YANG Library[25](RFC 8525)、NACM(NETCONF Access Control Model,NETCONF访问控制模型)网络配置接入控制[26](RFC 8341)和设备模型能力通告[27](RFC 9196)。
● 自动化接口是一种用于自动化网络管理的接口,它可以帮助网络管理员自动化配置、监控和管理网络设备,从而提高网络的可靠性和效率。RFC 8299中定义了L3VPN(Layer 3 Virtual Private Network,三层虚拟专用网)业务发放YANG模型[28],RFC 8466定义了L2VPN(Layer 2 Virtual Private Network,二层虚拟专用网)业务发放YANG模型[29],RFC 9182和RFC 9291分别定义了L3VPN的网络接口模型[30]和L2VPN的网络接口模型[31]。RFC 9375定义了VPN性能监控YANG模型标准[32],RFC 9408定义了业务附着点网络接口模型[33]。网络切片业务模型和网络切片资源模型已完成立项,目前正逐步走向发布状态。
在可视化方向,主要关注Telemetry(遥测技术)和随流检测相关的自动化标准的制定,相关工作主要由NETCONF工作组和NETMOD工作组展开。
● YANG Push订阅发布机制[34-37](RFC 8639、RFC 8640、RFC 8641、RFC 8650)。该机制通过周期性地主动向采集器上传设备信息,提供更实时、更高速、更精确的网络可视化功能。通过对采集到的数据的收集、存储和分析,可以为网络配置调整提供依据。
● 变频订阅发布。变频订阅发布是一种对被测信息内容、外界环境条件或任务变化有自适应能力的遥测技术。自适应遥测系统经常将自身的性能与外界变化的要求相比较,并自动地对需要调整的参数进行选择、控制或调节,使系统尽可能在最有效的状态下工作。
● 运维数据标记Node Tag。运维数据标记是一种对运维数据进行分类标记的技术,可以实现数据多维可视化。
● UDP(User Datagram Protocol,用户数据报协议)上送和分布式订阅方案主要解决分布式订阅数据上传面临的多单板、线卡集中数据上传性能瓶颈问题,通过将主控板订阅分解为多线卡的订阅,实现对publisher(发布者)的配置订阅和UDP通道上送。
● IPPM(IP Performance Measurement,IP性能测量)工作组制定了完备的随流检测测量技术,包括数据面交替染色技术[38-40](RFC 9341、RFC 9342、RFC 9343)、IOAM技术[41] (RFC 9197)。
● 网络可视化接口。网络可视化接口是一种用于实现网络数据可观测的接口技术,能够帮助运维人员快速理解和掌握网络拓扑情况、网络流量情况及网络业务情况等,并且可以对复杂的网络结构和流量数据做出有效的分析和决策。从2015年开始,IETF陆续发布了网络拓扑系列模型[42-45](RFC 8345、RFC 8346、RFC 8944、RFC 8795)。
在智能化方向,IETF正处于积极探索阶段,例如,已经成立NMOP工作组,主要探索AI技术在网络运维管理中的应用,旨在提升网络运维效率。还有一些已经发布的智能化标准,例如,IETF OPSAWG发布的基于意图的业务保证模型标准,主要解决意图闭环问题。IETF NETMOD工作组已经启动了智能时间调度,可以用于设备统计数据快照周期调度上报、OAM任务调度,时变网络拓扑和资源管理调度等。同时,NETMOD工作组还在制定ECA(Event-Condition-Action,事件-条件-动作)策略管理模型,通过定义事件、条件和动作等来实现设备自组织管理。
CCSA TC3为网络与业务能力标准技术工作委员会,致力于讨论信息通信网络(包括核心网、IP网)的总体需求、体系架构、功能、性能、业务能力、设备、协议,以及相关的SDN/NFV等网络技术。由于数字孪生网络是以数字化方式创建物理网络实体的虚拟孪生体,且可与物理网络实体之间尽可能实时交互映射的网络系统,因此可以支撑网络规划、建设、维护、优化等全生命周期的高度自动化和智能化。为了推进数字孪生网络高效发展,加速产业和标准化进程,CCSA TC3成立了“数字孪生网络”子工作组。子工作组成立至今,已经完成数个行业标准、团体标准以及研究课题。其中的关键标准文稿及进展如下。
● 行业标准《数字孪生网络 架构及技术要求》:已完成。
● 行业标准《数字孪生网络 孪生网络层数据域通用技术要求》:通过标准草案送审稿。
● 团体标准《数字孪生网络 网络数字地图应用技术要求》:通过标准草案报批稿。
● 团体标准《基于数字孪生网络的企业资产管理总体技术要求》:通过标准草案征求意见稿。
CCSA TC7为网络管理与运营支撑标准技术工作委员会,主要致力于网络管理与维护、电信运营支撑系统相关领域的研究及标准制定。为了支撑网络管理与维护、电信运营支撑系统向高阶无人化智能发展,采用的关键技术有网络数字孪生和大模型。近年来,CCSA TC7发布了多项网络运营管理智能化方面的行业标准,填补了我国自智网络标准的空白,为网络运营管理智能化的发展做出了不可替代的重要贡献。其中的关键标准文稿如下。
● 行业标准《自智网络 体系架构》。
● 行业标准《信息通信网运营管理智能化水平分级评估技术要求 IP网络》。
● 行业标准《信息通信网运营管理智能化水平分级技术要求 切片分组网络(SPN)》。
● 行业标准《信息通信网智能化运营管理需求与用例 IP网络维护》。
● 行业标准《信息通信网智能化运营管理需求与用例 切片分组网(SPN)维护》。
● 行业标准《信息通信网运营管理智能化水平分级评估技术要求 通用部分》。
● 行业标准《信息通信网运营管理智能化水平分级技术要求 通用部分》。
● 行业标准《数据中心运营管理系统技术要求和智能化分级评估方法》。
目前,CCSA TC7已经启动了大模型标准体系建设项目。2024年3月,CCSA TC7会议通过了6项大模型相关的立项,包括1项行业标准和5个研究课题。6个立项涵盖总体技术、应用大模型、服务与接口、大模型评估、大模型训练与数据管理。根据CCSA TC7的讨论,未来CCSA TC7将建立一个更加全面的大模型标准体系,即在上述标准中新增场景流程和测试与评估,如表1-10所示。
表1-10 CCSA TC7大模型标准
标准分类 |
标准项目名称 |
项目状态 |
牵头单位 |
---|---|---|---|
总体技术 |
网络运营管理大模型总体技术要求 |
行业标准立项 |
北京邮电大学、中国电信、中国联通、中国移动 |
应用大模型 |
大模型与知识图谱在网络运营管理过程中的融合应用要求 |
研究课题立项 |
中国移动 |
服务与接口 |
大模型辅助的意图管理技术研究 |
研究课题立项 |
中国移动 |
大模型评估 |
网络运营管理大模型推理与服务能力评估方法研究 |
研究课题立项 |
中国信息通信研究院、中国电信、中国联通、中兴通讯 |
大模型训练 |
面向信息通信网运营管理的大模型训练及应用技术研究 |
研究课题立项 |
中国移动、中兴通讯 |
数据管理 |
网络运营管理大模型数据管理要求 |
研究课题立项 |
中国电信、华为、中国信息通信研究院 |
CCSA TC1为互联网与应用标准技术工作委员会,主要致力于互联网基础设施和应用共性技术、数据中心、云计算、大数据、AI和各种应用相关的讨论。TC1讨论的《数据中心网络数字地图技术要求》目前已经通过征求意见稿,其主要用于制定数据中心网络数字地图总体技术要求和标准,以推进数据中心网络数字化进程,实现数据中心跨多云、跨多网络、跨多厂商的智能协同运维运营,解决数据中心多网络架构、多厂商异构,及各管理系统信息孤岛的问题。
2023年2月,CCSA TC1实现4项通用大模型标准送审,牵头单位是中国信息通信研究院、华为和百度等。4个项目涉及通用大模型的技术和应用评估,包括模型开发、模型能力、模型应用、可信要求等,具体可参考表1-11。
表1-11 CCSA TC1通用大模型标准
标准分类 |
标准项目名称 |
项目状态 |
牵头单位 |
---|---|---|---|
通用大模型及评估 |
大规模预训练模型技术和应用评估方法第1部分:模型开发 |
送审阶段 |
中国信息通信研究院、华为、百度 |
大规模预训练模型技术和应用评估方法第2部分:模型能力 |
送审阶段 |
中国信息通信研究院、华为、百度 |
|
大规模预训练模型技术和应用评估方法第3部分:模型应用 |
送审阶段 |
中国信息通信研究院、华为、百度 |
|
大规模预训练模型技术和应用评估方法第4部分:可信要求 |
送审阶段 |
中国信息通信研究院、华为、百度 |
CCSA TC610为SDN/NFV/AI标准与产业推进工作委员会,主要致力于推动SDN/NFV行业应用和需求研究,以及SDN网络架构和解决方案研究。CCSA TC610推动SDN/NFV互联互通测试认证,输出SDN/NFV网络和系统互联互通技术规范,搭建统一的SDN/NFV集成互通测试平台,并推动建立SDN/NFV产业生态,引导SDN产业链各方联合开展基于SDN/NFV的应用和业务创新。
鉴于云网专线自动化需求尤为迫切,CCSA TC610发布的团体系列标准在自智网络的架构下,进一步定义了基于IP网络基础设施提供云网专线服务及IP网络基础能力要求,具体参考表1-12。
表1-12 CCSA TC610 IP网络云网专线标准
标准分类 |
标准项目名称 |
项目状态 |
牵头单位 |
---|---|---|---|
产品 服务类 |
自智网络服务体验分级评估技术要求——云网专线 |
2023年11月已发布 |
中国信息通信研究院、中国联通、华为等 |
自智网络服务体验分级评估测试方法——云网专线 |
2023年11月已发布 |
中国信息通信研究院、中国联通、华为等 |
|
IP网络 基础能力 |
自智网络基础能力分级标准及分级评估技术要求——云网专线 |
2023年11月已发布2.0 |
中国信息通信研究院、华为等 |
自智网络基础能力分级评估测试方法——云网专线 |
2023年11月已发布2.0 |
中国信息通信研究院、华为等 |
为了推动自智网络形成产业共识,跨组织合作是尤为重要的。跨组织合作的主要目标是围绕自智网络的概念、愿景、框架和关键技术等进行跨组织协同,并就未来的职责和协作进行讨论,从而能更好地推进自智网络产业发展。自2020年9月28日起,TM Forum召集并定期举行多方标准组织间的自智网络协调会议,参与组织包括但不限于GSMA、NGMN(Next Generation Mobile Networks Alliance,下一代移动网络联盟)、ETSI、3GPP、CCSA、IETF、ITU-T(International Telecommunication Union-Telecommunication Standardization Sector,国际电信联盟-电信标准化部门)等。通过这些会议,行业技术专家能够及时交流信息,形成对自智网络跨组织合作的如下共识。
(1)术语:自智网络的一些标准术语,例如意图、闭环、自智等级、自治/管理域等。
(2)自智网络标准化的全景图。
(3)自智网络运维用例。
1.3节重点介绍了IP自动驾驶网络相关标准的内容,鉴于标准的快速发展和更新,为了获取最新的内容,建议读者访问各个标准组织的官方网站进行查询。
[1]TM Forum. Autonomous networks business requirements and framework v2.0.0 [EB/OL]. (2021-11-22) [2022-09-15].
[2]TM Forum. Autonomous networks: empowering digital transformation-from strategy to implementation [EB/OL]. (2022-09-08) [2024-04-30].
[3]TM Forum. Autonomous networks: empowering digital transformation-evolving from Level 2/3 towards Level 4 [EB/OL]. (2023-09-14) [2024-04-30].
[4]TM Forum. Autonomous networks reference architecture v1.0.0 [EB/OL]. (2022-09-02) [2024-04-30].
[5]TM Forum. Autonomous networks technical architecture v1.0.0 [EB/OL]. (2023-02-13) [2024-04-30].
[6]TM Forum. Autonomous network levels evaluation methodology v1.2.0 [EB/OL]. (2023-08-04) [2024-04-30].
[7]TM Forum. Intent in autonomous networks v1.0.0 [EB/OL]. (2022-09-23) [2024-04-30].
[8]TM Forum. Intent modeling v1.0.0 [EB/OL]. (2021-07-26) [2024-04-30].
[9]TM Forum. Intent extension model v1.0.0 [EB/OL]. (2021-01-21) [2024-04-30].
[10]TM Forum. Intent life cycle management and interface v1.1.0 [EB/OL]. (2021-07-26) [2024-04-30].
[11]TM Forum. Intent manager capability profiles v1.0.0 [EB/OL]. (2022-01-21) [2024-04-30].
[12]TM Forum. Using intent in AN - use cases, scenarios and examples v1.0.0 [EB/OL]. (2023-08-22) [2024-04-30].
[13]Experiential Networked Intelligence(ENI); Definition of IP networks autonomicity level [EB/OL]. (2023-12-01) [2024-04-30]. ETSI-GR ENI 035 v 4.1.1.
[14]Dataset for large language model applied in the network field [EB/OL]. (2023-09) [2024-04-30]. ETSI ENI ISG ENI 039.
[15]Orchestration functional requirements specification for network OAM large models [EB/OL]. (2023-10) [2024-04-30]. ETSI ENI ISG ENI 040.
[16]Network knowledge management enhanced large models for network OAM [EB/OL].(2023-10) [2024-04-30]. ETSI ENI ISG ENI 041.
[17]WU Q, BOUCADAIR M, LOPEZ D, et al. A Framework for automating service and network management with YANG [R/OL]. (2021-01-01) [2024-04-30]. RFC 8969.
[18]ENNS R, BJÖRKLUND M, SCHOENWAELDER J, et al. Network configuration protocol (NETCONF) [R/OL]. (2011-06) [2024-04-30]. RFC 6241.
[19]BIERMAN A, BJÖRKLUND M, WATSEN K, et al. RESTCONF protocol [R/OL]. (2017-01) [2024-04-30]. RFC 8040.
[20]BJÖRKLUND M, SCHÖENWÄELDER J, SHAFER P A, et al. Network management datastore architecture (NMDA) [R/OL]. (2018-03) [2024-04-30]. RFC 8342.
[21]BJÖRKLUND M, SCHÖENWÄEDER J, SHAFER P A, et al. NETCONF extensions to support the network management datastore architecture [R/OL]. (2019-03) [2024-04-30]. RFC 8526.
[22]BJÖRKLUND M, SCHEÖENWÄELDER J, SHAFER P A, et al. RESTCONF extensions to support the network management datastore architecture [R/OL]. (2019-03) [2024-04-30]. RFC 8527.
[23]WATSEN K, ABRAHAMSSON M, FARRER I, et al. Secure zero touch provisioning (SZTP) [R/OL]. (2019-04) [2024-04-30] . RFC 8572.
[24]BJÖRKLUND M. The YANG 1.1 data modeling language [R/OL]. (2016-08) [2024-04-30] . RFC 7950.
[25]BIERMAN A, BJÖRKLUND M, SCHÖENWÄELDER J, et al. YANG library [R/OL]. (2019-03) [2024-04-30] . RFC 8525.
[26]BIERMAN A, BJÖRKLUND M. Network configuration access control model [R/OL]. (2018-03) [2024-04-30] . RFC 8341.
[27]LENGYEL B, CLEMM A, CLAISE B. YANG modules describing capabilities for systems and datastore update notifications [R/OL]. (2022-02) [2024-04-30]. RFC 9196.
[28]WU Q, LITKOWSKI S, TOMOTAKI L, et al. YANG data model for L3VPN service delivery [R/OL]. (2018-01) [2024-04-30]. RFC 8299.
[29]WEN B, FIOCCOLA G, XIE C, et al. A YANG data model for layer 2 virtual private network (L2VPN) service delivery [R/OL]. (2018-10) [2024-04-30]. RFC 8466.
[30]BARGUIL S, GONZALES DE DIOS O, BOUCADAIR M, et al. A YANG network data model for layer 3 VPNs [R/OL]. (2022-02) [2024-04-30]. RFC 9182.
[31]BOUCADAIR M, GONZALES DE DIOS O, BARGUIL S, et al. A YANG network data model for Layer 2 VPNs [R/OL]. (2022-09) [2024-04-30]. RFC 9291.
[32]WU B, WU Q, BOUCADAIR M, et al. A YANG data model for network and VPN service performance monitoring [R/OL]. (2023-04) [2024-04-30]. RFC 9375.
[33]BOUCADAIR M, GONZALEZ DE DIOS O, BARGUIL S, et al. A YANG network data model for service attachment points (SAPs) [R/OL]. (2023-06) [2024-04-30]. RFC 9408.
[34]VOIT E, CLEMM A, PRIETO A G, et al. Subscription to YANG notifications [R/OL]. (2019-09) [2024-04-30]. RFC 8639.
[35]VOIT E, CLEMM A, PRIETO A G, et al. Dynamic subscription to YANG events and datastores over NETCONF [R/OL]. (2019-09) [2024-04-30]. RFC 8640.
[36]CLEMM A, VOIT E. IETF RFC 8641 subscription to YANG notifications for datastore updates [R/OL]. (2019-09) [2024-04-30]. RFC 8641.
[37]VOIT E, RAHMAN R, NILSEN-NYGAARD E, et al. Dynamic subscription to YANG events and datastores over RESTCONF [R/OL]. (2019-11) [2024-04-30]. RFC 8650.
[38]FIOCCOLA G, COCIGLIO M, MIRSKY G, et al. Alternate-marking method [R/OL]. (2022-12) [2024-04-30]. RFC 9341.
[39]FIOCCOLA G,COCIGLIO M, SAPIO A, et al. Clustered alternate-marking method [R/OL]. (2022-12) [2024-04-30]. RFC 9342.
[40]FIOCCOLA G, ZHOU T, COCIGLIO M, et al. IPv6 application of the alternate-marking method [R/OL]. (2022-12) [2024-04-30]. RFC 9343.
[41]BROCKNERS F, BHANDARI S, MIZRAHI T. Data fields for in situ operations, administration, and maintenance (IOAM) [R/OL]. (2022-05) [2024-04-30]. RFC 9197.
[42]CLEMM A, MEDVED J, VARGA R, et al. A YANG data model for network topologies [R/OL]. (2018-03) [2024-04-30]. RFC 8345.
[43]CLEMM A, MEDVED J, VARGA R, et al. A YANG data model for layer 3 topologies [R/OL]. (2018-03) [2024-04-30]. RFC 8346.
[44]DONG J, WEI X, WU Q, et al. A YANG data model for layer 2 network topologies [R/OL]. (2020-11) [2024-04-30]. RFC 8944.
[45]LIU X F, BRYSKIN I, BEERAM V P, et al. IETF RFC 8795 YANG data model for traffic engineering (TE) topologies [R/OL]. (2020-08) [2024-04-30]. RFC 8795.