您现在的位置是:主页 > 5G通信 >


基于AI和O-RAN架构的5G网络容量自适应算法

2020-02-12 21:415G通信 人已围观

简介移动通信网络建设初期,通信学者对基站的无线传播性能和用户的移动业务需求建立了一系列模型,用于指导网络规划建设。但经过 20 年的发展,移动通信网络的规模和结构发生了翻天...

  移动通信网络建设初期,通信学者对基站的无线传播性能和用户的移动业务需求建立了一系列模型,用于指导网络规划建设。但经过 20 年的发展,移动通信网络的规模和结构发生了翻天覆地的变化,用户的业务需求也从简单的语音通话拓展至各类移动数据业务。尤其是 5G 到来后,用户从“人”拓展至“物”,业务需求将囊括生产和生活的各个领域,这些深刻的变革对网络的规划建设和优化维护工作提出了新的挑战。更加智能的O-RAN 架构,可嵌入基于 AI 的大数据分析算法,实现自适应的无线资源优化方案,为应对上述挑战提供了新的方法论。通过 AI 技术深度分析挖掘网络长期沉淀的大量业务数据,移动运营商可以更深入地理解网络和用户。本文通过对基站流量空时特性的研究,提供了一套适用于 5G O-RAN 架构的网络容量自适应算法,有效提升建设和运维资源投放效率。
  

  1 关于容量自适应存在的问题

  
  1.1容量自适应的必要性
  
  随着移动互联网的普及,移动运营商普遍面临流量大规模爆发和增量不增收的困境。在 5G 时代来临之际, 如何深度解构用户行为和使用习惯,准确高效预测网络容量的空时分布,平衡业务需求和投资效益,是移动运营商面临的难题。借助 5G 网络的 O-RAN 架构,利用AI 技术对基站流量的大量历史数据分析,预测网络整体容量的空时分布,可以达到提高资源配置精准性和提升网络资源利用率的目标。
  
  1.2容量自适应所面临的问题
  
  5G 的 O-RAN 架构天然具有自优化和自组织的智能化特点。基于 AI 的流量预测方法通过分析历史数据,可实现对未来一段时间基站容量的预测,从而实现自适应的网络架构。并且,随着采用的历史数据的不断增加, 预测精度不断提高,基于 AI 的预测方法减少了人为因素的参与,预测结果更具客观性。但是,目前基于 AI的基站流量预测方法需要为每个基站训练单独的预测模型,需要大量的计算时间,随着时间的推移和业务的发展,基站所提供的流量始终处于变化状态,为保证预测模型的准确性,流量预测模型需要周期性地更新。因此, 为每个基站单独训练预测模型的方法将耗费大量的计算资源和时间。所以,设计一种计算量小的预测模型训练方法就成为需要解决的问题。
  

  2 基于空时特性的容量自适应算法

  
  本节对基站数据的空间和时间特性进行了研究分析,形成的算法可嵌入 5G 的 O-RAN 架构中,用于指导 5G 资源精准投放。基于基站流量数据的空间相关性,结合 CNN(Convolutional Neural Network, 卷积神经网络)在数据空间特征提取方面的优势,我们通过对地理区域内基站数据的网格化处理,使得 CNN 可以为一定地理范围内多个基站训练统一的预测模型, 大大降低预测模型的训练时长。此外,基于基站流量数据的时间相关性,我们将连续时间数据和周期性数据作为模型训练时的输入数据,分别对应两个CNN,不仅对连续时间序列进行特征提取,同时考虑数据的周期性变化。因此,本文所设计的基站流量预测模型训练方法,包含两个 CNN,实现对基站流量数据的空间和时间的特征提取。
  
  2.1基站数据空间和时间相关性
  
  为了设计合理的模型训练方法,我们对 4G 基站流量数据的空间和时间特性进行了研究,该研究方法和结论同样适用于 5G 基站。
  
  2.1.1基站流量数据空间特性
  
  我们首先对地理上连续覆盖的 5 个基站,进行相关性验证。如表 1 所示,我们分别计算了 5 个相邻基站间上行和下行流量的互相关性系数。其中,互相关系数最大值超过 0.7,最小值超过 0.3。由相关性划分方法可知,基站间的流量数据存在较大的相关性。
表1 基站流量数据的空间相关性
  表1 基站流量数据的空间相关性
 
  2.1.2基站流量数据时间特性
  
  为验证基站流量数据的时间特性,我们首先收集单个小区的全部数据(数据总量为 13 周),然后以星期为周期计算上、下行流量的均值 ± 方差的分布。如图 1 所示,虽然部分数据偏离分布区间,但均值曲线(红色曲线)存在明显的周期特性,由于这类特性反映了用户行为特征,对于 5G 网络必然适用。
  图1 基站流量数据的时间相关性
  图1 基站流量数据的时间相关性
  
  因此可以设想,考虑基站流量数据的空间相关性, 将使构建包含多小区的统一流量预测模型的想法成为可能。同时,对基站流量数据时间特性的提取,将提高预测模型的预测性能。
  
  2.2空间数据网格化
  
  CNN 具有空间特征提取能力,因此本文选取 CNN 实现对基站流量空间特征的提取。但是,CNN 需要严格的结构化数据,其输入数据一般为多维矩阵。因此,为适应 CNN 对输入数据结构的要求,我们需要对一定地理区域内的基站数据进行网格化。由于基站的地理位置不符合网格分布特征,因此我们需要先将基站所在的地理区域进行网格化,然后将基站的流量映射到对应的网格中。包含基站流量数据的网格将作为 CNN 的输入,因此由 CNN 训练得到的流量预测模型将对各网格的流量进行预测。之后,基站的流量预测结果将由基站与网格映射关系的反映射得到。地理区域网格化过程如图 2 所示。
  图2 地理区域网格化过程
  图2 地理区域网格化过程
  
  在图 2 中,左边子图表示所取区域(红色框)及其内部的基站分布(蓝点),中间子图表示地理区域的网格化过程,首先将该区域划分成 M ×N 的网格图,再利用 Haversine 距离计算公式的计算结果和小区天线的覆盖范围确定每个网格的所属基站。因此,每个基站的覆盖范围由多个网格来共同组成。右边子图表示每个基站的上、下行流量映射到属于该基站的网格中,得到上行流量网格图和下行流量网格图。每小时计算一次上下行流量网格图,每小时的归一化的网格流量可以表示为公式   t 表示时间序列的索引,M 表示流量网格图的宽,N 表示流量网格图的高。
  
  2.3基于空时分布的容量自适应方法
  
  根据上述空间和时间相关性分析,本文提出一种基于 O-RAN 架构的 5G 网络容量自适应算法。图 3 中给出了具体的算法流程,具体如下。
  图3 基于O-RAN架构的5G网络容量自适应算法
  图3 基于O-RAN架构的5G网络容量自适应算法
  
  (1)数据预处理和特征提取。该内容将在实验部分具体介绍。
  
  (2)考虑到流量数据的时间周期特性,待预测时刻的流量数据一般与其邻近时间段的数据有关,也同时与其前一天相同时刻的时间段流量有关。因此,可以将流量数据从时间上分为两类 :周期性数据和邻近数据。例如要预测时间t 时刻的数据,则可构造长度为p 的邻近时间t 的数据序列Xp ,其中包含时刻t 之前的p 个连续时刻的数据。同时可构造长度为q 的周期相关数据序列Xq , 其中包含时刻 t 的前 q 天的对应时刻 t 的数据。基于周期性数据与邻近数据序列,考虑构造两个卷积神经网络模型,分别进行时刻t 的流量预测。其中Xp 和Xq 的序列中的每个数据都是一个二维的数组,表示一个时刻下的空间网格流中所述。
  
  (3)构造考虑两类不同时间周期特性的卷积神经网络模型,即 Double DenseNet,并基于两个神经网络模型预测结果的联合优化。
  
  基于上面分析,待预测时刻t 的流量与周期性数据和邻近数据都相关,因此需要对两个卷积神经网络的输出进行融合得到最终的预测结果。融合的方法可以通过两个卷积神经网络预测结果的加权平均获得,其中加权参数可以通过以最小均方误差为优化目标,使用大量数据训练得到。
  

  3 实验和仿真结果

  
  为了验证算法的性能,我们通过实验分别验证算法的有效性和模型训练的时间消耗。
  
  3.1数据采集及其预处理
  
  3.1.1数据采集
  
  本文所涉及的数据由某运营商提供,具体为基站信息数据和与基站流量相关的 KPI 数据,如基站名、小区名、数据采集时间、小区坐标、上行流量和下行流量。实验数据取自某市区中心区域,即网络负荷较大的区域。所选区域为矩形区域,该区域包含 59 个基站。数据采集的时长为 3 个月,具体为 2018 年 8 月 16 日至 2018年 11 月 14 日。数据颗粒度为小时,因此该数据中每个小区共包含约 2184 条数据。
  
  3.1.2数据预处理
  
  由网络采集的数据需经过数据预处理,具体包括小区数据提取与整理、缺失值和异常值处理。
  
  (1)小区数据提取与整理 :从原始数据中提取某个小区的数据,并对该小区的全部数据依据数据采集时间进行排序。
  
  (2)缺失值和异常值处理 :统计某小区每个 KPI 数据的缺失(异常)情况,若有一个 KPI 数据缺失程度大于阈值(30%),则标记该小区数据为无效 ;若小于阈值,则以天为周期,将缺失数据修改为其它周期内相同时刻值的均值。
  
  (3)数据结构化处理:对所选区域内所有基站的上、下行流量同时建模。一个区域训练一个模型,对于选定的预测区域,用网格来表示基站的覆盖范围。
  
  (4)训练数据和测试数据集划分,训练集、验证集、测试集数据量分别为 1400、200、450。
  
  3.2验证实验与性能结果分析
  
  3.2.1对比算法选取
  
  为了比较算法的性能,我们选取 LSTM 和 SVR 作为对比,两者的参数设置如下。
  
  (1)LSTM 算法 :输入层为 2 个神经元,用于输入上下行流量 ;输出层为 2 个神经元,用于输出预测的上下行流量;模型包含 6 个隐层,每个隐层有 32 个神经元; drop out 设置为 0.2,mini batch 设置为 32, 初始学习率为 0.001,迭代次数设置为 300,在训练了 150 次和 225 次后,学习率分别变为 0.000 1 和 0.000 01。
  
  (2)SVR 算法 :选取 rbf 为核函数,利用 3 折交叉验证法,在候选集合 {10-3,10-2,10-1,100,10,102, 103}中,选取最合适的惩罚系数 (C) 和核系数。
  
  3.2.2实验结果及分析
  
  3.2.2.1Double DenseNet 预测性能验证
  图4 Double DenseNet网络性能验证
  图4 Double DenseNet网络性能验证
  
  我们分别对 Double DenseNet 的预测性能进行了验证,实验结果如图 4 所示。图 4(a)中,上下两行图分别显示了所选区域内,各网格的上行和下行流量实际值和预测值。由图 4(a)可见,各网格的上行和下行流量实际值和预测值差异很小。图 4(b)为所选区域内所有 59 个基站流量的实际值和预测值比较,可见预测结果较好地描述了各基站的流量变化趋势。图 4(c)表示第 25 个基站,100 h 时长的实际值和预测值比较,说明就某一基站而言,Double DenseNet 具有较好的流量变化趋势预测能力。图 4(d)是 Double DenseNet、LSTM、SVR 3 种算法在基站 1、10、20、30 的比较结果, 性能指标为 RMSE。由图 4(d) 可见,Double DenseNet 的预测精度优于 LSTM 和 SVR。
  
  3.2.2.2模型训练时长比较
  
  Double DenseNet 的优势在于,其可通过为所选区域内多个基站训练统一的预测模型来降低预测模型的训练时间。Double DenseNet 与 LSTM 和 SVR 在模型训练时间的比较如表 2 所示。
  表2 Double DenseNet与LSTM和SVR模型训练时间比较
  表2 Double DenseNet与LSTM和SVR模型训练时间比较
  
  Double DenseNet 可 同 时为 59 个基站训练模型,LSTM 和 SVR 需要为每个小区单独训练 模 型。Double DenseNet 模型训练一次模型需要 380 min, LSTM 训练全部基站模型需要80 min×59, 模型训练时间节省 91%, 同时 Double DenseNet 的预测精度与 LSTM 接近。与SVR 相 比,Double DenseNet 仍然需要较长的模型训练时间, 但 Double DenseNet 的预测精度与 SVR 相比,具有较大的优势。
  

  4 结束语

  
  5G 的 O-RAN 架构将带来自由化和自组织的高度智能网络,必须结合大量 AI 技术才能充分发挥 5G 网络优势并服务用户。本文提出了一种基于空时特性的 5G 网络容量自适应算法,并基于网络数据进行了相关分析和算法性能验证。通过实际网络数据验证发现,所提出的方案可以精准的预测未来网络的流量变化。本文所提出的容量自适应算法可以应用于网络扩容分析、网络节能、网络动态载波调度和负荷均衡等多种应用场景,嵌入 O-RAN 架构后可为5G 网络提供自适应的无线资源优化方案。基于本研究的进一步拓展工作可包括如下。
  
  (1)将流量预测方法进一步拓展到用户体验预测, 分析流量与用户体验之间的关系,以流量预测为基础, 面向用户体验增强为目标,提出精细化的网络扩容、节能和载波调度方法。
  
  (2)进一步采用统计分析方法分析流量数据的周期性特性,可将数据分解为周期性分量和不规则分量,基于周期性分量和不规则分量选择合适的模型进行更精准的预测。
  
  (3)进一步改进空间数据网格化方法,如考虑维诺图进行基站网格划分以更贴近基站实际流量分布特征, 网格大小的优化选择也需要进一步的研究和验证。

Tags:

标签云