张志伟 刘立士
摘 要:计算机网络体系逐渐扩大,因此网络的服务质量和性能也急需提高。网络流量预测是网络管理的一个重要手段,研究表明网络流量具有自相似特性,在此基础上该文提出一种ARIMA预测模型。该模型首先对所生成的网络流量数据进行预处理,基于相关性与偏相关性选择ARMA模型,其次通过AIC、BIC确定阶数,利用检验后的模型进行预测,最后评估预测模型的性能。ARIMA时间序列模型能够预测非平稳数据,与传统统计模型相比,具有可忽略其他的随机变量、预测准确性更高、突发性影响较小的优点。
关键词:ARIMA模型 自相似 流量预测 研究
中圖分类号:TP393 文献标识码:A 文章编号:1672-3791(2020)08(b)-0025-03
Research on Arima Prediction Model of Self Similarity Traffic
ZHANG Zhiwei LIU Lishi*
(Shenyang Ligong University, Shenyang, Liaoning Province, 110159 China)
Abstract: With the gradual expansion of computer network system, the service quality and performance of network also need to be improved. Network traffic prediction is an important means of network management. The research shows that network traffic has self similar characteristics. On this basis, this paper proposes an ARIMA prediction model. Firstly, the model preprocesses the generated network traffic data, selects ARMA model based on correlation and partial correlation, then determines the order through AIC and BIC, uses the tested model to predict, and finally evaluates the performance of the prediction model. ARIMA time series model can predict non-stationary data. Compared with the traditional statistical model, ARIMA time series model has the advantages of ignoring other random variables, higher prediction accuracy and less sudden impact.
Key Words: ARIMA model; Self similarity; Traffic prediction; Research
因互联网的规模越来越大,网络拥塞、故障等问题也越来越多,提高网络服务质量也变的尤为重要。目前的研究表明,网络流量可以预测是因为自相似性[1],因此其也开辟了一个新的研究方向,即可以对网络流量进行精准的分析和控制。网络流量的预测是进行网络规划的基础,对于消除网络拥塞具有重要的参考价值,选择一种好的预测模型对自相似流量进行预测,动态实时监测自相似流量,进而筛选、去掉不需要的流量,而且还可以将其引入其他的模块,进行提前预测,这对解决网络拥塞有极大的帮助[2]。
1 自相似流量的特性及预测模型
自相似性简单来说就是局部和整体相似,目前对于网络流量的研究过程中少不了自相似性的。对于预测目前有很多方法,传统的统计预测对事物进行定量分析进而得出预测结果,相比于其他模型更简便、速度更快,但处理突发流量可能有些吃力,该文选择ARIMA时间序列方法,建立ARMA[3]模型,通过改进使其对自相似流量进行预测。
2 ARIMA原理及预测模型
ARIMA(p,d,q)(差分自回归移动平均模型)模型的原理:研究对象随着时间变化而变化,从而建立一个模型,根据当前序列值预测,得到预测值,但是ARIMA模型处理的是平稳对象,因此,在数据输入时需要进行预处理,加入一个周期函数,易于操作,最后还原。
ARIMA(p,d,q)模型表达式如(1)所示,L为滞后算子,d为大于0的整数,p是自回归项,q为移动平均项数,d为时间序列的差分次数。
建立网络流量预测模型:
ARIMA模型的基本流程如下:(1)导入数据首先判断序列的平稳性,如果序列非平稳,则进行预处理以获得平稳序列,这里使用ADF检验和KPSS检验[4]。而该文数据由ON/OFF模型产生,具有随机性,就需要引入一个周期函数进行处理。(2)选择模型,根据时间序列的偏相关函数和自相关函数来判断选择的模型,经过验证,该文选择ARMA模型。(3)对ARIMA(p,d,q)模型进行定阶,这里选择AIC,BIC最小信息量准则。(4)基于ARIMA估计模型预测差分后的数据,差分还原得到平稳的序列,最后去掉前面加入的函数得到最终流量,与原始流量进行对比分析。最后对模型预测的结果进行评测,用来表示预测值和真实值的吻合程度,这里则选择MAE(平均绝对误差)和MAPE(平均绝对百分比误差),误差越大,其值越大。
3 仿真验证与分析
该文选择基于ON/OFF模型产生的流量数据,并采用ARIMA模型预测。使用Matlab软件进行仿真,生成的自相似流量由3个部分构成:信源到达过程、信源时间间隔、持续时间。信源到达过程服从泊松分布poissrnd(λ,1,N),N为列向量数,信源到达率λ=0.5,信源时间间隔服从指数分布exprnd(1/λ,1,N),持续时间服从帕累托分布其中X、K、σ、θ分别为0.01、1.5、1、1,传送速率(packet/s)。
仿真结果如图1、图2所示。这里,图1是基于ON/OFF模型下产生的自相似流量仿真图,图2是在ON/OFF模型中基于ARMA网络模型预测了自相似流量得到的对比仿真图。
由图1、图2可得,选取了7个点作为对比,在时间为5s、17s、37s、46s、63s、67s、91s处产生的自相似流量数据包个数为60、120、180、360、450、180、120,而经过ARMA预测过得数据包个数约为60、120、181、362、454、182、123,其相对误差百分比为0、0、0.55%,0.55%、0.88%、0.55%、2.5%,该文使用MAE和MAPE作为评价误差的指标,仿真得到的MAE=1.1102,MAPE=0.0148%,MAE小于预设值4,MAPE远小于1,接近于0,误差较小,因此ARMA模型可以实现网络流量的预测。
4 结语
该文选取时间序列模型中的ARMA模型进行流量预测,将ON/OFF模型与ARMA模型有效结合,并通过改进,经过多次验证,使其能够处理非平稳数据,减少了部分突发性的问题,也证明了自相似流量是可预测的,如果能通过预测对流量实时监控处理,则可以有效避免网络拥塞,进而提高整体的服务质量。
参考文献
[1] 王晓婷,王忆文,李平.一种自相似网络流量生成器的设计与实现[J].微电子学与计算机,2016,33(8):54-58.
[2] 于雅芮.基于自相似流量預测的AOS帧生成技术研究[D].沈阳理工大学,2020.
[3] 于雅芮,刘立士.自相似流量的小波神经网络预测模型研究[J].科技资讯,2019,17(16):9-10.
[4] 翟静,曹俊.基于时间序列ARIMA与BP神经网络的组合预测模型[J].统计与决策,2016(4):29-32.
[5] 耿传鑫,刘立士.自相似网络流量预测模型的研究[J].科技创新导报,2018,15(13):148-149.
[6] 史明虎.基于FARIMA模型的自相似业务流量预测[D].西安电子科技大学,2013.