栏目分类:
子分类:
返回
文库吧用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
文库吧 > 学术 > 人文期刊 > 科技视界

以数学建模竞赛为例基于SPSS建立ARIMA模型

以数学建模竞赛为例基于SPSS建立ARIMA模型

徐燕

摘 要 SPSS软件是当前应用最广泛的统计软件之一,其菜单化操作模式能够让使用者快速入门,SPSS软件中时间序列模块能够实现模型的自动化筛选,参数估计和模型检验,是非统计学专业人员进行数据分析的有力工具。是本文以2019年全国大学生数学建模竞赛D题为例,以SPSS23软件为工具,对数据进行时间序列分析,建立ARIMA模型。

关键词 数学建模;SPSS;时间序列;ARIMA模型

中图分类号: R058 文献标识码: A

引言 SPSS软件是当前世界上应用最广泛的统计软件之一,菜单化操作、图表化输出的特点特别受到非统计学专业人员的欢迎。使用SPSS软件,我们几乎可以完全自动的自变量的预变换、筛选、模型优化、检验等工作。SPSS软件中的预测模块,纳入了常用的时间序列分析模型,如ARIMA模型,包括自动的模型选择、参数估计和模型检验等功能,实现了简单操作即可得到可靠的时间序列模型,其功能得到了使用者的肯定。

近年来,全国大学生数学建模竞赛频频出现大数据统计建模试题,作为非统计学专业的大学生,对于复杂的数据统计分析方法和工具接触并不很多,如何让这些学生快速入门和掌握一门有利的数据分析软件工具、完成数据分析和建模等任务就是我们近几年來数学建模培训教学研究的重点。

本文以2019年全国大学生数学建模竞赛D题为例,竞赛提供的数据是由空气监测仪每间隔2分钟记录下来的空气污染物浓度监测数据,呈现明显的时间序列数据的特征,因此,我们考虑对其进行时间序列分析,建立ARIMA模型,并对模型进行检验。我们以竞赛提供的数据为例,利用SPSS23完成数据建模和分析。

1 SPSS23数据建模和分析

1.1 建立数据文件

首先,我们在SPSS23中导入竞赛提供的Excel数据文件,“文件”→“打开”→“数据”。在弹出的“打开Excel数据源”对话框中,“工作表”下面选择数据文件,单击“确定”,如图1。

我们需要对导入的数据做基本的检查,比如变量的定义、是否有缺失、数据的类型和分布特征等。由于竞赛提供的数据量大,我们采用人工检查与SPSS检查相结合的方式:人工查看“数据视图”和“变量视图”,查看数据和变量;SPSS软件“分析”→“统计描述”→“描述”,查看数据情况。

1.2 数据预处理

在做时间序列分析之前,我们需要对数据进行预处理,即定义数据的日期:“数据”→“定义日期”,在“定义日期”对话框中设置日期的格式。确定了日期格式后,SPSS数据表格的“数据视图”中可以看到新插入的变量“Year”、“Month”、“Date”。

1.3 时间序列建模

首先,我们检验数据的时间序列特征,进行自相关检验(以数据中的PM2.5为例,下同):“分析”→“预测”→“自相关”,在“自相关”对话框中,将“PM2.15”选入“变量”列表框中,单击“确认”按钮,如图2。

自相关分析结果显示PM2.5具有强自相关性,下一步可以作为时间序列进行分析。我们将非平稳时间序列经过差分转化为平稳时间序列,然后将因变量对于它的滞后值以及随机误差项进行回归建立ARIMA(p,d,q)模型,称为差分自回归移动平均模型,其中的AR是自回归,p为自回归项数;MA是移动平均,q是移动平均项数;d是差分次数。

ARIMA模型的操作过程:“分析”→“预测”→“创建模型”,在“时间序列建模器”对话框中,将“PM2.5”选入“因变量”列表框中,将“温度”、“湿度”、“风速”、“压强”、“降水量”选入“自变量”列表框中,“方法(M)”下拉列表中选择“ARIMA”,如图3。其他一些设置主要有:“Statistics”中选择“平稳的R方”、“拟合优度”“显示预测值”,如图4;“图”中选择“观察值”,如图5;“保存”中选择“预测值——保存”,如图6。单击“确认”。

1.4 结果分析

SPSS输出了模型的描述,给出了R方、平稳的R方、正态化的BIC等指标,我们选择R方较大、BIC较小的模型。下一步还应当结合专业背景,将分析结果应用到实际中去检验其实用价值,讨论实际应用中存在的问题。

2 总结

SPSS软件菜单化操作、图表化输出的特点让非统计学专业人员能够快速地掌握数据的统计建模和分析能力,易于理解和应用。我们以2019年大学生数学建模D题为例,利用SPSS23进行时间序列分析,建立了ARIMA模型,模型检验显示拟合效果好。

参考文献

[1]张文彤.SPSS统计分析高级教程(第3版)[M].北京:高等教育出版社,2018.

[2]武松,潘发明.SPSS统计分析大全[M].北京:清华大学出版社,2014.

[3]孙祝岭.时间序列与多元统计分析[M],上海:上海交通大学大学出版社,2016.9.

[4]熊斯,柏文,陈远.SAS软件在变形监测数据分析中的应用[J]河南科技,2010(06):20-21.

转载请注明:文章转载自 www.wk8.com.cn
本文地址:https://www.wk8.com.cn/xueshu/267291.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 wk8.com.cn

ICP备案号:晋ICP备2021003244-6号