郑凤贤
摘要:在建设新型城镇化的背景下,粤西地区农村人口比重高,农民数量大,其生活改善与收入水平提高是该地区新型城镇化的重点。以教育规模为自变量,以农民收入为因变量,利用SPSS软件进行回归分析,建立函数模型。研究发现,小学与普通中学规模为排除变量,高等院校规模不完全具备建模条件,中职学校规模为主要因素,可作为教育规模的代表因素参与建模。结果显示, 中职学校的规模与农民人均收入具有高度相关性。
关键词:教育规模;农民收入;多元回归分析;曲线估计
中图分类号:G710 文献标识码:A 文章编号:1672-5727(2018)11-0028-05
2014年,国务院发布的《国家新型城镇化规划(2014—2020年)》指出,我国仍处于城镇化率为30%~70%的快速发展区间,随着内外部环境的变化,我国的城镇化必须进入以提升质量为主的转型发展新阶段。随着新型城镇化的深入推进,城镇化对于解决农业、农村、农民问题及推动区域协调发展的作用越来越明显。2016年,国务院《关于深入推进新型城镇化建设的若干意见》指出“以人的城镇化为核心”。在中小型城市中,不管是易地城镇化还是就地城镇化,以人为核心的城镇化都离不开作为公共服务之一的教育。因地制宜地城镇化是我国城镇化的主要途径。
在广东省内,珠三角地区与粤东西北的经济发展水平迥异。从人口分布来看,粤西地区城镇人口逐年增加,农村人口逐年减少。但截止2015年,粤西地区农村人口依然占该地区常住人口的58%[1]。粤西地区在推进新型城镇化的过程中,农民的城镇化是重中之重。人的城镇化关乎教育的作用,不但表现为人的素质的提高,也表现在其生活水平的改善。那么,粤西地区的教育与当地农民生活改善的关系是否显著?若显著,该地区的教育规模与农民收入是否有显著关系?存在何种关系?利用多元回归分析及曲线估计的统计学手段,以粤西地区的湛江市为例,建立回归模型,挖掘不同类型教育的规模对农民收入的影响程度,从教育角度探寻提高农民收入的途径。
一、研究設计
(一)选取变量
湛江市位于广东省粤西地区,经济发展属于全省经济欠发达地区。截至2012年,全市人口约785万,农村人口约494万,占全市人口的63%[2]。这说明湛江市农民占人口的大多数。同时,湛江市科教实力雄厚,截至2016年,拥有高校9所,在省内数量仅次于广州市;中等专业学校和职业技术学校63家;科研和专业技术人员13万多人[3]。
为了建立模型探讨教育的经济功能的发挥,以教育为自变量,农民的收入为因变量。据笔者了解,该地区的学校在校生大部分为湛江户籍,普通高等学校的在校生可代表该地区学生的就读情况,而其他类型的教育在校生几乎全部为湛江户籍。学校的在校生数可作为教育的具体可计算变量。那么,教育规模作为教育因素中的自变量,其计算数值为在校生数。此外,该市农民人数占比大,农民收入的提高是该市经济发展的显著变化指标。教育的经济功能的发挥在农民收入变化上的影响同样具有显著性。因此,农民的人均收入作为经济因素中的因变量。
(二)确定步骤
本文的前提假设为随着教育规模的扩大,受教育的人数不断增加,农民的人均收入逐渐增加。无论农民或农民子女为第几产业从业人员,教育对其收入的影响都占有一定比值。农民的人均收入必然随着该地区GDP的提高而提高,教育与GDP的相互关系已被很多研究验证。但本文的研究目的是探寻粤西地区何种类型的教育对农民人均收入影响最大,是否可建立模型进行预测。因此,研究的第一步,首先要对总体的数据现状进行分析,根据实际情况判断各要素之间的相互关系。第二步,运用多元回归分析方法对各类型教育对农民人均收入的影响进行回归分析,找出具有线性回归意义最高的模型。第三步,根据多元回归模型,剔除没有线性回归意义的类型。由于线性模型并不适合于大多数日常实际情况,而曲线模型在日常生活中更常见,也更符合实际。为此,对剩下的类型进行曲线估计分析,并对模型进行优化。最后,运用模型预测值与原值相比,检验该模型的有效性并预测真值。
总之,运用SPSS19.0软件为分析工具,以湛江市1985—2015年(数据来源为《湛江统计年鉴(2016)》)的数据为样本,对相关因素进行回归分析。涉及的自变量计算值分别为高等院校在校生数、普通中学在校生数、中等职业院校在校生数、小学在校生数;因变量为1985—2015年农民人均收入。
二、研究过程
(一)描述统计
描述统计的过程就是对所要研究的对象的各因素现状了解的过程。湛江市1985—2015年的教育规模情况及农民人均收入情况的具体数据用折线图直观呈现。教育规模的数据由普通高校在校生数、中职学校在校生数、普通中学及小学在校生数构成。
如图1所示,小学在校生数由1985年的起点约66万人逐渐上升,2001—2007年人数超过100万,此后开始下降,到2015年小学在校生数约为57万人。1985—2015年,小学的在校生年均85万,极小值为55万,极大值为107万。小学学校的规模与当地的出生人口相关,人口为主要影响因素。而普通中学则由起点基数的约20万人逐渐上升,到2011年约为71万人,2015年下降为48万人。1985—2015年,普通中学在校生年均44万,极小值为20万,极大值为71万。普通中学包括初中和普通高中,而初中也为义务教育阶段,因此,普通中学的在校生受人口因素的影响也比较大。但普通中学的在校生数比小学的学生数约有一半的人数差距,主要原因在于初中之后有部分学生选择了职业中学。总的来说,小学在校生数与普通中学在校生数受人口因素影响较大,当地的人口出生率几乎可以预测该地区的中小学学校规模。
由图1可知,中等职业学校在校生数在2000年之前几乎重叠,说明该段时间两者的在校生数不相上下。中等职业学校1985年的在校生起点为4 000人,高等院校为5 000人。随后,两者均逐渐上升,中等职业学校在2011年迅速上升为12万人,接着虽然有所下降,但均在10万人以上。高等院校在2013年首次突破10万人,随后几乎保持在11万人左右不变。从小学到高等院校,在校生的规模具有滞后性,其高峰期同样随着时间滞后。小学高峰规模在2005年,普通中学在2011年,中等职业学校在2013年,高等院校在2010年。由此,可推测出普通中学与中等职业学校高峰在校生规模受小学高峰在校生规模影响较大。而高等学校高峰较靠前,时间上与小学高峰期规模出现时间不对等,说明高校在校生规模受小学在校生规模影响不大。
由图2可知,1985—2015年农民人均收入在逐年提高,农民人均收入在2010年增幅加大,在2013年农民人均收入突破10 000元。但从各年的具体数值来看,极小值约为400,极大值约为12 000,均值约为4 000。这说明农民人均收入变化幅度大,若以均值4 000为分割线,1985—2004这20年期间农民人均收入皆在4 000元以下,只有2005年及往后的2011年农民人均收入均高于4 000元。因此,农民人均收入受极值影响比较大,在接下来的回归模型分析中,要调整模型,减少极值的影响。
(二)回归分析
在回归分析中,分别将高等院校在校生、中等职业学校在校生、普通中学在校生、小学在校生为自变量,分别做散点图。散点图呈现其均有一定的线性相关,因此,所有变量均进入回归分析阶段。运用逐步回归的方法得出结果显示,小学在校生数与普通中学在校生数存在高偏相关性,已作为排除变量,不再作为建模时考虑的变量。
由表1可知,上述建模中有两个模型可供参考。第一个模型的自变量为中等职业学校在校生数,第二个模型的自变量为中等职业学校在校生数及普通高等学校在校生数。模型1的相关系数为0.927,模型2的相关系数为0.970,均接近1,说明两个模型具有高度相关性;模型1的拟合优度R方为0.859,模型2的拟合优度R方为0.940,说明模型2的回归曲线与原值重合度更高。经过方差分析,得出模型1的F值为176.453,p<0.01;模型2的F值为220.615,p<0.01,这说明两个模型均具有线性回归意义,可以继续看各项系数分析。
由表2可知,在模型2建立的模型中,常量的T检验结果为t=1.985,p>0.05,这说明模型2中的常量T检验不显著,常量不具有统计学意义,因此,不能运用在回归模型中。由于所建模型模型沒有常量,不符合实际情况,因此,模型2要排除。模型1中常量的T检验结果为t=4.737,p<0.01,因此,该常量具有统计学意义,可以运用。那么1985—2015年湛江市教育规模与农民人均收入的回归模型可用模型1来表示,则其常量B为1 432.741,自变量系数为0.072,模型为Y=1 432.741+0.072X,也就是在常量的基础上,自变量(中等职业学校在校生数)每增加一个单位,因变量(农民人均收入)便增加0.072个单位。
残差指实际观察值与估计值(拟合值)之间的差。残差分析可考察模型假设的合理性及数据的可靠性。在回归分析中,测定值与按回归方程预测的值之差遵从正太分布。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%的置信度将其判为异常点,不参与回归直线拟合。如下页图3所示,上述所建模型的标准化残差多数落在(-1,1)之间,异常点几乎没有,但有少数值离散性很大,说明所建模型受极值的影响较大。因此,所建模型还可以继续优化。
(三)模型优化
线性回归分析所拟出的模型为直线,而实际生活中的事物之间的关系模型多数为非直线型的,因此,模型优化使用了曲线估计回归分析。为了减少极值对建立模型的影响,因此,剔除了1995年左右的极小值及2013年左右的极大值,让数据的全距变小,增加数据的集中度。如图4所示,2000—2012年的中职学校在校生数与农民人均收入可做出符合对数函数的模型。
由表3可知,对数函数模型的相关系数R为0.983,拟合优度R方为0.965,高于模型1(Y=1 432.741+0.072X)的相关系数(R=0.927)及拟合优度(R方=0.859)。这说明对数函数模型更接近该数据的真实值。经过方差分析得出,F=307.821,p<0.01,说明该曲线具有统计学意义,可继续建模。由表4可知,对数函数的常数及自变量经过T检验,均得出P<0.01。因此,该对数函数模型为: Y=2 556.559*ln(x)-21 178.751。
为了验证该模型与原值的误差值,因此,代入了原值进行计算。如表5所示,农民收入为实际收入,预测值为模型所算得出的值,误差百分比为两者的差占实际值的绝对百分比。在表5中共有14个年份,有8个年份的误差百分比在5%以内,有12个年份的误差百分比在10%以内。预测准确率在95%以上的只占一半,这说明该模型具有一定的准确度,但还需增加数据,继续提高其准确度。
三、总结讨论
(一)小学与普通中学规模不可作为建模因素
在多元回归分析中,小学与普通中学规模被作为排除变量剔除,究其原因,可在现状分析中找到答案。首先,小学与普通中学规模在整个变化趋势上与农民人均收入变化趋势差别较大。其次,小学与普通中学规模为该地区义务教育普及化程度的指标,与当地的出生人口相关度极高,即两者的规模不受当地人均收入的影响,而当地的经济状况也不受两者的规模影响。最深层的原因可理解为义务教育的主要目标是提高人民素质,在此阶段,教育的经济功能暂时退居其次。因此,小学与普通中学规模对农民人均收入的影响不显著,在建模中被排除在外。
(二)高等院校规模不完全具备建模条件
从理论上来讲,高等院校是储备人力资本的最主要阵地,而教育经济功能的发挥在此阶段也应得到最明显的体现。而在建立教育规模与人民人均收入的回归模型中,高等院校规模被排除在外。首先,在回归中从最佳建模的条件来看,高等院校规模并不是最佳的独立建模因素。从回归分析中建立的模型2可以得出,该模型需高等院校与中职学校规模均满足条件方可成立。其次,高等院校规模对农民收入的影响主要来自农民子女就读高等院校毕业后的工作收入水平,那么这便涉及到高校专业设置与农民家庭就读高等院校的人数这两个因素。在此只能猜测,湛江地区每户农民家庭就读高等院校的人员并不多,所以收入中得益于高等院校的成分不多,而实际情况则需要进一步的实地研究与调查。本文只从一段时间的数据分析中得出高等院校并不能完全作为建立预测农民收入模型的因素。
(三)中職学校规模为建模主要因素
首先,在回归分析中,中职学校的规模与农民人均收入具有高度相关性,并且不管是建立一元线性模型,还是对数函数模型,拟合优度在所有因素中是最高的。在统计学意义上,中职学校规模在建立模型中是主要因素。其次,结合当地的经济发展状况来看, 改革开放至2012年,湛江市农村居民恩格尔系数均为50%以上,这说明当地居民生活消费支出中,食品支出依然占了收入的一半以上,生活还没达到富裕的程度。而中等职业教育从最浅层来理解也就是为谋生而学一技之长的教育,在生活消费支出依然占收入一半以上的情况下,中等职业教育也许是改善经济状况最好的选择。再者,从所建立的对数模型来看,由于数据具有阶段性,不够全面,因此,该模型也只是模型中的一段。因此,对于中职学校规模与农民人均收入的高度相关,可继续深入调查以增加数据,如农民每户就读中职学校的人数等。
(四)提高农民收入的途径展望
农民人口数量占经济欠发达地区人口一半以上,其收入水平与我国的新型城镇化建设息息相关。从建模中可以发现,中等职业学校的规模达到一定程度,可提高该地区农民的收入水平。2015年,湛江市从事第一产业的人员占60%,因此,在建设新型城镇的过程中,新型农民工与新型职业农民均是培养的目标对象。可发挥职业教育的优势,将学校的全日制教育与校外的培训相结合,让农民掌握一技之长。
参考文献:
[1]广东省统计局.广东统计年鉴(2016)[EB/OL].[2017-12-13].http://www.gdstats.gov.cn/tjsj/gdtjnj/.
[2]湛江市统计局.2016年统计年鉴[EB/OL].[2017-12-13].http://zjtj.zhanjiang.gov.cn/tjsj/tjnj/201701/t20170113_353204.html
[3]湛江市政府门户网站.湛江概况[EB/OL].[2017-12-13].http://www.zhanjiang.gov.cn/fileserver/statichtml/2016-01/152d73af-ff5b-47d0-9b0c-e8c948cc771b.htm.
(责任编辑:杨在良)
Abstract: With the new urbanization, the proportion of rural population in the west of Guangdong Province is higher and the number of farmers is larger. The improvement of those farmers' life and their income level are the key to the new urbanization in that area. Taking the scale of education as the independent variable and farmers' income as the dependent variable, SPSS software was used for regression analysis to establish a functional model. The study shows that the scale of primary and secondary schools are the excluded variables, the size of institutions of the universities is not fully modeled, but the size of secondary vocational schools is the main factor. After optimizing the model, the scale of secondary vocational schools can be used as a representative factor of education scale to establish model,The result shows that the size of secondary vocational schools is highly correlated with the per capita income of farmers.
Key words: education scale; farmers' income; multiple regression analysis; curve estimation