戚颖 如天一 朱琳 倪宏 刘正建
摘 要:国家正加快推进“数字中国”建设,为挖掘电力数据价值,并结合外部数据,开展数据应用分析,打造数据共享服务,研究数据价值变现,拓展商业模式以促进业务创新,建立“国土效能评价智慧网格系统”。利用电力数据分析地块能效,为政府部门掌握城镇地块的空间经济活力、影响力提供科学的区域规划决策支持,实现面向政府的数据运营服务,支撑政府科学监管、提高社会治理能力、服务智慧城市建设。
关键词:电力数据 数据增值服务 智慧地块 科学监管
中图分类号:TP311.13 文献标识码:A文章编号:1672-3791(2021)04(a)-0038-03
Application of Electric Power Big Data Value-added Services in Energy Efficiency Assessment of Smart land
QI Ying RU Tianyi ZHU Lin NI Hong LIU Zhengjian
(Aostar Information Technologies CO., Ltd., Chengdu, Sichuan Province, 610041 China)
Abstract: The state is accelerating the construction of "Digital China", in order to tap the value of electricity data, and combine external data, carry out data application analysis, create data sharing services, study the realization of data value, expand business models to promote business innovation, and establish a "wisdom of national land effectiveness evaluation grid system". Use power data to analyze the energy efficiency of plots, provide scientific regional planning decision support for government departments to grasp the spatial economic vitality and influence of urban plots, realize government-oriented data operation services, support government scientific supervision, improve social governance capabilities, and serve wisdom urban construction.
Key Words: Electricity data; Data value-added services; Smart land; Scientific supervision
國土规划利用效率评价困难,无法及时了解地区经济发展的现状,对地区做出准确规划。而电力公司智能电表在线采集上传的电量反映了不同类别客户生产生活用电情况,数据准确、实时性强、数据量巨大,结合成都市地块网格数据,基于图形化数据解析、大数据平台等技术,通过关联用电量,完成对网格地块的用电数据汇集分析,可以及时识别城镇商业、居民、工业低效地块网格,完成对成都城镇低效用地的空间画像。四川省电力公司深入贯通“12333”发展战略,充分运用内外部数据,开展数据应用分析,深入挖掘电力大数据的“富矿”,释放数据价值,打造“国土效能评价智慧网格系统”,借助电力数据孪生的强大感知,支撑全省城市用地能效评估和国土规划。
1 国土效能评价智慧网格系统建立需求
(1)实现规划地块数据解析,通过规划院提供的地块信息开展坐标解析工作,并与GIS系统坐标信息进行数据关联,获取地块变压器、计量箱等设备台账信息。(2)实现规划地块的居民、工业、商业的用电分析,利用获取的设备信息与营销数据进行数据关联,完成地块计量点、用户、电量等电网数据梳理、归集,基于业务规则、数据逻辑规则,进行数据整合,借助全业务的大数据平台构建算法模型,形成业务宽表[1]。(3)建立数据应用服务通道,定期提供数据查询功能,基于全业务中心数据应用管理规范,进行数据接口设计和配置,形成API接口供需求调用,最终完成对外数据应用数通道构建工作,按时向规划院提供电量数据[2]。
2 数据挖掘分析
2.1 数据需求及质量
(1)规划院:地块初始坐标信息、地块面积信息。(2)GIS系统:地块解析后GIS坐标信息、变压器设备信息。(3)营销SG186系统:变压器设备信息、计量点信息、用户档案信息。(4)用电信息采集系统。
2.2 数据处理
(1)电网GIS空间信息服务平台数据集成。全业务统一数据中心贴源层SG-RDB数据库通过OGG实现表的数据接入工作,包括历史数据和增量数据,数据接入频度为T+1的方式,该部分数据主要为规划院建设项目提供数据从坐标体系转换成设备信息的支撑,通过地理空间数据解析程序实现获取设备ID信息。(2)营销业务应用系统数据集成。全业务统一数据中心贴源层SG-RDB数据库通过OGG实现表的数据接入工作,包括历史数据和增量数据,数据接入频度为T+1的方式,该部分数据主要为规划院建设项目提供地块范围内用户档案信息、电量信息。(3)用采信息采集系统数据集成。全业务统一数据中心通过海量平台采用kafka数据抽取技术将表的数据接入工作,包括历史数据和增量数据,该部分数据主要为规划院建设项目提供地块范围内用户日电量信息。
2.3 模型构建
2.3.1 算法选择
(1)识别能效低的城镇地块:能效指数=(5年用电量平均增长率)×50%+(某地块单位面积平均用电量占比单位面积平均用电量)×50%。(2)识别能效低工业企业:5年用电量平均增长率低于15%。(3)识别住宅空置率:居民用电量连续3月为0,视为空置,此类用户占小区比例超过20%即为危险[3]。
在该次设计中采用归一算法中的离差标准化(Min-max normalization)[4],研究人员的目的是通过对数据的每一个维度的值进行重新调节(这些维度可能是相互独立的),使得最终的数据向量落在[0,1]或[-1,1]的区间内(根据数据情况而定)。这对后续的处理十分重要,因为很多默认参数(如PCA-白化中的epsilon)都假定数据已被缩放到合理区间。例如,在处理自然图像时,我们获得的像素值在[0,255]区间中,常用的处理是将这些像素值除以255,将特征向量映射到[0,1]之间,收敛后进行加权平均得到地块能效系。这种算法是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:
(1)
式(1)中,max为样本数据的最大值;min為样本数据的最小值。
这种归一化方法比较适用在数值比较集中的情况。但是,如果max和min不稳定,很容易使得归一化结果不稳定,使得后续使用效果也不稳定,实际使用中可以用经验常量值来替代max和min。而且当有新数据加入时,可能导致max和min的变化,需要重新定义。在不涉及距离度量、协方差计算、数据不符合正太分布的时候,可以使用第一种方法或其他归一化方法。比如图像处理中,将RGB图像转换为灰度图像后将其值限定在[0,255]的范围[5]。
经过归一化处理后采用综合加权平均算法,地块能效系数模型可判断指定地块的能效高低,地块能效系范围为0-1,该系数越接近于0表示地块能效越低。地块能效系数是基于多个影响因子(电量同比降低率、5年电量平均增长率、单位面积用电量比值),使用综合加权平均法得到,具体公式如下:
(2)
式(2)中,0≤w≤1且w越趋于0表示越低效。
2.3.2 样本选择
选择成都市新都区XX个地块开展数据样本验证工作,共涉及电力坐标数据XX项、设备信息数据XX项、用户档案数据XX项、电量明细数据XX项、电量汇总数据XX项,以此作为智慧地块能效评估基础样本数据开展样本验证。
2.3.3 参数设置
根据算法模型定义,参数包括α、β和γ,α代表XX权重,β代表XX权重、γ代表权重,基于样本验证结果结合地块实际现状,综合设置α为XX、β为XX、γ为XX时较为合理,更能合理评估地块能效系数。
2.3.4 模型验证调优
根据业务应用和模型需求,接入业务样本数据,进行数据预处理,形成训练数据集以开展模型训练。通过模型训练,归纳整理模型训练结果完成业务验证,揭示训练阶段中数据的相关性,找出数据中潜在的规律进一步解释模型,找出有价值的特性并采用误差分析等多种方法评估模型的质量,根据评估结果调整模型参数,优化完善分析模型,实现分析模型迭代[6]。
3 模型应用
3.1 整体分析
(1)地块数量分析。计算地块的能效系数,将地块能效系数小于30的称为低效地块;地块能效系数大于等于30,小于60的称为低效地块;地块能效系数大于60的称为高效地块。分析低效、中效以及高效的地块数量,展示地块能效情况。(2)地块能效系数趋势。每隔5天取一个地块能效系数值,展示近1年地块能效系数变化趋势,总体分析地块能效系数动态。(3)总用电量及增长率。展示近3年地块总用电量及其增长率,掌握分析地块的用电量变化趋势。总用户数及增长率:展示近3年地块总用户数及其增长率,掌握分析地块的用户数变化趋势。(4)总工业商业居民用电量对比。展示工业、商业、居民近3年的用电量,对比分析工业、商业和居民的用电量变化。(5)总业商业居民用户数对比。展示工业、商业、居民近3年的用电量,对比分析工业、商业和居民的用电量变化。
3.2 工业分析
(1)工业地块指标。展示当前工业地块能效系数、工业用户电价和工业用户贡献率。地块能效系数趋势:每隔5天取一个地块能效系数值,展示近1年地块能效系数变化趋势,总体分析工业地块能效系数动态。(2)工业用户行业构成。展示业用户涉及的行业类型及各行业近3年的用电量,对比分析各行业用电量,洞察行业用电。(3)工业用户数及增长率。展示工业用户近3年的用户数,对比分析工业用电量变化。(4)工业用电量及增长率。展示工业用户近3年的用电量,对比分析工业用电量变化。
3.3 商业分析
(1)商业地块指标。展示当前商业地块能效系数、商业用户电价和商业用户贡献率。(2)地块能效系数趋势。每隔5天取一个地块能效系数值,展示近1年地块能效系数变化趋势,总体分析商业地块能效系数动态。(3)商业用户行业构成。展示商业用户涉及的行业类型及各行业近3年的用电量,对比分析各行业用电量,洞察行业用电。(4)商业用户数及增长率。展示商业用户近3年的用户数,对比分析工业用电量变化。(5)商业用电量及增长率。展示商业用户近3年的用电量,对比分析工业用电量变化。
3.4 居民分析
(1)居民地块指标。展示当前居民地块能效系数、居民用户电价和居民用户贡献率。(2)地块能效系数趋势。每隔5天取一个地块能效系数值,展示近1年地块能效系数变化趋势,总体分析居民地块能效系数动态。(3)居民用户生活用电分析。展示居民医、教、文、体、卫及养老机构的近3年用电量,对比分析医、教、文、体、卫及养老机构用电量差异以及近3年用电量变化趋势。(4)居民用户数及增长率。展示商业用户近3年的用户数,对比分析工业用电量变化。(5)居民用电量及增长率。展示商业用户近3年的用电量,对比分析工业用电量变化。(6)居民住宅空置率。展示近3年居民住宅的空置率,分析居民住宅空置率变化趋势。
4 结语
“国土效能评价智慧网格系统”创新开展电力与规划院数据融合与叠加,实现跨专业、跨行业数据的高效在线计算、智能分析和深度挖掘,利用图形化解析与大数据分析工具,运用相关性分析大数据算法构建电力大数据应用分析模型,输出数据分析成果,优化展示方式,最终形成数据增值变现服务。系统地建立实现资源结合,与资源的合理使用,充分发挥企业资源的效益,开拓新的合作业务和市场,实现数据增值,推动电力数据价值变现,优化企业发展曲线。且基于公司全业务统一数据中心,充分利用规划院地块信息数据和公司海量电力数据开展电力服务应用分析,面向政府、社会、合作伙伴的数据分析服务,利用电力数据分析地块能效,为政府部门掌握城镇地块的空间经济活力、影响力提供科学的区域规划决策支持,实现面向政府的数据运营服务,支撑政府科学监管、提高社会治理能力、服务智慧城市建设。
参考文献
[1] 唐梦琪.智慧城市规划中大数据技术的应用分析[J].江西建材,2020(9):240-241.
[2] 李志勇,郭一通.大数据背景下电力行业数据应用研究[J].自动化技术与应用,2018,37(9):160-162.
[3] 杨桥桥,田权,周小娜.基于电力大数据的住宅空置情况分析[J].信息系统工程,2018(9):20.
[4] 程俊文,李慧娟,曹志强.基于K-means算法和用电信息采集系统的防窃电研究[J].供用电,2019,36(1):75-80.
[5] 季知祥,邓春宇.面向电力大数据应用的专业化分析技术研究[J].供用电,2017,34(6):32-37.
[6] 陈艳,宋英华.新型配电物联网后台系统架构设计与关键技术研究[J].供用电,2020,37(2):41-46,53.