薛炜 袁媛 董思勤 胡浩 蒋敏
摘 要:随着互联网的高速发展,网络购物等消费模式迅速崛起并产生了海量多维度的数据,其中,餐饮行业的消费占比较大,通过研究某一城市的该类数据,可以直观地了解该城市餐饮消费行为特征,也可以对该城市的餐饮行业进行分析和预测。数据可视化将文本、数字数据用图表、图像的形式直观地进行展现,有利于对此类数据的研究和分析。该文以绵阳市为例,收集一段时间内绵阳市的网络餐饮消费数据,采用可视化手段将数据直观地展示,使用不同的交互手段辅助用户分析数据。
关键词:可视化技术 餐饮数据 交互分析
中图分类号:TP391.41 文献标识码:A 文章编号:1672-3791(2020)07(c)-0017-02
中国互联网络信息中心2019年6月发布的《第44次中国互联网络发展状况统计报告》表明,我国网络购物用户规模高达 6.39亿,比2017年底增加了19.9%。網上外卖用户规模高达4.21亿,比2017年底增加了22.6%,餐饮类消费占网络购物的比重在49%左右。网络购物的崛起与迅猛发展产生的海量交易数据能最直接地反映城市餐饮业的发展状况与发展水平。因此我们收集并处理此类数据,借助数据可视化技术希望可以展示并分析一个城市的餐饮数据。我们以绵阳市为例,分析绵阳市餐饮行业中各个店铺的实际情况。
1 城市餐饮数据可视分析
1.1 可视分析系统介绍
为了更全面和从不同角度展示餐饮数据,该系统采用多视图多角度的展示和分析方式,结合交互方法,用户不仅可以看到城市餐饮整体消费的情况,也可以根据自己的需求调整视图展示,也为城市餐饮数据的分析提供了更多的角度。该系统主体是借助百度地图工具的地图展示,还有评分雷达图、每个店铺简要信息展示框、各类店铺的信息统计柱形图、饼图等作为辅助工具分析。
1.2 数据收集与处理
利用网络爬虫手段,收集了美团平台上绵阳市餐饮消费数据,收集到的数据种类繁多,包括时序数据、空间数据、文本数据、图片等。直接从网络收集到的数据无法使用,经过数据清洗和筛选之后,我们只保留可以使用的正确数据。
根据系统的需要,我们将数据转换为json格式,按照id、name、address等字段规范所有数据。在规范数据的同时,为了方便数据的使用,我们也将数据按地区和商铺种类进行分类,总体将店铺分为22类:咖啡、川菜、快餐简餐等。根据绵阳市的行政区域划分,将数据按地区分为涪城区、游仙区、江油市等。
1.3 主要功能
该可视化系统的功能主要包括店铺信息的统计分类并展示、雷达图的绘制、地图显示等。将这些店铺信息用多视图的方式通过各种形式直观展示出来,可以给绵阳市的用户提供更加快捷、符合个人需求的选择餐饮的方案,同时也为投资者提供了充足的参考数据,例如店铺地点、类型的选择,以及如何侧重该店的竞争优势。
1.3.1 地图显示
我们借助百度地图API的功能,根据每个店铺的经纬度在地图中做上标记。通过地图的基础交互功能,如地图拖拽、滑轮缩放等,可以清楚地看到某一区域的店铺分布情况或者某一店铺附近的地理情况。
由于该系统收集的数据点较多,前期我们尝试直接加载标注的方法进行绘点,结果系统运行无响应。于是我们使用另一种给坐标添加标注的方法:加载海量点。借助百度地图的功能,在绘制前检测当前环境是否满足条件,满足则可加载点。
1.3.2 行政区域划分显示店铺
只是对各个区域的店铺类型和数量进行统计并不能体现所有的餐饮行业相关信息,根据日常生活的经验我们知道,一个店铺的地理位置对其利润的获取有着密切联系,而一个城市的不同行政区域的店铺的地理位置是否有着相同的分布规律也值得探讨。为了分析地理位置对店铺的影响,突出不同行政区域之间的店铺地理位置这一信息,我们还添加了根据行政区域画店铺位置的功能。我们使用百度地图获取行政区域的,再根据获取的行政区域的坐标,添加多边形的覆盖物,设置合适的透明度使其高亮显示。这样用户在点击不同的行政区域时,可以更清楚地看到不同行政区域中店铺的情况。
1.3.3 评分雷达图
每一个店铺的评分都有不同的维度,如卫生评分、环境评分、口味评分、服务评分等。针对评分数据多角度这一特点,我们使用雷达图展示评分,这种显示方式即可以直观地表现各角度评分的具体数值,也有着对比突出的作用,用户可以直接得出这家店铺的突出优势。我们将每一个店铺的各角度评分数据传入绘制雷达图的函数中进行绘制。用户在点击任何一个店铺的同时看到旁边相应的评分雷达图,给予用户更加方便的参考形式。
2 分析结果
经过对数据的可视化处理显示并分析,我们可以直观地看到绵阳市及其下属行政区域店铺的数量、类型和分布情况。以涪城区为例,从地图显示中可以看出店铺主要分布在东北部,再仔细分析地图发现,涪城区东北部是绵阳市的市中心,这里有着大型广场,多个商场、医院、电影院等娱乐场所,是人流量最多的地方,因此餐厅数量较多,如图1所示。
这时我们再分析涪城区各类型的店铺数量,发现火锅有394家、川菜335家、面食有343家,这些类型的店铺数量最多,这也体现了涪城区群众的的饮食习惯。
3 结语
该文通过收集美团上的餐饮数据,采用多视图可视分析的方法,通过对时序数据、空间数据、文本数据收集与筛选设计并实现了绵阳市餐饮数据的可视化。但有一个问题值得注意,在数据清洗和筛选过程中可能存在大量被被淘汰的数据是集中在某一个或某几个行政区域中,或者某些类型的店铺,那么会导致这些店铺数据与其他有着数量上的明显差别。接下来的工作将着重考虑对数据的预处理方式和更美观的界面布局。
参考文献
[1] 胡明.餐饮管理系统及其数据可视化研究与实现[D].吉林大学,2007.
[2] 敖成凤,李艳妮,吴亚东,等.城市餐饮消费行为数据可视化[J].西南科技大学学报,2017,32(3):91-98.
[3] 邵兴.可视化餐饮管理推荐系统的设计与实现[D].西安电子科技大学,2014.
[4] 敖成凤.基于大众点评数据的城市餐饮消费行为可视分析[D].西南科技大学,2018.
[5] 张娱嘉,张景璐.大数据在餐饮业务信息系统研究的分析与开发[J].科技资讯,2018,16(2):46-47.