刘文杰
摘 要:本文以城市交通数据可视化为研究对象,本文首先分析了数据可视化的基本框架,包括数据可视化的流程和核心要素,进而探讨了点数据和线数据可视化的方法,在此基础上,本文给出了城市交通大数据可视化的效果。相信对从事相关工作的同行能有所裨益。
关键词:城市交通 大数据 可视化 地图
中图分类号:TP311 文献标识码:A 文章编号:1674-098X(2017)12(c)-0121-02
随着智能交通在物联网、云计算、移动互联等领域的结合应用和迅速发展,其发展模式已经从传统的信息不均衡、信息处理能力低效的系统发展成为真正的运用新技术的智能交通系统。智能交通系统是多个与交通有关的系统的综合应用,包括车路协同系统、公众出行便捷服务、车联网等,这些应用运用大数据技术、云计算技术、移动互联技术等为交通系统的智能化效率的提高提供重要的支持,不断提高智能交通系统的数据分析判断能力,以优化交通的运行管理,精准地掌握交通状况,给车辆和出行者带来更加智能化的服务。目前大数据技术已经应用在很多城市的智能交通领域,公众出行越来越离不开交通大数据分析带来的便利。
随着大数据技术的兴起,智能交通的发展也在飞速前进的阶段,交通大数据的总量已从TB级跃升为PB级并仍在不断攀升。但目前,在如何运用大数据技术有效处理分析这些日益剧增的交通大数据分析获取更有价值的信息的问题上,我国的智能交通发展仍然处于开始阶段。如何运用大数据技术,有效分析利用交通大数据,实现大数据的可视化,使其发挥出应有的价值,是现阶段智能交通发展的重要任务。
1 数据可视化基本框架
1.1 数据可视化流程
科学可视化和信息可视化分别设计了可视化流程的参考体系结构并被广泛应用于数据可视化系统中。可视分析学的基本流程则通过人机交互将自动和可视分析方法紧密结合。从数据到知识的转化方式有两种途径,交互的可视化方法和自动的数据挖掘方法。过程中用户即可以对可视化结果进行交互的修正,也可以调节参数以修正模型。
在相当多的应用场合,异构数据源需要在可视分析或自动分析方法之间被整合。因此,这个流程的第一步需要将数据预处理并转换,导出不同的表达,便于后续的分析,其他的预处理任务包括数据清洗、数据规范、数据归类和异构数据源集成。在任何一种可视化分析过程中,人都是最核心的要素。机器智能虽然在很多场合都比人的效率要高,但是机器只能承担替代一部分人所承担的工作,并不能够最终决策或对知识进行加工和使用。所以数据可视化的目的并不是替代人的判断和决策,而是为人所用,增强人的能力,提高人的效率。
1.2 数据可视化流程中的核心要素
数据可视化流程中的核心要素包括3个方面。
1.2.1 数据表示与变换
数据可视化的基础是数据表示和变换。为了允许有效的可视化、分析和记录,输入数据必须从原始状态变换到一种便于计算机处理的结构化数据表示形式。通常这些结构存在于数据本身,需要研究有效的数据提炼或简化方法以最大程度地保持信息和知识的内涵及相应的上下文。
1.2.2 数据的可视化呈现
将数据以一种生动直观,容易理解和方便操作的方式呈现给用户,才能向用户传播准确有效而有价值的信息。然而数据的呈现方式有多种多样,如何有效地从众多多样性呈现方式中选择出最佳的视覺编码形式是数据可视化的重要任务。判断一个视觉编码是否符合可视化呈现的因素包括很多方面,如数据本身的属性以及用户感知与认知系统的特性等。大量的数据采集通常是以流的形式实时获取的,针对静态数据发展起来的可视化显示方法不能直接拓展到动态数据。
1.2.3 用户交互
对数据进行可视化和分析的最终目的是解决特定的任务,这些目标任务通常有生成假设、验证假设和视觉呈现三类任务。数据可视化可以用于从数据中探索新的假设,也可以证实相关假设与数据是否吻合,还可以帮助数据专家向公众展示其中的信息。交互是通过可视的手段辅助分析决策的直接推动力。有关人机交互的探索已经持续很长时间,但智能、适用于海量数据可视化的交互技术,如任务导向的、基于假设的方法还是一个未解难题,其核心挑战是新型的可支持用户分析决策的交互方法。这些交互方法涵盖底层的交互方式与硬件、复杂的交互理念与流程,更需要克服不同类型的显示环境和不同任务带来的可扩充性难点。
2 数据可视化
2.1 点数据可视化
点数据描述的对象是地理空间中离散的点,具有经度和纬度的坐标,但不具备大小尺寸。这是地理数据中最基本也是最常见的一种,如地标性建筑、区域内的餐馆等。常用的点数据可视化方法将对象根据它的坐标直接标识在地图上。如图1所示地图标出了北京市某区域所有的加油站。圆点是最常用的标识符号,本例中采用的是红色的圆点。可以看到,加油站沿主要街道分布,在绿色的风景区相对少一点。数据对象的其他属性可以用其他视觉元素表示,如大小和颜色可用于表示数值型属性。
除了圆点,其他符号也可以被用作地图上的标识。当数据对象属于不同类别时,通常用不同的符号区分。图标或符号的选取需要遵循一定的原则。第一,符号必须直观且符合常识。例如,用刀叉表示餐厅,用大写的字母P表示停车场。第二,符号的数量不宜太多。当不同的符号太多时,用户难以记住每种符号的意义。最重要的是,可视化必须有图例来解释各种符号的意义。
总体而言,用圆点在地图上标识点数据非常有效,符合人们看地图的习惯,可以在有限的空间中显示较多的信息。但是,当数据中有海量的点数据需要在地图上标识时,点之间会产生大量互相重叠的情况。特别地,当区域数据分布不均时,数据密集的方会有大量的点相互重叠,而数据稀疏的地方则空白居多。
2.2 线数据的可视化
在地理空间数据中,线数据通常指连接两个或更多地点的线段或者路径。线数据具有长度属性,即所经过的地理距离。常见的例子是地图上两个地点之间的行车路线。线数据也可以是一些自然地理现象,例如河流等。最基本的线数据可视化通常采用绘制线段来连接相应地点的方法。在绘制连线的时候,通常可以选择采用不同的可视化方法来达到最好的效果,如颜色、线的类型和宽度、标注都可用于表示各种数据属性。当然,也可通过对线段的变形和精确计算放置的位置减少线段之间的重叠和交叉,增加可读性。
3 城市交通大数据的地图可视化效果实现
3.1 数据准备与预处理
现有的数据来源为:公交车基础线路数据、公交车GPS 数据、公交车刷卡数据,出租车GPS数据,地铁基础线路数据、地铁刷卡数据。如图2为公交线路空间数据。
3.2 基于公交刷卡数据的站点客流量可视化
利用公交刷卡数据统计站点的客流量上车人数与下车人数。将公交站点分颜色级别表示客流的登量与降量,红色表示登入量,绿色表示登出量。在站点处绘制圆圈,圆圈大小表示总客流量(登入量+登出量)。效果如图3所示。
另外,利用三维视图可以更加生动地显示其站点的客流量大小。在倾斜的地图上,用有过渡效果的图片来表示立体柱子,标定在地图中具体的公交位置上,用柱子的高度表示流量的大小。
3.3 基于公交线路数据的流量和速度可视化
利用公交刷卡数据统计公交站点间的流量,以透明度叠加来显示流量的大小。浓度大的站点间线路表示客流量大,浓度低的表示客流量小。可以将流量数据以热力图的效果展现出来(如图4所示)。
4 结语
可视分析技术为我们提供了一种直观有效的方法。它将复杂的交通数据及其分析结果通过可视化方式直观地展现出来并支持对结果的交互式筛选和浏览。此外,当人们从可视化产生的图像中发现一些意料中或者意料外的特征时,也可以启动分析算法来有针对性地自动深入挖掘交通信息。
参考文献
[1]姜炜.大数据进入ZB时代[J].网管员世界,2012(14):14-15.
[2]范琳琳.可视化数据挖掘研究[J].吉林省教育学院学报,2006(9):43-44.
[3]黄江涛.多维数据及数据挖掘结果可视化研究与实现[D]. 西南科技大学,2005.