东南大学物联网交通应用研究中心
东南大学物联网交通应用研究中心
北京时间:
吴祥国:大数据背景下重庆交通模型维护升级的新探索
2016-03-15 15:02   作者:iitraffic   来源:城市数据派   浏览:1401   我要评论
    作者简介:吴祥国,现就职于重庆市交通规划研究院交通信息中心,主要从事城市交通模型方面的研究与项目应用分析工作。分别在《武汉理工大学学报(交通科学与工程版)》、《交通信息与安全》、《交通运输工程与信息学报》、TRB年会、ICCTP年会、城市交通规划年会等国内期刊、国内外学术会议中发表学术论文多篇。
    交流主题:城市交通模型的维护升级是一项长期工作,在大数据技术不断更新完善的背景下,有必要探索新的模型维护升级技术和方法。本报告基于长期的研究成果,重点阐述了重庆的手机数据、RFID数据、车辆GPS数据、公交IC卡数据以及开源数据等多种大数据类型在重庆交通模型维护升级中的应用。

【本期交流全景记录】






    大数据的4V特征大家应该比较清楚,一个是大体量,还有多样性,价值密度比较低,传输速度比较快。这些特点我就不细讲了。我主要针对我们各种交通技术多讲一下。



    我们重庆交通大数据从2011年开始提速进行各种数据库的构建,特别是我们规划局和院里对这个比较支持,每年大量投入,所以我们能够坚持下来。第一期试点从2011年开始,现在基本建成了主城区的交通基础设施规划数据库,交通基础设施现状数据库,实现了主城区整合一张图。有了数据库之后,把相关的数据源放进去,然后通过跨部门协调,在多个部门的帮助下,实现了如流量监测、车辆GPS数据、手机信令数据、RFID数据、停车诱导数据等多个数据源放入这个数据库中,还有交通运营状态的数据库,特别是交通运行指数、车速等。这些数据库目前是为局里和单位内部进行服务的。


    接下来讲讲我们大数据平台。这个平台的数据很多是来自于二级数据源共享得到的。数据源是不是都是来自二级平台?这么说,我们的静态设施数据、规划用地数据、道路网数据,都是我们单位自己采集构建的基础静态网络。有些动态数据源,就是规划局或交通院没有的数据源,比如GPS数据、卡口、线圈、IC卡,是我们没有的数据,就通过战略合作、项目合作、数据共享等方式获得,有些还是花费了一定费用收集的。


    数据是很重要的,在国内收集也比较艰难,我们进行了4年,有些数据还在跟进的过程中,或者是在断断续续的收集。目前收集的数据主要是静态的设施数据,另外还有10多类动态数据。有了丰富的数据源之后,可以为我们平台和模型的构建以及项目应用提供有力支撑。

    接下来我们重点阐述几块内容:按照数据的类型分类,一个是手机数据,包括在人口和用地、岗位方面的应用,如职住分析、出行分布、出行方式识别方面的探索;另一个是RFID数据,就是电子车牌的数据,可以用于出行分布特征分析;第三个是VDF函数的应用,有了大数据之后,可以将VDF函数种类划分更细,因为之前如果是根据调查数据来做的话,VDF函数很难做细,因为样本量少,而且花费的时间和费用是非常多的;第四个是公交大数据在公交线网中的应用,构建技术是简单的,复杂是因为涉及的线路特别多,要完整的维护和更新起来很费时费力;最后一个是利用公交IC卡、GPS数据以及轨道闸机数据反推出公交出行OD矩阵,在公交专项应用中比较重要。


    首先介绍下手机数据是怎么接入进来的, 2011年我们刚开始要构建平台的时候,因为市局领导比较重视,在领导出面下,我们和移动、联通公司签订了一些战略协议,首先接入的是手机移动2G数据,12年底才把联通的数据接入。重庆的移动数据只包含了主城区以及周边19个区县,约2.7万平方千米,3万个基站,就是大都市区的范围。联通数据的检测范围覆盖了市域范围,面积是8.24万平方千米,有2.5万个基站。


    因为两个数据源采集方式不同,造成很大区别,数据质量也有差别。我们后续正在逐渐接入4G数据。我们采集的数据类型移动和联通都差不多,就是经常讲的手机信令数据,主要包括通话信息,包括主叫被叫接发短信,还有正常位置更新、周期位置更新,最大比例的信令数据是位置更新,占了一半多比例。


    手机数据记录了位置编号,特别是基站的编号,通过长期的手机数据训练,分析居住地和工作地。其中居住地一般晚上到达,持续时间比较长,所以比较容易跟踪。白天的工作地和工作性质有关,很多类似送快递的就不适用,所以我们说手机数据就是记录了通勤人员工作地,后面研究职住分析,也就是研究通勤的规律。这个图大家应该看到过,通过手机数据发现每日出行规律,来研究他的出行规律,是在ORACLE的数据库里进行长期的训练的,基本用1个月或者2个月的数据来进行跟踪,得到他的居住地和工作地,然后对应得到他的居住和岗位。


    因为手机数据只是样本,后期更重要的是扩样,这个是比较难的,因为不太清楚它的绝对数,不过做有些相对关系时倒不是特别影响,特别是研究职住分析,可以清晰的发现夜间人口居住密度分布图和白天岗位密度分布图还是比较靠谱的。我们可以发现岗位密度较高的区域都是在内环以内的,所以可以说对大范围分析还是比较有作用的。另外就是职住比,因为重庆市组团特征非常明显,所以职住平衡还是比较好的,除了最中心区的渝中组团职住比非常高,一些周边商圈的职住比就比较好。另外因为我们掌握了通勤特征,所以就可以研究职住错位现象,因为职住比只是静态的数据,反映有多少人有多少岗位,职住错位是可以反映交通情况,比如我在这住,我不在这工作,有可能职住比很好,但有明显的职住错位,像人和、礼嘉等区域的职住错位现象就非常明显,说明外出就业、就学的比例非常高。



    另外一个就是总结各个组团的通勤出行特征,因为我们之前的居民出行调查也发现重庆出行特征是相邻组团和跨组团的出行特别的多,现在通过手机数据也发现了这种特征,这也验证了手机数据分析结果的可信性,特别是在组团级别。



    此外,我们利用手机数据分析了几个重要的对外枢纽和重要商圈的出行分布特征,在这个分析过程中做出了一些结果,但是总的来说效果不是特别好,因为重要枢纽和周边居民区没有明显边界,本身手机边界比较模糊,所以这块一直没找到很好的办法,只能大致分析。其次因为重庆联通数据跨市域范围,所以我们也研究了市域跨区的交换量,可以看到哪些地区的交换是最密切最频繁的。


    最后就是手机数据在出行轨迹一些方面的识别,因为传统2G数据定位精度低,数据量比较少,现在4G数据存在微站定位,甚至可以定位到建筑内部的房间,定位就比较精确。同时因为现在网络发达,大家上网比短信、电话业务多,所以引起了我们注意,由于数据比较丰富,减少了扩样带来的误差,所以在轨迹跟踪、出行方式识别等方面发挥比较重要的作用。利用4G数据之后可以比较清晰的知道一个用户大概什么时刻出发,什么时刻到达工作地,能够比较清晰的找到出行时间点,可以大概知道本次出行对应的时耗是多久,对比百度地图中对应出行方式的出行时耗,发现是比较一致的,这也为我们出行方式的识别提供了很大帮助,是很好的参考,可以推测出这个人的出行是通过公交还是开车。



相关阅读
发表评论
姓名:
联系方式:
评论专区
东南大学 东南大学交通学院 清华大学 同济大学 西南交通大学 北京航空航天大学 上海交通大学 浙江大学
University of Wisconsin - Madison University of Michigan Rensselaer Polytechnic Institute Santa Clara University Rutgers University
交通运输部路网监测与应急处置中心 江苏省交通运输厅 南京智库联盟 江苏交通控股有限公司 江苏高速公路联网营运管理有限公司
中心概况研究动态新闻中心合作交流加入我们
Copyright © 2019 东南大学物联网交通应用研究中心 All Rights Reserved.