东南大学物联网交通应用研究中心
东南大学物联网交通应用研究中心
北京时间:
陈水平:高德交通大数据在城市交通分析方面的应用
2016-01-30 16:57   作者:iitraffic   来源:数据派   浏览:1128   我要评论

    主讲人:

    演讲全文:陈水平:大家好,很高兴今天有机会跟大家交流一下高德在应用大数据研究方面的收获。我叫陈水平,也叫追兵,每一个阿里员工在进入公司的时候都要自己给自己起一个名字,我给自己起这个名字,希望自己向遇到的每一位大师学习,奋起直追。



    拿到这些数据以后我们处理的流程遵循这样一个逻辑:最基础的格式是GPS点,这个点跟普通的定位点不一样,一般每隔几秒钟、一分钟,它是连续的点的序列的信息,能够完整的复现一个用户出行的轨迹。我们从这些点中做一些切分,得到具有明确的出发地和目的地的轨迹,基于此,我们根据拥有的地图数据把他匹配到地图上,再做一些数据挖掘方面的研究。

    GPS回传数据是我们最重要的数据,我们内部搭建一个实时处理的系统,把这些分布式消息列队,我们会把这些数据拿到做实时的处理,计算每条道路当前速度信息,结合道路等级发布他的拥堵状态,这是我们核心产品。

    下面讲一下存储和运营。最主要对实时数据的管理和监控,首先你要监控你的数据的量是不是发生最大的变化,一旦有异常就报警。你要保证你核心产品发布的路况信息的准确性,如果用传统方式来看,你只能开一辆车到路上,看是不是堵,跟我们发布的信息比较,这种方式成本非常高。我们内部开发了一个自己的自动化评测的系统,它通过挑选一些非常可信的GPS回传的终端样本,通过经过道路的状态和我们发布的状态做一个比较和自我校验,如果不一样的话,我们会自动的报警。


    下面讲一下我们基于这些数据掌握的应用。第一,交通报告,针对全国40多个城市做交通的数据挖掘,它的道路拥堵情况,道路拥堵的成因。北京2014Q3季度每日拥堵的曲线图,横轴是日期,纵轴是拥堵指标。如果指数是2,你在高峰期出行,你所花费的时间是在你畅通时间的两倍。红色点表示周一,蓝色点表示周五。周五是最堵的,经过这条绿线,转化成了最堵的是周一,周一就变成了一周里面最拥堵的一天。考虑到中国尾号为4的车辆比较少,所以限号4的车比较少,出现在路上的车就多了。



    我们还有一个很重要的功能,把我们的交通信息,路况信息和导航合在一起。躲避拥堵,我们可以发现三环上整体的拥堵情况是比较明显的,如果使用了躲避拥堵功能,我们自动会为你推荐走四环的路。因为你从一个起点到终点,有很多不同方案,如果你只凭经验去走,不如用信息的手段得到最优的方案。今天我来如果没有用躲避拥堵这个功能的话,我可能就会迟到了。


    我们利用大数据反哺我们自己产品的功能,左边的有些点不在路网功能之上,一个是噪点,一个是新的路。我们跟清华大学另外一位教授合作,得到了这样一个结果:通过一些特征的抽取,把可能是新路的东西由点连成线,提供给地图的更新部门,提高线路更新的频率。

    简单总结一下。

    第二,交通大数据的处理。道路和数据结合在一起,进行了大数据的挖掘,我们提供一种响应度非常高的数据质量运营的产品。



    地图数据和业务反馈的日志的数据都没有包括在我这个演讲当中,因为很多专家朋友抱怨获得数据很难,我们今年部门一个重大的项目是要做一个数据开放平台,希望明年的时候能够向公众开放可以免费获得大数据。只要你可以拿出让我们眼前一亮的方案,我们可以签订协议,提供一次性大数据给大家,如果您无法处理一次大数据,我们能够分配我们的工程师帮助您处理成您所需要的格式,所以一次大数据、二次大数据都没有问题;而且我们还可以提供必要的项目经费支持。

    下周我们会有2015Q1季度交通报告的发布,也希望感兴趣的朋友关注一下。谢谢大家!

相关阅读
发表评论
姓名:
联系方式:
评论专区
东南大学 东南大学交通学院 清华大学 同济大学 西南交通大学 北京航空航天大学 上海交通大学 浙江大学
University of Wisconsin - Madison University of Michigan Rensselaer Polytechnic Institute Santa Clara University Rutgers University
交通运输部路网监测与应急处置中心 江苏省交通运输厅 南京智库联盟 江苏交通控股有限公司 江苏高速公路联网营运管理有限公司
中心概况研究动态新闻中心合作交流加入我们
Copyright © 2019 东南大学物联网交通应用研究中心 All Rights Reserved.