共享单车数据作为交通大数据的一个重要组成部分,在现代城市交通管理和规划中发挥着越来越重要的作用。通过对共享单车的数据进行深入分析,城市管理者和规划者能够获得大量有价值的洞察,这些洞察不仅有助于了解城市居民的日常出行模式,还能揭示出热点区域以及不同时间段内的交通流量分布情况。例如,通过分析哪些地区在早晚高峰期间的单车使用频率最高,可以识别出那些通勤需求较大的区域,从而更好地调配公共交通资源,减少拥堵现象。此外,共享单车数据还能帮助评估共享单车与公共交通系统之间的相互作用。共享单车常常被用作与公共交通的衔接工具,尤其是在解决从公共交通站点到目的地“最后一公里”的问题上表现突出。这种互补性使得居民能够更便捷地完成整个出行链,提高了公共交通的整体吸引力。

本文的重点是数据分析,来窥探共享单车轨迹数据背后的特征。

数据简介:2021数字中国创新大赛公布的厦门市2020年12月21日-2020年12月25日五天的共享单车轨迹数据。数据链接为:2021数字中国创新大赛大数据赛道-城市管理大数据专题 - 赛题数据 (xm.gov.cn)

数据字段:开始时间、开始经度、开始纬度、结束时间、结束经度、结束纬度、用户ID、企业ID

这里我们需要一些SQL知识,方便对数据进行处理,我们把数据导入数据库后进行数据处理,这里用的是oracle数据库作为处理数据的基础库,这里我们以2020年12月21日 上午06:00-10:00,也是数据源里面的第一天数据,我们先来看看数据有哪些有效信息,一个是唯一的单车ID,我们用语句查询一下总量,78860条,也就是4个小时,同时也包括一个出行早高峰,平均每小时产生接近2万笔订单,可见厦门市对共享单车的需求之大

再来看时间,可以看出来每15秒就对单车进行一次打点,记录坐标位置,那我们选择一辆单车的ID并根据时间变化,把单车的行驶轨迹在地图上展现出来呢,我们可以看到单车的完整时间轨迹,并且时间颗粒度为15秒

我们把这些数据都作为单独的出行轨迹连起来,当然这里面也存在一部分无效的漂移点,我们暂且忽略不看,我们先来研究一下总体特征,可以看出湖里区去和思明区的轨迹线非常密集,说明岛内的共享单车出行方式更受欢迎,再结合上篇文章的公交的数据特征,也可以说是岛内公共交通的出行方式跟受欢迎或者说更加便捷,上篇文章:利用高德API获取整个城市的公交路线并可视化(四)-CSDN博客

再来看一下,大家的早高峰出行时间,我们把所有单车ID的最早产生时间提取出来,并按小时进行统计,可以看出来一半以上的人在6:00:00—6:59:59这个时间段出行,对了查了一下那天是周一,岛内选择共享单车作为出行方式的人,出行时间还是比较早的;

我们再来看看大家的出发地和目的地分布情况,我们叠加起来看更为直观,绿色是出发地,红色的为目的地,可见几乎重叠,说明大家使用共享单车还是以短距离出行为主,且湖里区去和思明区使用共享单车作为短途出行的用户更多

然后我们来看看分小时的出发地分布情况;

早上6点(6:00:00—6:59:59)

早上7点(7:00:00—7:59:59)

早上8点(8:00:00—8:59:59)

早上9点(9:00:00—9:59:59)

可以看出分小时的整体出发地分布情况基本保持一致,湖里区去和思明区作为出行主力军,同时以湖里区、思明区、周边的集美区和海沧区围绕着马銮湾为圆心各自形成小的组团热点出发地

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐