中国首份共享用车大数据研究报告——以快车拼车为例

中国首份共享用车大数据研究报告——以快车拼车为例
2017年03月22日 08:52 学者刘璐

文:刘 璐

西南财经大学经济学院 副教授、博士生导师

留美经济学博士

知名财经评论人

新浪微博:@学者刘璐

微信订阅号:liulu_cd

================

【编者按】您可能经常使用滴滴出行或类似的共享用车软件,但您不一定了解共享用车背后的规律。本文将以目前国内最大的共享经济样本——滴滴出行——来作为案例,通过先进的大数据分析工具,深入地研究共享经济对人们出行的影响。本文将通过严密的量化分析,剖析拼车成功率的影响因素,深入地并探讨和论证共享用车对治理城市交通问题的潜在贡献。

================

(一)引言:共享经济影响中国

共享经济正在深刻地影响着中国。这是随着互联网的飞速发展,让我们的衣食住行等方方面面都在加速发生改变的典型范例。曾几何时,Airbnb和Uber还是比较时髦的词汇。而如今,除了满大街的“滴滴”,还有随处可见的共享单车。对于投资界的人士来说,你还没搞懂共享经济是什么,他们已经在讨论下一个风口了。而对一些财经人士来说,2017年共享经济将迎来黄金期,也是困难期。对于普通老百姓来说,可能不清楚那么多的专业术语,但确实能真切地感受到,共享经济正在从方方面面让我们的生活变得更为便利。

2016年1月11日,滴滴出行公布了2015年订单数:滴滴出行全平台(出租车、专车、快车、顺风车、代驾、巴士、试驾、企业版)订单总量达到14.3亿。这一数字相当于美国2015年所有出租车订单量(约8亿,数据来源:IBISWorld及Statistic Brain)的近两倍,超过Uber成立6年累计的10亿订单数。根据滴滴出行于2016年3月发布的数据显示,该平台日均订单突破1000万,成为国内仅次于淘宝的第二大交易平台。

更加值得关注的,是滴滴出行的拼车业务的快速发展。据2016年底的数据显示,在滴滴出行平台里每天有600万人次是通过拼车和顺风车的方式出行的,也就是我们说的共享出行。车费便宜,是不少乘客选择拼车的主要原因之一。此外,据估计每天通过共享出行节省下来的能源换算成碳排放量,相当于1万亩树林的生态补给,这对于人类生态环境的改善和节能减排、减少交通拥堵等具有非常大的意义。

本文将以目前国内最大的共享经济样本——滴滴出行——来作为案例,通过先进的大数据分析模型,深入地研究共享经济对人们出行的影响。本研究将分为三个核心部分:首先,本文将剖析滴滴出行的快车业务及拼车背后的经济规律。第二,本文将定量研究拼车成功率的影响因素。第三,通过前面的数量分析和研究,本文将对如何进一步改善和提高拼车这一典型的共享经济形态的效率给出建议。

================

(二)滴滴出行订单背后的故事

也许您经常使用滴滴出行打车,但不一定能从整体上对共享用车的规律有所了解。通过对滴滴出行在北京市的快车订单中进行随机抽样所获得的超过30万份经过脱敏的样本(时间跨度为2015年12月3日至2016年1月3日,包含一个元旦假期),本研究发现了很多有趣的现象。现在,就让我们透过这份抽样的样本来看看滴滴出行的快车和拼车业务的整体情况及其背后的经济规律。

一、订单时间

1,一周七天的订单分布情况

订单一周七天分布表

从上表可见,周四的订单数量总是最多的。而成功拼车订单显示,在周六和周日拼车成功的比例显著下降,均为11%。一个可能的解释就是人们在周末出行的出发地和目的地比工作日更为分散,这使得拼车凑单成功更为困难,从而导致拼车的成功率下降。

2,工作日/周末的订单分布情况

而如果用工作日和周末来区分,那么工作日的总订单占比达70.69%。如果又把元旦大假考虑进去,则包含了元旦假期和普通周末一起的非工作日,订单占比为32.69%。

3,按照一天24小时划分的订单情况

(1)全部订单

对于全部订单的总体样本而言,总体来说,每天下午5点过的订单数量最多,占比达7%。下午6点过和早上8点过的订单数量其次,占比也达7%。紧接着是晚上7点过、8点过、9点过及早上9点过,占比分别为7%、6%、6%及6%。其他从早上7点过到晚上22点过的时段的订单数量差别不大,占比以5%为主。

订单一天24小时分布图(全部样本)

从上面这个订单数量的时段波动图,可以很容易地看出人们每天的出行规律:从早上6点过开始,出行的人就多了起来;早高峰从早上7点过开始,8点过达到顶峰,上午10点以后平缓下来,达到一天的“正常”水平;晚高峰从下午4点开始,下午5点过达到顶峰(既是晚高峰的顶峰也是全天的顶峰),并一直要持续到晚上10点以后才恢复到一天的“正常”水平;晚上11点以后订单数量开始大幅下降,在零点以后下降更多,并一直持续下降到凌晨4点过,达到一天订单数量的低谷。

(2)拼车订单

对于拼车成功的订单而言:下午6点达到顶峰(既是晚高峰的顶峰也是全天的顶峰),占比达11%;一直到晚上8点以后,拼车成功的订单数量出现较大幅度的下降,占比为6%。有意思的是,在晚上9点过这个时段,成功拼车的订单数量又出现了一定程度的上升,占比为7%,这到底是加班的人下班了呢?还是应酬吃饭的人散场了呢?实际上,根据笔者对北京就业市场的调研,北京很多IT和金融行业的从业人员都是在9点和10点之间下班,所以这一时段拼车订单的上升,很可能就是这些加班的人们下班了。晚上10点过,拼车成功的订单数量出现较大的下降,占比为5%;同样地,晚上11点以后成功拼车的数量即大幅下降,直到凌晨六点,这些时段的订单数量占比均为0%。

订单一天24小时分布图(成功拼车样本)

、订单司机

1,司机注册城市

请注意,司机注册城市和司机的户口所在地是两个概念。这一部分的结果仅能反应司机是在北京或外地注册成为滴滴出行的司机,而不能反应其户口是否是北京或外地。

对于全部订单的总体样本而言,整体来说,注册城市为“北京市”的司机排在第一位,占比高达98%。相信这一点毫不令人意外,跑滴滴出行快车的司机还是以在北京本地注册的占绝大多数。即使排在第二位的石家庄市,在订单中的占比也可以忽略不计。而对于拼车成功的订单而言,注册城市为“北京市”的司机数量同样排在第一位,占比更是接近100%。

2,司机在线总时长

本文对抽样样本的研究发现, 成功拼车订单所对应的司机平均在线总时长最大,而且标准差还最小。这说明总体上看“老司机”更容易拼车成功吗?本文后面的分析会为您揭晓答案,为您讲述“老司机”的那些故事。

、空间相关因素

当然,除了上述各种与打车/拼车订单的“非位置”因素相关的各种特征之外,还有更多的与“位置”相关的各种空间因素。限于本报告的篇幅,这里不单独列出。我们在本文后面的影响因素分析中会着重讨论众多的和位置有关的影响因素。从下面的几幅图中,我们可以管窥一下订单位置的空间分布情况。

成功拼车订单出发位置分布图

成功拼车订单到达位置分布图

从上面两幅图不难看出,北京市大多数的成功拼车订单的出发位置和达到位置都在五环路以内。但是如果以长安街及其延伸线为中轴线来看的话,这些订单的位置明显更为偏北一些,这似乎能反映北京市的经济活跃程度是北部大于南部。

成功拼车订单出发位置与车费总额对应3D图

在丘陵状的上图中,对比成功拼车订单的出发位置与车费总额的三维渲染视图,可以看到在城市的东北方向(即首都国际机场方向),车费总额总体上说要高一些,而在市区位置的总车费则要低一些。此外,靠近六环路一带的总车费也显著地比市中心位置要高一些,这和人们的常识是符合的。

成功拼车订单出发位置与司机总在线时长对应3D图

上图像不像一个“蛋挞”呢?这个“蛋挞”图就是成功拼车订单的出发位置与对应的司机总在线时长进行匹配所得到的三维渲染视图。很明显,“老司机”接郊区订单多一些,而新手接中心城区订单更多。特别地,不难发现总在线时长最少的接拼车订单的司机都集中在四环和五环路之间,构成了图中整个“蛋挞”的底部, “新手”们在四环和五环路之间接单较多。此外,我们也发现总在线时长最长的接拼车订单的司机主要集中在六环路的西北角。江湖上关于“老司机”的段子很多,而本文的大数据研究则清晰地揭示出了快车“老司机”们的接单规律。在地图上查了下六环路的西北角,这不就是昌平吗?从六环路的半径来看,昌平的确是距离市中心最远的一个方位了,从这里来往市区的乘客的拼车需求自然大,分摊路费,而且郊区公共交通还不如市区完善,打车出行需求可能相对较高,堵车现象也相对较好,每个订单的效率相对较高。看来北京的“老司机”们都很懂这个经验。

在接下来的部分,本文将使用空间probit、空间面板probit,贝叶斯probit、空间贝叶斯probit等多种先进的统计学模型和方法来对抽样的样本进行定量分析,详细结果请继续往下看。

================

(三)拼车成功率的影响因素

一、和地理位置无关的影响因素

1,订单时间

对于一周七天而言,周三的边际拼车成功率更高,而周末两天则显著地更低。前面已经分析过,周末人们出行的目的地更为分散可能是一个重要的原因。至于一天的24个小时的时间段,本研究发现,凌晨2点的边际拼车成功率最低,即最不容易成功拼车。

2,司机注册城市和总在线时长

运用先进的统计学工具,本研究发现,本地注册的“北京市”对拼车成功率有正面显著影响,而注册地为“廊坊”的司机也被发现对拼车成功有正面显著的影响,可见在抽样时间段,平台上北京司机占多数。此外,本研究也发现司机的总在线时长越长,则拼车更容易成功。看来还真的是“老司机”带你拼车啊!

3,乘车总费用

对于乘车总费用而言,本研究发现总车费越高,拼车成功率也越高。这非常好理解,乘客希望通过拼车来降低乘车费用,肯定是总费用越高才越有这种激励。至于总车费高的原因,一般来说是因为距离更远,有时则也是由于路程更堵。

二、和地理位置相关的影响因素

本文对位置相关的因素进行了详细的非线性空间关系研究。限于篇幅,此处仅摘录边际影响较大且有趣的因素。

1,机场

本研究发现“首都国际机场”对于拼车成功率有重要影响!这一点本文在后面会有专门的讨论。

2,公共停车场

本研究也发现,如果司机接单位置在停车场周边200米范围内,则拼车成功的概率是会提高的。这显示出很多乘客可能是把自己的车放在公共停车场,然后再拼车出去办事。

3,金融机构的服务网点

本研究发现,金融机构的服务网点对于拼车成功率有显著的影响。在其周边2公里范围内,出发的订单都更容易拼车成功。然而订单到达位置的情况则相反,反而会降低拼车的成功率。这说明人们从分散的目的地去金融服务机构办事,完了又喜欢拼车离开。

4,写字楼

本研究同样发现写字楼对于拼车成功率有着极其显著的影响。具体来说,订单出发位置在写字楼周边500米到1公里范围内,以及订单到达位置在写字楼周边2公里范围内,拼车成功率都会显著地提升。对这一个现象的解读非常直接:人们拼车去写字楼上班和下班,这太好理解了。

5,零售商业点

那么零售商业点呢?本研究发现,订单出发位置在零售商业点周边200至500米,以及订单到达地点在零售商业点周边1到2公里范围内的,拼车成功的概率都会显著提升。这好理解,人们拼车去逛街嘛。当然也很可能是商业的从业人员们上下班。

6,医疗卫生机构

对于大型医院而言,本研究发现,司机接单位置在医院周边200至500米,以及订单到达地点在医院周边200至500米的,拼车成功率会显著地提升。看来乘客拼车去医院看病的意愿还是比较强的,毕竟大型医院作为单一到达目的地所吸引的人流还是很大的。

7,学校

学校对拼车的影响如何呢?本研究发现,订单出发位置在学校周边100米范围内,以及订单到达位置在学校周边500米至1公里范围内,对拼车成功率都是有正面影响的。

8,居民区

居民区对拼车有什么样的影响呢?本研究发现,在居民区周边2公里范围内,特别是在500米至2公里范围内,拼车的成功概率是会显著提升的。而如果订单的到达位置在居民区周边200米至2公里范围内,拼车的成功概率同样是会显著提升的。这好理解,人们从家里出发外出再返回家里,都可以拼车嘛。

9,餐厅

对于餐厅而言,本研究也发现,其周边200至500米范围内的接单地址和到达地址,对拼车成功率是有显著地提升的。这是人们拼车去吃饭,难得自己开车遇到堵车和停车难嘛,而且还可以避免酒驾。

10,汽车服务点

很有趣的是,如果订单的出发位置在汽车服务点周边100至200米范围内,则拼车成功率会显著地提升。这是否反应出了一个可能的场景,即很多人把自己的车拿去洗,然后又拼车去其他地方办事呢?

11,区级的大型政府机构

如果订单的出发位置在区级的大型政府机构周边1至2公里范围内,以及订单的到达位置在其周边500米至2公里范围内,拼车率较低。停车不方便、交通管制、单行道等等都很可能是重要的影响因素。

12,旅游景点

旅游景点又是如何影响呢?司机接单位置在旅游景点周边200至500米以及订单到达位置在旅游景点周边2公里范围内,拼车成功率同样会显著地提高。看来,拼车去旅游景点游玩还是比较常见的。

13,公共卫生间

在城市中还有一个神奇的存在,那就是公共卫生间。如果订单出发位置在公共卫生间周边200米至1公里范围内,则拼车成功率是会显著提升的。而订单到达位置就更有意思。总体来看,在公共卫生间周边2公里的范围内,拼车成功率都是会提高的。一个可能的解释,是公共卫生间所在的位置一般来说也是商业区等人流较为密集的地方,所以这也可以从侧面反映出人们拼车去这些地方办事。

================

(四)政策建议

一、提高拼车成功率对于改善交通运行效率意义重大

毫无疑问,作为我国首都的特大城市——北京市——的交通压力是很大的。北京市副市长张工曾指出,截至2015年底,北京机动车保有量达560余万辆,排放的污染物是PM2.5的首要来源。在北京市十四届人大常委会第二十九次会议上,北京机动车保有量在2017年底拟控制在600万辆内的目标被提出,以引导降低机动车使用强度,从而降低机动车污染排放。据测算,当机动车保有量达600万辆时,如不实施交通需求管理措施,早高峰路网平均速度将下降为每小时15公里,高峰时段拥堵指数将达到9和9.5以上,中度以上拥堵时间5小时30分钟以上,这将低于人们可以承受的极限。如果按50%的出行率计算,每天会有300万辆车在北京的路面上行驶,高峰期为什么这么拥堵也不难理解。

北京交通发展研究中心的最新调研发现,北京小汽车发展呈现“三高四低”的特点。小汽车高强度使用且高密度聚集,在全球来看都属最“累”。数据显示,北京市小汽车低于5公里的短途出行占全部出行的40%。而且,这些机动车的80%以上集中在六环范围内,与世界城市“中心城区低,外围高”的机动车保有量分布态势相反。根据罗兰贝格最新发布的数据报告,中国社会车辆的平均载人数量为1.5人,车辆座位资源利用率低下。而拼车是提升车辆座位资源利用率的有效手段。在不增加城市基础运力负荷的前提下,拼车能通过提高车辆的使用率极大地增加汽车运力供给,提高出行效率。显然,只要拼车成功,那么一辆车至少有3个座位(含驾驶员)被利用。对于大型机场周边这种单一目标的来往人流密集的地点,一辆车拼3个乘客是很容易的事情。那么,提高成功拼车的概率会有什么积极的影响呢?显然更多的人拼车,对缓解高峰期的交通压力是有很大帮助的。如果一辆车上拼了3个乘客,那么每多拼一辆车,路上就会减少两辆行驶的车辆。可见,大幅提升特定地点的拼车成功率是显著提高城市交通运行效率的重要举措。

根据相关数据显示,在北京,滴滴出行快车的日完成订单量在2015年底就已超过100万,约为美国纽约同类日订单的8倍。显而易见地,拼车成功率每提高1%,在快车订单总数不变的情况下,对滴滴出行快车“运力”的提升就起码是2%,这就相当于减少了超过2万辆的路面行驶车辆,占比为0.67%(根据前面估算的北京市300万辆路面行驶车辆)。当然,如果能把快车订单的总体拼车概率提高到20%以上的水平,则将减少路面行驶车辆超过32.1万辆,占北京市目前路面行驶车辆总量的10.7%以上。毫无疑问,这对于北京市缓解交通拥堵压力,提升交通运行效率,改善空气质量、节能减排等方面都有非常重要的贡献和作用。咱们可不要小看了这个比例!想想目前在国内各大城市常见并且广受诟病的“工作日限号”政策,其实最多也就只能减少城市路面行驶车辆的20%(有的家庭不得不多买一辆车,则会抵消其政策效果)。而本文的研究成果可以帮助通过提高拼车概率来改善城市交通效率,其功效有潜力可以达到“工作日限号”政策的53.5%以上!您说作用大不大呢?

二、具体措施和政策建议

本研究通过对拼车意愿和拼车成功率的数百种影响因素的边际效应的测算,发现“首都国际机场”是影响拼车意愿和拼车成功率的极其重要的因素。本文的研究发现,在提升拼车意愿的边际影响排名前10位的因素中,和“首都国际机场”相关的因素就占据了5个之多(排名前20的因素则占据了6个),而且更是独霸最大正面边际影响的前4位,并且其对拼车意愿的边际影响程度大幅超过其他各种因素。基本上,订单相关的位置在首都国际机场周边100米至2公里范围内,拼车意愿都很强烈。然而正所谓“理想很丰满但现实很骨感”,纵使首都国际机场周边各范围内的拼车意愿都很高,但本研究也发现只有在首都国际机场周边1公里左右甚至2公里范围内的位置,成功拼车的概率才会大幅上升(订单出发位置在首都国际机场周边500米至2公里范围内对拼车成功率提升的边际影响排在前20位影响因素的头两名,且程度大幅领先于其他各种因素)。此外,本研究还发现,“订单出发位置在首都国际机场周边200至500米”和“司机接单位置在首都国际机场周边1至2公里”均排在对拼车成功率最不利影响因素的前10名。显然,这说明在这个距离内,乘客想拼车但拼不到。

“首都国际机场”对拼车意愿和拼车成功率的边际影响汇总表

实际上,我们都有这样的体会,就是走出像首都国际机场这样繁忙的大机场的到达大厅,打车其实往往很困难,经常需要在打车等候区排很久的队。坐地铁和机场大巴就不说了。这个实际体验和本文的研究结果是高度吻合的。这背后的原因是什么呢?显而易见,在大型机场的到达大厅外紧邻的候车区都是传统的出租车,这使得拼车很不方便。

仅以“订单出发位置在首都国际机场周边200至500米”这个因素为例,从上面的汇总表不难看出,如果我们能改善首都国际机场周边200至500米范围内的拼车体验,那么拼车成功率很容易从“>-6%”的不利边际影响转变为“>5%”,这一正一负就是大于11%的提升。参考前面的估算,这将直接减少超过22万辆在北京的路面上行驶的车辆,占全部路面行驶车辆的7.33%,并且相当于“工作日限号”政策作用的36.65%。而且最为关键的是,这个事情花费的社会成本很低。

根据上面的分析,本文建议,可以考虑在首都国际机场的停车区设立专门的“拼车等候区”,这对提高拼车成功率进而为缓解北京的交通拥堵状况和减少PM2.5排放、改善城市空气质量都会有很大的贡献。

影响拼车意愿和拼车成功率的因素有几百甚至上千种,其中很多因素是很难改变,或是要花费很大代价才能改变的,而且效果可能还很小(用本研究计算出的“边际效应”可以做出精确的度量)。但是本文的研究结果表明,通过在首都国际机场的停车区划定一块“拼车专用等候区”,就可以用很小的代价大幅提高拼车成功率进而缓解城市交通拥堵压力和改善空气质量并促进节能减排,而且能起到立竿见影的效果。这是性价比很高的一个解决城市交通问题的办法。由于机场停车场的拼车专用等候区并未挤占机场到达厅出口处的传统出租车候车区,所以对传统出租车业务的影响其实也很小。

至于“机场拼车专用等候区”的划定,既可以免费,采取城市HOV车道一样的专用技术手段进行管理,这是成熟技术;也可以继续收费,然后由拼车乘客分担停车费就是了。无论哪种方式,只要设立了拼车专用等候区,都可以迅速地大幅改善城市交通状况和交通运行效率。当然,类似于区级的大型政府机构、大型火车站、大型汽车站等人们出行来往密集的地点,同样可以在其周边设立拼车专用等候区,这对交通运行效率的改善也会有很大的提升。

================

【后记】一些研究体会和思考

本研究使用滴滴出行的快车业务在北京市的超过30万份经过脱敏的抽样数据,运用多种先进的空间计量经济学模型和方法来对抽样的样本进行定量分析,并动用大型科学计算工作站进行了海量的运算。笔者为本研究构建了大型的数学模型,并编写了十几万行的运算和分析程序。粗略估算,本次研究的大类运算都是将近6万亿次,至于中间的小步骤加起来那就还要再乘个几万倍。在算残了多台高档电脑之后,笔者最终用豪配的科学计算工作站才得以完成本次研究的计算工作。请注意:本研究所使用和提到的数据,除了由滴滴出行在北京市的订单中随机抽取的经过脱敏的超过30万份快车样本之外,均为从网上搜集到的公开数据。

再谈谈笔者对大数据行业发展的理解。大数据的精髓是一种能力,一定程度上可以说这就是扮演“上帝”的能力。根据笔者的理解,从大数据行业的发展趋势来看,应该包含三个主要的供应端:第一就是数据供应商,第二是算法供应商,第三是计算硬件供应商。用餐饮来打一个比方:数据供应商就相当于农户,算法供应商相当于大厨,而计算硬件供应商则相当于炊/厨具厂商。要做出一道可口的大餐,这三个环节缺一不可。显然,“算法”在这个链条中起着大脑和灵魂的作用。借用本文研究的案例来说,“算法”就是笔者编写的这十几万行运算程序及其背后的经济学、数学和统计学模型。

笔者相信本文抛砖引玉所展现出的大数据研究对行业问题分析和应用的作用已经有所体现。本文的研究成果初步具备了在北京估算快车订单的拼车意愿和拼车成功概率的能力。通过对模型参数进行不断地“校准”,估算精度就可以不断地提高。当然,对滴滴出行拼车的分析和相关影响因素的探索,本研究还只是一个雏形,需要继续深入研究的问题还有很多。

一个必然的趋势是,以后会有越来越多的大数据研究走出高校和科研机构,并在各行各业中落地开花,发挥服务社会的作用。不论如何,大数据对人们生活中方方面面的影响,这才刚刚开始。

- 完 –

2017年3月22日

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部