基于多源交通数据的城市拥堵预测
报告人:李孜
Dalian university of Technology
交通拥堵影响着城市生活的正常运转,相关的研究一直很活跃。大数据时代,深度学习为我们提供了解决问题新思路。

引言
在北京,每年大约有2亿人次乘坐出租车出行。如果能够预测出租车乘客数量变化的趋势,就可以为城市规划者提供帮助,从而减轻交通压力。
Input:
Data, one-hour time window, and location
Output:
Predicted number of taxi pickups at the input time and location
项目进展情况
- 数据预处理(Pandas)
- 建模
- 模型训练
-
数据预处理
数据来源于纽约出租车和豪华轿车委员会(TLC)以及北京市交管局,包括出租车运营商的相关信息。这些信息包括所有出租车每次行程的日期、时间、上车地点和下车地点、路程距离、支付类型、小费数目、总费用。同时我们也爬取了相应的每小时的天气数据。


我们采用Python的Geopy库确定经纬度信息对应地区的邮政编码。我们把原始数据按时间、邮政编码、气温分组,统计每一组对应的乘车次数,把这些聚合后的数据作为可视化的数据集。例如,“2016-04- 01 00:00:00, 49.0, 0, 10001, 375”
利用 python 的 pandas 库进行特征提取,结果如下:
- 天气气温
- 编码 区域
- 时间
- 星期
- 乘车次数
阶段性研究成果
- 以 keras 框架为基础,初步构建简单的 3 层神经网络架构,对十 万级数据进行训练。
-
建模
Data sets
Pre-processing
samples
learning algorithm
optimization
model evaluation
Final model
Prediction
simple neural network
Gradient Descent
MSE RMSE
下一阶段工作计划
- 模型训练,提高泛化能力
- 结果可视化(Tableau)
-
结果可视化
在动态地图中进行数据的可视化,更直观的看到每小时的变化情况。
总结
我们预计用这个模型做到,利用共享数据,对道路交通状态进行预测,并通过交通信息发布方式对外发布。帮助城市策划者和出租车调度者将交通资源合理配置,以及减少拥堵。
中期答辩版 拥堵预测
By Li zi
中期答辩版 拥堵预测
- 228
