物流干线车货匹配推荐调度系统

微风

2019/03/24 发布于 技术 分类

文字内容
1. 让天下没有难运的货物 ---公路干线运输的AI应用 罗竞佳 满帮集团运满满大数据总监
3. • 公路干线物流 • 车与货匹配的场景 • 调度和车货匹配的深度学习方案 • 价格、自然语言处理和证件识别等场景
4. PART1 公路干线物流
5. 物流与生活 亚利桑那,US 300美元 . 圣芭芭拉,US 400美元 大连港 3600元 一盘青椒肉丝= 亚利桑那+达曼+大同+上海 标准的农产品物流占比一般在70% 以上。煤炭矿石是80%。
6. 中国物流的宏观 中国物流的特点是大而复杂。 2017年公路运输费用8.0万亿,物流总成费 用12.1万亿,占GDP14.6%。物流运输总额 252万亿,主要来自装备制造、矿产、技术 产品。以上三者占90%(234万亿)。 平均运输距离429公里,累计运输量336亿 吨。 轻工业品 粮食 机电设备
7. 中国物流的微观 在这个大市场中,地区性差异,季 节性差异,参与其中的玩家众多: 个体司机,车队老板,物流公司, 黄牛,3PL,工厂,连锁集团等 等。 他们的生活环境复杂恶劣。这些小 而散的玩家构成了中国公路干线物 流的主体。
8. PART2 车货匹配的场景
9. 车货匹配的场景 司机基本属性,挖掘属 货主基本属性,路线, 天气,供需,价格,当 性,兴趣,常跑路线, 品类,重量/体积,装 地出产,季节,口岸 车辆,位置 卸,位置 车 环境 货 基于公平性: 后验策略----冷热分桶 浏览 排序 基于效率: 预测----电话点击 点击 预测 FFM LR XGBOOST Deep Learning 电 话 成 交 中心指标:反馈率,成交率 间接指标:空驶率,反馈(成交)时长,月使用次数和里程(用户粘度) 1. 货主发货,司机找货。 2. 货主是付款方。司机提 供服务。 3. 司机希望价格尽可能 高,货主希望价格尽可 能低。 4. 司机有很多场景:回 程,附近等。 5. 货主有时间效率的问 题。司机则对时间不敏 感。 基于公平性: 后验策略----冷热分桶, 打压和均摊曝光。 基于效率: 预测----电话点击。提升 CTR,降低司机找货难 度。
10. 车货匹配的路线场景
11. PART3 调度与车货匹配的深度学习方案
12. 整车调度和推荐 𝑠𝑐𝑜𝑟𝑒 = ' 𝑠(𝑡𝑖𝑚𝑒, 𝑙𝑜𝑐𝑎𝑡𝑖𝑜𝑛, 𝑙𝑒𝑛𝑔𝑡ℎ, 𝑡𝑦𝑝𝑒) = ' ' 𝑚𝑎𝑡𝑐ℎ(𝑡𝑟𝑢𝑐𝑘8 , 𝑐𝑎𝑟𝑔𝑜9 ) 9,8 求一个 max(score)
13. 基于深度学习的车货匹配 x为输入,y为输出,z为样本x的label。 y 是输出为1的概率,1-y是输出0的概率。我们当然希望z=1,y最大,z=0时y最小。 就是极大似然估计。那么全部样本求-log的极小化作为损失函数O: 𝑦 : (1 − 𝑦)=>: [1,2,3] -> [0.09,0.25,0.67] ->[0,0,1] 以0.67的概率取[0,0,1] 回到我们要解决的问题上,我们是个多分类,z是个[0,1,0] 问题就变成了求O的最小值,让神经网络的 参数反响传播 𝜕𝑂9 𝜕(−l n( 𝑆9 )) = = 𝑆9 − 1 𝜕𝑓BC 𝜕𝑓BC 假如z=[0,1,0]则有[0.09,0.25,0.67] -> [0.09,-0.75,0.67]
14. 车货匹配的效果 货源订单转化:11%-16% 24小时反馈率:64%-68% 20分钟反馈率:30%-34%
15. PART4 价格,内容和风控的智能需求
16. 区域供需预测和定价 V1.0 基数 ∗ ∑ (路线报价 ∗ 路线权重修正) ∑ (基数日路线报价 ∗ 路线权重修正) 400万用户*700 日 特征抽取组 件 起点城市 气候 违章 车长 1200个特征搽搽 V2.0 60万货源*700 日 线性 特征 周期 特征 时序 特征 噪音 𝑃𝑟𝑖𝑐𝑒 x = (ρ∗ + ρL − ρ∗ e>N + PCA F 𝑥 线性成本LR模型 傅里叶模型 LSTM模型 标准用户模型 集合模型 风控模型 [ O>P Q ρ=𝑥 + Wavlet(𝑥 ` L ∗ (RNN 𝑥 d )) ' ceL 𝑥 a = wc 滤波模型 𝑥 𝑥 𝑥 𝑥 𝑥 = V [ ` a 代表地区因素和不变成本。 代表供需和价格。 代表呈现周期性的特征。 代表噪音较大的向量特征。 代表距离,油价,重量等线性特征。 + 𝑥 V
17. 货源内容场景 特征工程:vsm向量空间模型。基 础的文本相关性算法模型。使用 fast-text的文本向量化,寻找同 近义词。使用doc2vec实现货源 类型分类。 1 0 一 装 一 一装一卸 塑料颗 粒 上午装货 卸 塑料 颗粒 上午 装卸 1 1 1 0 1 0 1 1 0 1 原始样本 从备注中 识别货源 类型 特征工程 训练样本 分类模型 测试集合 预测结果
18. APP内容问答机器人 切词 Q=[t1,t2,t3] 词向量 wd2vector t1=v1 词向量分类 v1->category1 词分量贝叶 斯分类 客服QA集 合 todo清单 doc2vec 是否在清单内 N 人工输入 机器解答 doc分量空间 Y 标准问题 空间距离分类 器 doc2vec 是否解决? N 输入问题 切词 标准答案 接入人工 是否有其他问 题? 评分 Y 计算得分 结束 转接人工 N N 是否超过阈值 Y 列出top5答案 Ver1.0 测试问题,机器拦截率 50%。 Y
19. 证件识别与风控 自然语言 识 证件 OCR识 别 人脸匹配 和比对技 术 高精地图 和路线意 图识别 正在申请人脸识别的软著和专利权