瓜子二手车 魏旋 - 机器学习中的人机互动

燕雅香

2017/12/18 发布于 技术 分类

ArchSummit全球架构师峰会是InfoQ中国团队推出的面向高端技术管理者、架构师的技术大会,参会者中超过50%拥有8年以上的工作经验。 ArchSummit秉承“实践第一、案例为主”的原则,展示新技术在行业应用中的最新实践,技术在企业转型中的加速作用,帮助企业技术管理者、CTO、架构师做好技术选型、技术团队组建与管理,并确立技术对于产品和业务的关键作用。

文字内容
1. 机器学习中的人机互动 魏旋 瓜子二手车数据科学家
5. 魏旋 瓜子二手车数据科学家 2010年加入Hulu,负责广告精准投放技术研发 2013年底加入宜信大数据,负责实时授信,风控反欺诈的研发 2016年加入瓜子,负责个性化和推荐,图像识别处理,智能问 答,车源、客户画像,调度等技术研发
6. 策略和人 •  人是统计数字
7. 策略和人 •  目标 •  提高产出 •  提高转化率
8. 策略和人 提成: 产出 * 转化率
9. 策略和人
10. 当人与系统深度交互 •  人不可忽视 •  人是博弈主体 ᕮຎ! Ո! ๢࢏਍ ԟ!
11. •  销售调度 - 能力建模 •  销售调度 - 匹配度建模 •  销售调度 - 对人建模 •  销售调度 - 结果和总结
12. 销售调度 •  分车到人 买家 卖家 买家 卖家 买家 卖家
13. 能力建模 •  目标 •  最大化平台车源总体转化率 •  思路 •  转化率高的销售,值得分更多的车
14. 能力建模 - 方案 •  Explore & Exploit •  优秀者分好车,分更多的车 •  成长者维持基本工作量 •  是优化,也是激励
15. 能力建模 - 车源分级 •  车源分级 •  性价比 •  热销 •  其他
16. 能力建模 - 结果
17. 能力建模 - 转化率 norm_y! 9! 8! 7! 6! 5! 4! 3! 2! 1! 0! 2! 3! 9! 14! 15! 31! 34! 35! 36! 37! 40! 42! 43! 47! 50! 52! 53! 54! 56! 58! 59! 60! 61! 64! 65! 66! 69! 70! 72! 73! 76! 77! 88! 89! 96! ᫣რᰁ! ౮Ի !ᰁ
18. 能力建模 - 售卖预测 2.5! 2! 1.5! 1! 0.5! 0! Baseline! MAE! ‫ړ‬ᯈ෫‫!ى‬ ‫ړ‬ᯈፘ‫!ى‬
19. 匹配度建模 •  目标 •  一辆车应该分给最可能把车卖掉的人 •  思路 •  如果销售的客户想买这辆车,售出概率就高
20. 匹配度建模 – 方案 •  可以直接使用车源推荐服务 •  如果把车分给没有合适客户的销售,增加惩罚
21. 人很重要 2! 1.8! 1.6! 1.4! 1.2! 1! 0.8! 0.6! 0.4! 0.2! 0! ᲀ !ᰁ ፘ੒ᲀᰁ! ෭๗!
22. 距离优化 •  目标 •  减少销售路程消耗 •  建模 •  每辆车到销售的距离之和最小
23. 距离优化 – 方案1 •  有约束聚类 •  每个cluster对应的车源数是指定的 •  修改K-means算法 •  E-Step,交换车源代替重新分配
24. 与K-means对比 •  K-means •  记录中心点 •  修改的K-means •  记录两个中心点之间的边界
25. 距离优化 - 方案2 •  距离定义 •  物理距离 + 每个销售额外cost
26. 距离优化 - 效果
27. 工单均衡 •  目标 •  让销售每天的工作量大致平均 •  思路 •  避免销售每天的工单量超出能力范围
28. 工单均衡 - 方案 •  预测每辆车接下来一天工单量 •  根据当前任务量、预测的未来任务量分配 •  如果超出一般工作量的分配,增加惩罚 ො૧ Baseline ᶼၥ
29. 公平 •  业绩越好,分车越多 •  业绩好,车源质量不能差 •  业绩好,单车平均提成不能差
30. 对人建模 - 面对压力 •  积极响应 •  忽略细节 •  有所选择
32. 整体模型 ᚆ‫ێ‬ཛྷࣳ! ᕅ๳! ‫܃‬ᯈཛྷࣳ!
33. 结果 – 人效 & 人数 ࢶᤒຽ᷌! ୭Ӟ۸Ոප! ୭Ӟ۸Ոහ! 2.0! 1.8! 1.6! 1.4! 1.2! 1.0! 0.8! 0.6! 0.4! 0.2! 0.0! 1! 2! 3! 4! 4! 4! 4! 4! ෸ᳵ!
34. 结果 – 7天漏斗转化率 ᄋ෎᫨۸ !ሲ 160.0%! 140.0%! 120.0%! 100.0%! 80.0%! 60.0%! 40.0%! 20.0%! 0.0%! ୭Ӟ۸᫨۸ሲ! ෸ᳵ!
35. 调度经验总结 •  从博弈角度看待人 •  简单就是美 •  变量越少越好 •  在子问题上机器学习可以发挥最大作用 •  小心探索未知状态