AiCon 全球人工智能与机器学习技术大会

机器学习在苏宁易购搜索平台中的实践 李春生

1. 机器学习在 苏宁易购搜索平台中实践 李春生 搜索技术负责人
2. 自我介绍 机器学习在苏宁易购搜索平台中实践 李春生@苏宁易购 2011年年带领苏宁搜索团队⾛走向开源与⾃自主研发历程,从0到1 打造苏宁易易购搜索平台,深耕搜索领域7年年有余,在这7年年的搜 索实战⾥里里,对搜索的理理解与认识更更加深刻。⽬目前负责搜索、推 荐、商品与情报的技术团队管理理与研发等⼯工作。!
3. TABLE OF CONTENTS大纲 • 苏宁易购搜索介绍 • 搜索排序&影响排序内容 • 如何利用机器学习解决搜索问题 • 总结与思考
4. 搜索产品范围 一:从苏宁易购搜索到全产业化搜索 二:从检索引擎到平台化搜索 三:从单一数据结构到多样异构数据整合
5. 搜索总体架构 一:query 重点部分: 分析 二:知识图 谱 三:排序 四:机器学 习
6. 搜索介绍-搜索交互演变 一:关键词检 索,基于文本相 似度 二:图片搜索, 基于图像特征相 似度 三:基于自然语 言召回(成份识 别,主成份提 取、关系推导) 关键词 图像 ⾃自然语⾔言
7. 搜索排序&影响排序内容如何治理? 二、还有什么影响用户排序? 一、LTR->个性化排序->74% 左右的转化(正向优化) 1. 用户query理解深度 2. 异常流量对排序影响 3. 商品错放,图文不一致对排序影响(逆向优化)
8. 搜索整体排序 在线 离线 predict parameters Train& Model Feature HDFS& hbase 引擎排序模块 商品倒 排 特征正 排 KAFKA 召回结果 APP/WAP/ PC等各个终 端 批量学习(天级别) 用户特征 批量学习(小时级 别) 商品特征 实时学习 用户商品交叉特征 排序 用户反馈 KAFKA 1:在线参数更更新基于FTRL!
9. 搜索排序方案-工程 多任务学习 Task1 Task2 Task3 Task4 Task… … 工程特点: 1:共享表 示层 concate 表示层 user profile embedding item embedding cross feature embedding Query User profile Item Cross feature 类 目 预 测 意 图 预 测 Query 输入层 query embedding 成 份 品 牌 偏 好 品 类 偏 好 购 买 力 类 目 属 性 统 计 值 文 本 内 容 交 叉 统 计 匹 配 信 息 2:多任务 学习(个性 化排序、相 关词挖掘、 类目关系挖 掘等….)
10. 搜索排序历程 个性化排序 基于LT R排序 基于人工规则 特点: 1:基于机器学习排序,作为基础排序 2:在机器学习上层采取 个性化因子加权 3:排序上做到千人千面,整体提升5-6个点 特点: 1:商品量大,排序因子众多,难以基于人工拟合,拟合周期 长,需要使用机器学习方式进行拟合,转化率提升至68% 左右 特点: 1:商品量少,排序规则简答,排序因子少,以转化率考核,可 以达58% 左右的转化
11. 搜索影响搜索排序内容 1. 用户query理解深度 2. 异常流量对排序影响 3. 商品错放,图文不一致对排序影响
12. Query理解-纯文本召回 文本召回问题: 1. 错误理解用户意 图 2. 影响二次排序 3. 召回内容海 量,商品内容不相 关影响用户体验
13. Query理解-关系扩展不丰富 一:经验丰富商家, SEO优化丰富,召回 率高 二:如何助力经验不 足商家,提升商品召 回率?
14. 异常流量影响 作弊: 一:影响排序公平性 二:不真实的数据,影响用户体验 异常行为 影响 刷点击 商品排序 刷流量 平台公平 刷订单 搜索转化 刷收藏 用户体验 刷加购 后期机器学习 三:长期不治理,影响LTR排序
15. 类目错挂,图文不一致
16. Query深度理解 1. 成份识别 2. 类目预测&关系扩展 3. query纠错
17. Query分析-成份识别(基于传统CRF) 一:标签(PMC PMB PMM NONE)每个序 列最多2个标签 二:CRF模型,特征提 取相对比较繁琐,依赖 特征组合情况 苹果 手机 双卡双待 XR None PMC None None 三:优点具备考虑隐层 标签转移概率,具有良 好的消歧能力 四:不足之处,在于文 本上下文不兼备,准确 率93%
18. 基于BILSTM-CRF成分识别 PMB BACKWARD LSTM PMM PMM PMC Pmb:0.91 pmm:0.05 pmc:0.04 Pmb:0.09 pmm:0.81 pmc:0.10 Pmb:0.09 pmm:0.79 pmc:0.13 Pmb:0.11 pmm:0.15 pmc:0.74 LSTM LSTM LSTM LSTM CRF-Layer output BI-LSTM FORWARD LSTM LSTM LSTM LSTM LSTM [0.69,0.91,-0.85,0.71,0.73…] [0.33,0.49,0.81 ,0.64,0.97…] [0.44,0.10,0.30 ,0.47,0.38…] [0.69,0.25,0.90 ,0.93,0.89…] word embedding 惠而浦 滚筒 节能 洗衣机 word 1:基于双向LSTM 一:词映射低维空间稠密embedding 二:双向LSTM考虑文本上下文 三:输出层接CRF,考虑标签转换概率
19. Query分析-类目预测 特点: 1:基于query-productcatalog统计模型 2:利用用户行为数据实 时修正预测 3:预测类目在排序因子 加权
20. 成份识别-场景应用
21. Query分析-关系扩展 为什么要扩展? 一:品类词表达多样性 二:地域语言差别导致的实 体名词叫法不统一 三:商家SEO过于简单,影 响商品召回 四:内容召回过少不利于商 品曝光 如何扩展? 一:基于品类(is OR has 二:基于品牌(子母品牌) 三:基于共点击商品query
22. 关系扩展-效果
23. 关系扩展-在对话搜索中应用
24. Query分析-纠错 一:基于热搜词,准 确,但是覆盖率低 二:基于字典,覆盖 率低 三:错词,其实是一 个填空题模型。可以 基于encoderdecoder模式
25. 基于encoder-decoder模式 一:基于双向LSTM 二:单个词,生成序列效率高,满足线上应用 三:可考虑增加Attention机制
26. 智能纠错-效果
27. 异常流量识别 1:基于运营反馈 2. 基于传统机器学习(分类) 3:尝试改进方案(GBDT+LR)
28. 被动发现异常流量 一:问题出现后,被动检查 二:基于日志查询系统进行 流量分析统计与特征发现 三:时效更新有一天延迟 四:研发人员一直在救火 好处: 日常积累大量异常行为语料
29. 特征提取
30. 基于机器学习主动识别异常流量-整体流程
31. 基于机器学习主动识别异常流量-分类器 集成学习 (Stacking) 94% 准确率
32. 异常流量识别-GBDT+LR 交叉特征识别与提取 逻辑回归分类、 准确率:提升3个点左右
33. 类目错挂&图文不一致 1:基于文本Bayesian分类 2:基于(文本+神经网络)监督学习 3:基于文本+神经网络融合的非监督学习 4:共享图像识别内容
34. 异常类目检测—基于纯文本Naive Bayesian 一:标准品识别率81.25% 二:非标准品识别率76%左 右 优点:模型简单 解释性强, 在线检测效率高、上线周期 短 缺点:只关注文本,忽略常 规识别异常(图像)、商品 参数以及特征之间交叉性
35. 异常类目检测—文本+图像特征-有监督
36. 异常类目检测—文本+图像特征-无监督 1:线性时间复杂度(适合海量数据) 2:向量融合,维度需要控制,256维 3:目前采取400棵树 4:无监督整体准确率 92.8%左右 5:召回率高86.3%
37. 异常类目检测—综合输出 综合: 1:类目2000+ 2:覆盖类目800+ 3:召回综合83% 4:准确率 92+%
38. 异常类目检测—模型与准确率对比 模型演进 准确率提升
39. 图片识别-类别提取 1:图片识别介绍 2:图片识别算法部分 4:图片识别工程部分
40. 智能商品识图
41. 智能商品识图—算法基础部分
42. 智能商品识图—算法工程部分
43. 异常类目检测—图像&文本融合 1:丰富模型文本特征 2:以每个算法准确率作为权重综合输出 3:与图片识别共享知识
44. 总结与思考 总结 1:正向优化搜索排序 基于query+item LTR排序 基于query+item+user 个性化排序 工程:model更新OffLine->=NearLine->OnLine 2:侧面影响搜索排序 Query分析 知识扩展&知识图谱应用 智能纠正 作弊流量识别与doc降权 类目错放、图文不一致检测
45. 总结与思考 思考? 1 冷启动问题 2 领域知识 丰富度 3 标注训练数据 过少 4 深度排序模型

相关幻灯片