AI筑巢:机器学习在百度凤巢的深度应用

ArchSummit 2017 全球架构师峰会 深圳 PPT下载

1. AI筑巢:机器学r在 百度凤巢的深度应用 刘斌新 百度 商务搜索智能wv部负责y 2017.7
4. 刘斌新 !  现负责凤巢核心策略“x品团队,包括CTR预 估“动态内容“富媒体广告等方向” !  2010年正式加入百度,作为负责y先后完成移 动凤巢“应用商店变现“联盟流量“信息流变现 等关键e务的攻坚; !  带领团队连续4年6g项目入围最高奖TOP 10 并f获最高奖(百万美金大奖)”
5. •  搜索广告e务简介 •  CTR预估的前d今生 •  生成式广告触发 •  机器学r在内容生态的创新 •  未来的探索
6. 搜索广告e务简介 关键词购s 按点击计费 0:7t价计费
7. 搜索广告e务简介 技术围绕e务场景 CTR预估“触发“文案生成“样式选择“弹性计算“风控…… 针对e务优化点,机器学r在凤巢几o无处a在 例如: 关键词广告 智能触发 -7-计费 点击率预估 内容生态 (选将军) (创造将军)
8. •  搜索广告e务简介 •  CTR预估的前d今生 •  生成式广告触发 •  机器学r在内容生态的创新 •  未来的探索
9. -T9预估发展回顾  200)T201() 2017 2015 2014 2013 2013 2012 2011 2009 -T9&.0 .NN联合训练 深度学r6IGiIC化 e界首次引入.NN 7CEaMOM模型上线 增量模型 g性化模型 -T91.0 39模型上线 -T9-X深度学r全流程
10. >5000 experiments
11. 深度学r引入CTR进展回顾 20  3 20  5 -T9&.0 双.NN联合训练 … 20  7 … … … LR Model -T9-X 双塔分离,全流程覆盖 … 20  2 项目启动 -T92.0 开启.NN DNN model Position'feas dnn dnn Position'feas
12. CTR-X:深度学r覆盖基础排序全流程 "  广告初筛阶段,计算量巨大,使用.NN有挑战” "  双塔分离.NN模型架构,优化计算逻辑和模型泛化能力,提升变现能力” BCDoLC:39模型 +DNCL:双塔分离.NN模型 普通.NN模型 × 长耗时/资源损耗,无法由39直接升 级到.NN Position'feas dnn dnn Position'feas 特征抽取:用户侧“+.侧分别抽取 用户&广告fg维度的模型分开训练 √ 由39升级为双塔大规模离散.NN 耗时 优化 分布式字典:网络查询 # 内存查询 计算方面:10万级别的DGoaN相p # &2gDGoaN相p
13. 自有大规模机器学r平台 Abacus 超大规模 复杂性 扩展性 可支持千亿级别特征和万亿模型参数 $  允许多机多线程异步实时访问和更新 $  用u支持大规模离散模型(如离散DNN)的异步sgd训练 自l的Anti Over-Fitting机制,可随意使用扩展 $  应用u凤巢CTR模型 $  应用u手百Feed推荐模型
14. •  搜索广告e务简介 •  CTR预估的前d今生 •  生成式广告触发 •  机器学r在内容生态的创新 •  未来的探索
15. Keyword Targeting—传统匹配模式 广泛匹配:福克斯改造 匹配: 福特福克斯c卖店,福克斯论坛 短语匹配-核心包含:福克斯改造 匹配:福特福克斯改造,白色福克斯改装 短语匹配-同n包含:福克斯改造 匹配:福克斯改装,改造福克斯 短语匹配-精确包含:深圳福特福克斯改造 匹配:福克斯改造, 福特福克斯改造 精确匹配:福克斯改造 插入“颠倒“ 插入“颠倒“ 同n 同n“省略 字符串包含 字面精确:福克斯改造 地域精确:深圳福克斯改造 高级精确:福克斯改装
16. ~传统触发模式到生成式触发, 构建高度智能化的触发引擎 用户Query 数据检索 匹配校验 判别式触发 采用深度学r增强校验 传统触发系统 检索和校验f步式架构 召回率低 支持多粒度检索 大幅提升召回率 Bidword结果
17. ~传统触发模式到生成式触发, 构建高度智能化的触发引擎 用户Query 生成式触发 Bidword结果 生成式触发 ·∙分利用深度学r能力 判别式触发 采用深度学r增强校验 传统触发系统 检索和校验f步式架构 召回率低 突破性地将检索和校验合t为一 显著提升用户体验 支持多粒度检索 大幅提升召回率 深入应用AI
18. 深刻理解用户意图,提升用户体验 BCDoLC +DNCL 结果局限u字面 优质结果少 具备AI“思考X能力 深度理解用户意图 呈现更多优质结果
19. 生成式触发模型, 以AI技术深度理解用户需求 QOCLS 索引出后续词 预估出首词 依据相关性剪枝 BiBQoLB 品牌 精油 皂 十大 护’ 精油什m 牌子的好 品牌 X 用户体验a达标 X 用户体验a达标 精油 品牌 好 品牌 口红 X 用户体验a达标 语n 理解 RNN模型相 关性得分 什m 精油 用 什m 牌子 用户 行为
20. 生成式触发模型, 以AI技术深度理解用户需求 编码器: Bi-9NN 精油 什m 解码器: 9NN 注意力模型 精油 哪g 的 牌子 的 好 牌子 <s> 好 精 油 十 大 品 牌 十大 十大 什m 精油 品牌 精油 品牌 精油 好 精油 i胸
21. •  搜索广告e务简介 •  CTR预估的前d今生 •  生成式广告触发 •  机器学r在内容生态的创新 •  未来的探索
22. 自动生成“校验商e文案,提升可信度 1IKON 1N QOCLS + TiNGC + 创意 + 落地页Y. Y X1’X2’ Y X1 X2 X& XI /IAoBCL Y Y 双向 9NN a1 aI AoINCRN .CAoBCL Y Y1 Y2 6UT 业 务 校 验 品 牌 校 验 资 质 校 验 +GG YCM 落地页 6ONKON 商e文案 :CINCIACM 时 效 性 校 验 夸 大 词 校 验 YY QOaGiNS -oINLoG Y&Y YI
23. 商e文案~y工撰写迈向AI自动生成 Before After:智能创意 %  标题描述夸大a一致 %  +1知识和内容理解 %  创意空洞冗长,无重点 %  结构化核心内容前置 %  知识直达最相关页面 7分通过率70%
24. 隐式知识理解b凝练,提高用户获取信息效率 3aIBiIE KaEC 页面结构分析 MCmaINiA PCANoL QOCLS:雅思口语考试 核心句格式分布 物理段落识别 逻辑段落划分 广告l网站 QOCMNioI 知识内容 问题理解 MCmaINiA PCANoL 3:TMl题识别 意图识别 用户 :NaIBaLB 2IoQGCBEC 3ib 语n结构识别 2IoQGCBEC -aNCEoLS MCmaINiA PCANoL 校验 知识库 :OmmaLS .CNaiG 1LLCGCPaIN
25. 基u用户意图智能出图,快速Catch用户 query 双眼皮整形 意图识别 ALoMM-BomaiI BCCK mCNLiA GCaLIiIE 智能出图 基u图片内容的l 体识别和智能裁剪 低质量图片过滤
26. 机器学r打造智能落地页 Before After:智能落地页 %  内容空洞千篇一律 %  重构高质量落地页 %  ce化“结构化a足 %  智能化“ce结构化 %  移动用户体验质量堪忧 %  实现内容体验闭环
27. 机器学r打造智能落地页 Item x品1 案例1 Query:太阳能热水器安装案例 结构化数据 x品2 案例2 TiNGC .CMA 1maEC …… User 热水器.960 0.8 内容 排序 g性化信息 QOCLS 7LoDiGC …… 结构化数据 文章块 x品块 案例块 转化块 -aNCEoLS -oINCIN :NSGC …… 0.7 整体安装案例 热水器Q( 0.3 Y工厂安装 X小区安装 0.7 0.4 0.9 页眉 :CMMioI Block 皇明热水器 模块 排序 案例块 0.9 x品块 0.5 文章块 0.3 转化块 0.1 页脚
28. •  搜索广告e务简介 •  CTR预估的前d今生 •  生成式广告触发 •  机器学r在内容生态的创新 •  未来的探索
29. 未来的探索 时代在变,内容的形式也在变 文本 图片 视频 YY
30. 以图片化信息集成快速吸引用户并满足需求 实现图片创意的“一键美颜“ BCDoLC +DNCL BCDoLC +DNCL 实现图片创意信息的“一览无遗“
31. 以图片化信息集成快速吸引用户并满足需求 实现图片创意的“一键美颜“ BCDoLC +DNCL BCDoLC +DNCL 实现图片创意信息的“一览无遗“
32. 加强端到端的富媒体化程度… BCDoLC +DNCL
33. 营销信息提炼成短视频呈现,让用户一秒读懂 视频合成
34. 未来的探索 Video-Out视频广告:视频处理“图像理解“检测技术
35. 未来的探索 Video-In视频广告:图像前景背景检测b分割“AR虚拟植入
36. 未来的探索 Video-In视频广告:图像前景背景检测b分割“AR虚拟植入
37. 新媒体的x生渴求新技术, 在+1时代这波浪潮中,欢迎各位大咖加入 欢迎联系:[email protected] 让我们一起打造 智能+1商e体系 +. BLaiI