AS深圳2018 《阿里跨境业务动态广告算法迭代》 孟晓楠

ArchSummit

2018/09/14 发布于 技术 分类

文字内容
1. 阿里跨境业务动态广告算法迭代 孟晓楠、王路路、魏朝、张苇如、刘华晖、任少辣等 国际技术事业部高级算法专家
4. 孟晓楠 国际技术事业部高级算法专家 • 2010年7月加入阿里巴巴,负责1688平台、 alibaba.com和aliexpress.com平台广告算法。 • 2006年浙大硕士毕业之后,加入网易杭州研 究院; • 出版译著《机器学习实用案例解析》 • Mail:xiaonan.mengxn@alibaba-inc.com
5. • 阿里跨境业务介绍 • 离线、在线与全局问题 • 搜索广告中RPM最大化的理论和实践探索 • 基于动态广告位的全页面优化 • 预算约束下的广告消耗预估研究
6. • 阿里跨境业务介绍 • 离线、在线与全局问题 • 搜索广告中RPM最大化的理论和实践探索 • 基于动态广告位的全页面优化 • 预算约束下的广告消耗预估研究
9. 阿里跨境电子商务B2B/B2C
10. 阿里跨境电子商务B2B/B2C
11. 业务 ICBU AE 全域投放 业务 领域 PC 无线 PPC SEO 多语言 联盟 推荐 业务 平台 PID管理平台 相关性阈值 模型参数 算法链路 违禁词 算法开放平台 黑白名单 相关性干预 Spam管理 推词 广告主后台工具 出价引导 方案包 意图识别 核心 能力 中台 服务 Query分析 文本相关性 流量分析 类目预测 文本质量 用户标签 排序 CTR预估 模型预估 C2F预估 排序机制 搜索广告一体化 预算/竞拍 周预算 智能出价 关键词竞拍 消耗平滑 人群竞拍 智能化运营 账户诊断 任务激励 NLP 资源库 同义词 上下位 产品词 品牌词 算法 分词 中心词 TermWeight 短语抽取 算法平台 离线预估框架:Pixel 人群画像:OpenClouds 程序化购买:Poseidon DSP实时报价:Paladin 可用性保障平台 自动化测试 安全测试 性能测试 错误分析 监控预警 容灾互备 数据收集平台 行为打点 曝光打点 基础 数据 用户数据 商品数据 行为数据 创意数据 运营数据 基础 平台 TPP ODPS PS DII Hbase Carry
12. 离线、在线与全局 离线 •一个广告系统, 如何在离线预 估算法(比如 CTR模型)上 线之后的效果? 在线 •在线系统如何 统筹转化率和 营收等多个维 度的指标? 全局 •一个变现提升 项目上线后对 全局营收的影 响?
13. • 阿里跨境业务介绍 • 离线、在线与全局问题 • 搜索广告中RPM最大化的理论和实践探索 • 基于动态广告位的全页面优化 • 预算约束下的广告消耗预估研究
14. 背景简介 买家 搜索体验 卖家ROI RankScore 变现能力 卖家 平台
15. 问题定义 • Definition:营收最大化问题是在训练数据集上基于离线评价指标的表现来优化排序效率,其形式化定义如下 • 核心问题 ① 有效的离线指标 à SoftAUC ② 目标可优化 à 更优的排序公式
16. 离线评价指标:AUC AUC的数学定义:The AUC value is equivalent to the probability that a randomly chosen positive example is ranked higher than a randomly chosen negative example. 从点击损失的角度,我们可以给出AUC的形式化计算 公式:
17. 离线评价指标:??????????????????$ 将AUC的点击损失扩展到实数范围,我们提出 一个适用于广告场景的离线评价指标??????????????????$:
18. 离线评价指标:Soft AUC soft函数(sigmoid)变换 作为优化目标对参数空间不可导, 难以优化 对参数空间可导,可作为寻找最优排序h 函数的优化目标
19. 离线评价指标 AUC ??????????????????$ SAUC 离线指标:点击率 离线指标:RPM 离线指标:RPM 优化目标:参数空间不可导 优化目标:参数空间可导
20. 排序公式:显式排序函数 将校准因子和价格挤压因子结合起来设计了一个显式的排序函数 价格挤压因子 校准因子
21. 排序公式:隐式排序函数 深度网络能够拟合任意复杂的函数,可以设计一个网络结构来学习erpm=f(eCTR,bid)之间的隐式关 系
22. 实验结论:离线评价指标 尽管被广泛使用,AUC 指标是在线RPM的既不 充分也不必要条件; ??????????????????$和????????????????????????在线和离线表现一致性方面有了很 大的提高。究其原因,我们的评价指标是刻画整 个排序函数,和最终需要优化的目标是保持一致 的。
23. 实验结论:排序优化 我们的工作:https://arxiv.org/abs/1807.01827
24. • 阿里跨境业务介绍 • 离线、在线与全局问题 • 搜索广告中RPM最大化的理论和实践探索 • 基于动态广告位的全页面优化 • 预算约束下的广告消耗预估研究
25. • Motivation • Methodology • Experiments • Conclusions Content
26. • Insight • 广告个数固定 Motivation Search Recommendation
27. • Insight Motivation • 广告个数固定 • 并非所有流量下自然结果点击率(以点击率代表客户价 值)皆优于广告点击率 • Goal • 数学模型定义 • 动态调整广告个数 减少ads 图1 增加ads
28. Methodology • 动态调整广告个数 • 3个资源位 item list i1 n 页面广告营收(REV) • 广告展现在自然结果前面(内部序不变) item list i2 • 每个流量 i 能生成4个候选 item list item list i3 item list i4 • 广告个数动态调整问题 -> item list ij 的选择问题 广告个数 org1 org2 org3 0 ad1 org1 org2 1 ad1 ad2 org1 2 ad1 ad2 ad3 3
29. Methodology • 带约束的线性规划 • 保证全页面点击率最大化营收 全页面点击率(Click Yield: CY) n 页面广告营收(REV) 目标:最大化广告营收 约束:平均CY不低于业务目标T 约束:只选择展现一个item list 全页面广告营收(REV) nDual Form
30. Methodology • List Performance Prediction • Sum-Method n 页面广告营收(REV) • Sum-Method With Position Bias click probability • Deep Learning position examination probability Method SUM SUMpos_bias DNN Click Yield Mse 0.1169 0.1129 0.1116
31. Methodology—Online Algorithm 广告结果有序集合 自然结果有序集合 拼接,生成item list候选集合 complementary slackness theorem simplified form of
32. Experiments • Offline Simulation n 页面广告营收(REV) Rev improvement rate baseline CY improvement rate
33. Experiments • Online Experiments(relative improvement) n 页面广告营收(REV)
34. Conclusion • 结论 n 页面广告营收(REV) • 跳出广告内部,站在广告和自然结果的视角上,同时利用广告和自然结果信息来帮助最大化营收 • 使用线性规划来数学定义整个广告个数动态调整问题;容易实现;不影响线上性能 • 在没有增加平均展现广告数量的情况下,同时提升了全页面点击率和平台营收 • WWW2018:《The Whole-Page Optimization via Dynamic Ad Allocation》 • 我们的工作:https://dl.acm.org/citation.cfm?id=3191584
35. • 阿里跨境业务介绍 • 离线、在线与全局问题 • 搜索广告中RPM最大化的理论和实践探索 • 基于动态广告位的全页面优化 • 预算约束下的广告消耗预估研究
36. 预算约束下的广告消耗研究 • 广告主预算 n 页面广告营收(REV) • 广告主为广告投放设定campaign(投放计划),每个campaign附带广告的预算上限 • campaign的预算刷新周期一般为24小时 • 一天内campaign预算消耗完,其对应的广告都将下线,不参与竞价和曝光 • 预算约束下的广告消耗 • 越接近24小时,预算消耗越多,可展现的物料广告越来越少,变现效率下降 • 缺少定量分析研究?考虑流量分布的情况下,潜力营收有多少?广告营收的上限?
37. Formalization of the Problem ??????????????????(??????) ∗ ??????????????????(??????) ??????????????????(??????) = 1000 假设: 1)PV足够大,且均匀连续 (0, 0) (T0) (1) (T1) 2)撞线后,RPS均匀下降 第一个campaign 撞线(预算耗竭)时刻 一天结束 时刻 耗尽所有可能被消耗预算所需要 的理论时间 Max Revenue: (T0) (1) (T1) RPS(t) T1
38. (T0) (1) 初始RPS RPS(0) = l 日结束时刻RPS Solution ⎧ ⎪ ⎪ l, RPS(t ) = ⎨⎪⎪ ⎪ − 1−β 1−γ lt + (1− βγ 1−γ )l , ⎪ ⎪ 0, ⎩⎪ 0 0≤≤??????t≤≤ γ??????4 γ??????<4 t<≤??????11≤−−β???β???6γ ??????t>> 1???1???6−−ββγ 当天RPS曲线: ⎧ ⎪ ⎪ l, 0≤t ≤γ (T1) RPS(t ) = ⎨⎪⎪ ⎪ − 1− 1− β γ lt + (1− βγ 1−γ )l , γ 1− βγ 1− β 当天剩余潜力营收: ∫ ∫ T1 RPS(t )dt = 1 T1 1 (1γ −β −1 lt − (1− βγ γ −1 ) l )dt = β 2(1−γ ) 2(1− β ) l
39. Formalization of the Problem 新项目发布 online
40. 新项目发布 • 假设初始RPS提升??????倍 α = RPS′(0) RPS(0) 假设: ??????<=>? = ??????<@=@>@? 第一个广告主开始撞线的时刻之前,产生 的广告营收保持不变: • 在此处键入公式。 n 页面广告营收(REV) ⎧ ⎪ l′(α ) = αl ⎨⎪⎪ β ′(α ) = −α (1 − β)− 1−γ βγ +1 ⎪ ⎪ 因此新一天的日营⎩⎪收为 γ ′(α ) = γ α DR′(α ) = β ′(α ) + γ ′(α )− β 2 ′(α )γ ′(α )+ 1 l′(α ) 潜力营收为 (T4;) (T0) (1) (T6;) (T1) PR′(α ) = β′(α )2[1−γ ′(α 2[1− β′(α )] )]l′(α )
41. Experiments
42. Experiments 初始RPS与预算使用率关系 预算使用率=日消耗/实际可 消耗上限 (并不是所有客户的日预算 之和)
43. • 结论: Conclusion • 为预算约束下的消耗预估提出一种新颖的解决思路; • 通过现象分析用户预算、消耗、初始RPS内在关系; • 提出一种针对广告场景数据信息熵过小情况下的数据拟合方法。 • 局限以及展望: • 较强的假设在解决实际问题时会有偏差; • 两段函数的拟合方式可以进一步优化; • 探寻更好的归一化方式。