阿里巴巴 总监 蔡龙军:面向未来的泛内容AI平台建设实践

建凯安

2017/11/14 发布于 技术 分类

伴随着互联技术高速发展,内容产业呈现出欣欣向荣、争奇斗艳的景象,繁荣发展的行业之下,多样化应用蓬勃增长之下内容的分发和消费、以及变现数据得以沉淀下来,而大数据和人工智能技术的蓬勃发展,则带来了新型的竞争实力和经济效益,而近年迅速崛起的文化娱乐行业快速发展过程中也得益于这种新型生产工具的诸多便利之处。阿里大文娱内容智能分析与优化平台是一个行业领先的泛内容大数据三维立体智能分析平台,建立了以影、视、综、漫视频等多种形式的内容的海量数据,深度学习为代表的人工智能技术,传统传播学、营销学等经典理论三个纬度为代表的立体分析平台,并建设了以智能预测、智能营销等为代表的一系列产品,全面覆盖泛内容生命周期,并据此深入到泛娱乐产业各领域,面向未来赋能于投资采购、内容制作、市场营销、运营发行、内容格局战略分析等环节的决策,并在实际应用当中取得了巨大的经济效益,从而形成一种全新的内容领域生产工具。

文字内容
1. 面向未阿来里的巴SA巴泛实C内总C践监2容0蔡1A7龙I平军台建设
2. Agenda • 文娱泛内容AI平台背景 • 互联网发展的背景,对内容产业带来的冲击和生机 • 建立娱大脑必要性 • 文娱泛内容AI平台整体规划 7• 三维立体分析平台规划 201• 基础设施深度学习平台DeepDriver介绍 SACC• 文娱泛内容AI平台投资采买分析能力建设 • 文娱泛内容AI平台营销分析能力建设
3. 内容的时代:这世界很酷 SACC2017………… 虐恋总是要 100~200亿虐!! 铁打的四大神兽,流水的明星 这些内容去哪里看呢?YouKu 这种变化影响是什么?
4. 鹿晗恋爱了….,是件互联网大事 • 微博 (SNS) • 优酷(视 频) • 淘宝(电商) • 王者荣耀(游戏) 暴打“关羽”,“姓关的就没有好东西” SA• 百C度C(搜2索0)17 • 婚纱摄影(传统) “鹿晗就不是好东西,没拍完,我一个女客 户穿婚纱跑了…”
5. 互联网娱乐化 PC Portal … PHON E OTT 大 剧 SACC2017Baid Alibab ua QQ SNS • 那么把控文娱就要理解整个互联网和文娱相关的数据!
6. 曾经的文化娱乐产业是条河 漫画 小说 网络小 说 读者 电影 电视剧 主题公 园 SACC2017网络剧 上下游时间界限很明显 观众 游客 受众角色很清晰 消费地域很明确 衍生品 手办 消费者
7. 破坏原有土壤结构,也带来了新的形式 打 车 漫画 吃 饭 歌曲 主题 公园 购 UGC/ 物 PGC 1.内容形式、结构多元化、年轻化 2.人才各种跨界结合 3.互联网+和内容存在天然边界 4.实时与预知 动漫 电影 网络 小说 ALL IN ONE…. 小说 综艺 话剧 /… SACC2017互联网+IP 演唱 会 用户 互联网+与传统、艺术的边界 电影 游戏 衍生 品 院 网剧 电商 电视 剧 制作思路和内核都有了新的变化
8. 帮助人们理解内容:文娱泛内容AI平台 SACC2017有生之年看不完的数据 所以,只能… 7*24并行计算+AI
9. 文娱泛内容AI平台:覆盖全生命周期 依托DeepDriver不断深入AI 智能化投资 智能化营销 智能化需求挖 掘 可传播的抽象或者具象对 象实体 智能化运营 SACC2017智能化制作 歌曲 出版物 话剧 …… 小说 漫画 事件 游戏 资讯 地点 新闻 音乐 电视剧 综艺 体育 电影 动漫 贯通多文本、全生命周期上下游数据网络体系
10. 数据体系建设:从上帝角度进行思考 类型多元 化 发展动态 性 渠道垂直 性 SACC2017IP 主创 档期 内容 题 材 平台 … 建立数据分析 体系 形式多样 化 用 户
11. 自研的深度学习平台DeepDriver AttentionModel DNN VGG&ResNet 复杂DL层 Encoder-Decoder Seq2Seq MTL SACC2017CNN 基础DL层 RNN/LSTM DNC NN-LM W2V PS 架构 计算能力加速层 FPGA 芯片级
12. DeepDriver应用的例子 SACC2017• 例如给个短文: • “小明带个球去操场,小明抱着 球回到教室,小明抱着作业去老 师办公室” • 测试: “小明在哪里”,答案是“办公室” “球在哪里”,答案是“教室” • 纯JAVA开发,轻量级(几万行代码,极少第三方依赖 包) • 着眼于先进的人工智能算法实践 • 开源平台https://github.com/LongJunCai/DeepDriver
13. 文娱泛内容AI平台投资采买分析能力建设 • 预测准确率:提前1年预测:80%+; 准确率92% 准确率97%+ 准确率90% SACC2017 准确率92%
14. 黑盒学习存在的困难与挑战 • 常规的预测思路:数据+简单模型、数据+逼近能力 强黑盒模型 • 常规思路本质:黑盒模型逼近真相 • 存在问题: • 复杂机制很难通过样本进行覆盖 • 很难深入理解问题本质 SACC2017• 很难跨领域进行举一反三学习 具有生命周期 竞争博弈 复杂的影响因子
15. 基于机制建模构造复变预测模型 …… … SACC2017 • 建立了一个端到端的混合预测模型:Embedding CNN+DNN+RN+MTL+LSTM
16. 最终模型:组合多个模型结果 Thousands of DL make dynamic decisions SA…C…… C2017 复合模型 复合模型 复合模型 复合模型
17. Relation Net SACC2017 和 是多层感知器 MLP • 准确率有超过5%的提升 Adam Santoro, A simple neural network module for relational reasoning
18. MTL—Multiple Task Learning (1)隐式数据增加机 制 (2)注意力集中机制 SACC2017(3)窃听机制 (4)表示偏置机制 (5)正则化机制 • 泛化能力提升接近20%提升
19. 营销推广分析 受众分析 主题分析 热度分析 社区分析 SACC渠2道0分1析7
20. 营销推广分析-白夜追点啥? SACC2017• 整体集中在演员、整体评价和剧情上 • 为潘粤明打Call,剧情精彩紧凑,场面镜头血腥恐怖,道具逼真,片尾曲 好听(!!)
21. NLP模型 应用模型 情感分类 意见提取与归类 …. 通用模型 基础模型 SACC2017 分词 命名实体识 别 …. 去噪音 语法分析
22. 建立运营分析闭环 运营决策 SACC2017
23. 总结 • 内容产业发展特点 • 互联网连接人与高效服务,加速了文娱内容向互联网 各种应用进行渗透 • 移动互联网对内容产业的冲击改变了不同内容形式发 展规律 017• 建立内容三维立体AI分析平台可以有效帮助内容产业适应 C2新发展趋势 SAC• 针对发展呈现机理进行更深入的建模将成为一种趋势 • 随着人工智能技术的不断发展,模型的表达能力将得到进 一步加强,也会推动行业奔向新的高度!
24. 欢迎加微信! SACC2017
25. SACC2017