阿里巴巴 张佶 - 阿里小蜜中的机器阅读理解技术揭秘_部分1

隗忻乐

2017/12/18 发布于 技术 分类

ArchSummit全球架构师峰会是InfoQ中国团队推出的面向高端技术管理者、架构师的技术大会,参会者中超过50%拥有8年以上的工作经验。 ArchSummit秉承“实践第一、案例为主”的原则,展示新技术在行业应用中的最新实践,技术在企业转型中的加速作用,帮助企业技术管理者、CTO、架构师做好技术选型、技术团队组建与管理,并确立技术对于产品和业务的关键作用。

文字内容
1. 阿里小蜜机器阅读理解技术揭秘   张佶    算法专家   Powered  by  阿里巴巴智能服务事业部  &  IDST  
3. 阿里小蜜-双十一服务主力   95%   阿里小蜜   智能服务占比   93.1%   阿里小蜜   智能解决率   1亿   店小蜜   对话轮次  
4. TABLE  OF   CONTENTS  大  纲   •     阿里小蜜平台介绍   •  机器阅读理解技术概览   •  业务场景及技术实践   •  挑战与展望  
5. 各领域生态圈的赋能   SaaS模式   淘宝   天猫   超级小蜜   阿里生态圈   SaaS模式   万象   航旅   闲鱼   其他   PaaS模式   B2B   菜鸟   优酷   其他   行业小蜜   阿里小蜜   商家生态圈   SaaS模式   千牛   企业生态圈   SaaS模式  or  PaaS模式   钉钉   海外   阿里云   IOT   店小蜜   企业小蜜   机器人配置平台   机器人智能问答平台   机器人应用平台   Smart  KB  (智能知识库)   算法组件平台   Bot  Framework   AI  Boost   数据模型平台  
6. 产品展示   •  阿里小蜜   •  客户服务   •  导购   •  通用助理   •  闲聊   •  运营活动   •  ……  
7. 产品展示   •  店小蜜   •  通用模型:物流   •  行业模型:手机、服饰   •  自定义QA模型  
8. 产品展示   •  企业小蜜   •  完整的企业智能服务方案   •  本体知识库:企业百科式的知识库   •  预置领域包   •  多语言支持  
9. 分领域的模型支持   •  知识问答:QA  Bot   •  任务解决:Task  Bot   •  闲聊:Chat  Bot   Query+Context   意图识别   对话管理系统(DMS)   QA Bot! Task Bot! Chat Bot! IR   Knowledge   Graph   Machine   Comprehension   Slot  Filling   Bot   Framework   DRL   IR+S2S  
10. 一种常见的QA  Bot场景   •  问答的线索来自一篇文章(新闻、百科、邮件等)   •  其中包含很多的数字、地点、名称以及一些客观事实描述   •  IR方式:人工逐个添加知识点“问答对”非常耗时,  且难以穷尽所有问题,知识覆盖率低   •  知识图谱方式:图谱构建代价大、领域特点强  
11. TABLE  OF   CONTENTS  大  纲   •  阿里小蜜平台介绍   •     机器阅读理解技术概览   •  业务场景及技术实践   •  挑战与展望  
12. 机器阅读理解   •  基于深度学习技术,  将非结构化文章和问题 作为输入,  自动寻找答案   ü  不依赖外部知识库和FAQ   ü  端到端进行模型训练   ü  学术会议上最热门的关键词和任务   ü  公开数据集推动了这个领域的快速进步   Reading   Comprehension   Visualizing  the  Corpus  of  ACL  2017  Paper  Titles  
13. 公开数据集-推理型   •  推理型问答:Facebook  bAbI   ü  由人工构造的由若干简单事实形成的英文文章   ü  回答基于推理的问题   ü  20个评测任务:事实、计数、是否等   ü  数据量小:1000个训练数据、1000个测试数据