AI发展渐入高潮,未来有望引爆

1. 恒大研究院研究报告 [Table_Summary] 人工智能系列一:AI 发展渐入高潮,未来有望 引爆新一轮技术革命 恒大研究院研究报告 研究员:沈明辉 [email protected] 0755-81998477 联系人:刘宸 [email protected] 文化传播行业 专题报告 2018/10/18 摘要: 1、人工智能(Artificial Intelligence,简称 AI)嵌入多个生活场景, 被寄望为下一轮技术革命。微观层面,机器翻译、资讯分发和辅助驾驶等 AI 应用已让人类生活更美好。宏观层面,AI 能替代繁琐、重复人类工作, 提升资源配置效率并减少生产损耗,其被寄望为经济增长新引擎。 2、人工智能前景判断:1)技术层面:短期或不及预期,长期仍有望引爆 新一轮技术革命。2)产业层面:短期看商业模式,中期看公司技术研发, 长期看基础研究突破。 3、人工智能是模拟人类思维和行为的系统,当前处于弱 AI 时代。人工 智能旨在模拟人类思考方式、行为规划和学习能力,最终像人类一样感知 周边环境并且做出反应。当前人工智能处于仅能解决特定问题且往往扮 演辅助角色的弱 AI 时代。 4、人工智能螺旋式发展,经历三个时期:1)起步时期:1956 年达特茅 斯会议提出人工智能概念,计算机性能和数据量制约 AI 发展。2)专家系 统时期:“知识库+推理机”实现 AI 商用化,台式机性能提升终结专家系 统。3)深度学习时期:2006 年 Hinton 论文开启当前深度学习时代。 5、人工智能已是新风口,技术是核心驱动力。2017 年全球 AI 融资超 150 亿美元,谷歌、亚马逊、苹果以及百度、腾讯等中美科技巨头纷纷布局。 算法、算力和数据是 AI 发展的核心驱动力:深度学习算法使 AI 迈入数 据驱动时代,互联网孕育海量的多维度数据,GPU 并行计算能力为“大数 据+神经网络”提供算力。 6、人工智能产业链分为基础层、技术层和应用层,中国产业布局偏好技 术成熟、应用性强的领域,对需要长周期、基础研究的芯片的关注度小。 1)基础层提供算力和“操作系统”。芯片赛道,GPU 仍是人工智能首选, 产业格局呈三足鼎立,AI 专用芯片中国企业存弯道超车机会。开发框架 赛道,“开源+巨头支持”是主流模式,TensorFlow、Torch 等各有所长。 2)技术层解决具体类别问题。语音识别负责语音转文本,技术和行业格 局趋于成熟,但智能音箱等消费级产品或已侵蚀 Nuance 等头部企业先发 优势。自然语言处理实现机器“听得懂”,技术成熟度较低,市场分散且 未形成头部企业,新入局者仍有机会。计算机视觉实现机器“看得懂”, 静态物体识别趋于成熟,安防厂商、互联网巨头和创业公司是主要玩家。 3)应用层解决实践问题。目前 AI 产品普遍是人类辅助者,自动驾驶或 是下一个重量级市场。语音场景,智能音箱流量入口属性使科技巨头群雄 逐鹿,生态整合决定发展前景。安防场景,视频结构化、人脸比对助力警 务管理,误报率、动态人脸监控仍是短板。金融场景,应用于身份证认证、 征信风控和投顾理财。医疗场景,应用于医学影像、辅助诊疗和语音电子 病例,腾讯觅影已筛查 400 多例早期食道癌病例。自动驾驶场景,主流系 统处于辅助驾驶级别,谷歌、特斯拉和百度领跑中美自动驾驶赛道。 立足企业恒久发展 1 服务国家大局战略
2. 恒大研究院研究报告 目录 1 人工智能:已融入多个生活场景,未来有望引爆新一轮技术革命 ................................................................ 6 1.1 人工智能已嵌入多个生活场景,被寄望为下一轮技术革命 ................................................................. 6 1.2 前景判断:短期或不及预期,长期仍充满希望 ..................................................................................... 7 2 概念、标准与分类:人类思维和行为的模拟,目前仍处于弱人工智能时代 ................................................ 8 2.1 概念:人类思维和行为的模拟 ................................................................................................................. 8 2.2 标准:图灵测试 ......................................................................................................................................... 8 2.3 分类:弱 AI、强 AI 和超强 AI................................................................................................................. 9 3 人工智能的“前身今世”:螺旋式发展,深度学习开启新浪潮 ...................................................................... 10 3.1 起步时期:达特茅斯会议提出人工智能概念,人机对话小程序 ELIZAL 令人惊艳........................ 10 3.2 专家系统时期:“知识库+推理机”组合实现人工智能商用化.............................................................. 10 3.3 深度学习时期:Hinton 论文开启人工智能新浪潮,Alphago 战胜人类世界冠军..............................11 4 技术+政策+资本助力行业发展,Alphago 引爆行业风口 .............................................................................. 12 4.1 新风口:未来十年人工智能或使全球 GDP 增长 12% ......................................................................... 12 4.2 算法+算力+数据:行业发展的核心驱动力........................................................................................... 13 4.2.1 算法:从传统机器学习到人工神经网络,深度学习大幅提升机器学习能力 ......................... 13 4.2.2 数据:互联网孕育大数据时代,为深度学习提供外部支撑..................................................... 15 4.2.3 算力:GPU 芯片提供高效计算能力,加速深度学习训练........................................................ 15 4.3 政策+资本:行业发展的沃土 ................................................................................................................. 16 4.4 Alphago:引爆风口的催化剂 ................................................................................................................. 18 5 人工智能产业链:基础层+技术层+应用层,中国基础层存不足 ................................................................. 18 5.1 产业链初探:基础层+技术层+应用层................................................................................................... 18 5.2 产业链布局:中国偏好技术成熟、可应用性强的领域 ....................................................................... 19 5.2.1 中美对比:中国侧重技术层和应用层,美国侧重基础层......................................................... 19 5.2.2 中国融资事件分析:大市场且技术成熟领域受资本追捧......................................................... 21 6 基础层:芯片+开发框架.................................................................................................................................... 22 6.1 芯片:GPU 带来算力革命性突破,未来发展瞄准 AI 专用芯片 ........................................................ 22 6.1.1 GPU 市场格局:Intel、AMD 和 NVIDIA 三足鼎立,NVIDIA 领跑 AI 赛道......................... 22 6.1.2 FPGA 市场格局:Xilinx、Altera 占据主要市场份额,Intel 并购布局 .................................... 24 6.1.3 谷歌 TPU 领跑 ASIC,寒武纪 NPU 是新生力量 ....................................................................... 24 6.2 开发框架:“开源+巨头支持”模式,百度推出 Paddle-Paddle.............................................................. 25 6.2.1 开发框架链接软硬件,降低 AI 使用门槛 .................................................................................. 25 6.2.2 市场格局:开源平台普遍背靠互联网巨头,百度推出 PaddlePaddle ...................................... 25 7 技术层:语音识别+自然语言交互+计算机视觉 ............................................................................................. 26 7.1 语音识别:正确率提升推动商业化,消费级产品或打破市场格局.................................................... 26 7.1.1 语音识别正确率已提升至 95%,颠覆人机交互模式仍需技术进一步提升............................. 26 7.1.2 市场格局:行业格局已初步形成,消费级产品助力科技巨头后发制人 ................................. 27 7.2 自然语言处理:实现机器“听得懂”,技术成熟度仍较低 .................................................................... 28 7.2.1 自然语言处理实现机器“听得懂”,语言规则复杂性制约技术成熟度 ..................................... 28 7.2.2 市场格局:市场较为分散,新入局者仍有机会......................................................................... 29 7.3 计算机视觉:实现机器“看得懂”,安防厂商、科技巨头和创业公司机会并存 ................................ 30 7.3.1 计算机视觉实现机器“看得懂”,静态物体识别技术趋于成熟 ................................................. 30 7.3.2 市场格局:2020 年中国市场规模预计 725 亿元,安防厂商、互联网巨头和创业公司机会并存 31 立足企业恒久发展 2 服务国家大局战略
3. 恒大研究院研究报告 8 应用层:智能语音+安防+金融+医疗+自动驾驶............................................................................................. 33 8.1 智能语音:人工智能时代的流量入口,科技巨头群雄逐鹿 ............................................................... 33 8.2 AI+安防:智慧安防助力警务管理,动态人脸识别仍存不足 ............................................................. 35 8.3 AI+金融:人工智能助力金融服务效率,身份认证、风控和投顾是三大应用场景 ......................... 37 8.4 AI+医疗:医学影像、辅助诊疗和语音电子病例是主要应用场景,腾讯觅影已筛查 400 多例早期食 道癌病例 ........................................................................................................................................................... 38 8.5 自动驾驶:未来或颠覆全球汽车产业链,谷歌、特斯拉和百度领跑自动驾驶赛道........................ 39 立足企业恒久发展 3 服务国家大局战略
4. 恒大研究院研究报告 图表目录 图表 1: 人工智能已落地于多个生活场景 ............................................................................................................. 6 图表 2: 人工智能的概念定义 ................................................................................................................................. 8 图表 3: 目前机器仅在短时长和细分领域的测试中通过了图灵测试 ................................................................. 9 图表 4: 当前人工智能世界处于弱人工智能时代 ................................................................................................. 9 图表 5: 人工智能发展历程 ................................................................................................................................... 10 图表 6: 深度学习使语音识别获得突破性进展 ....................................................................................................11 图表 7: 中国人工智能发展规划目标 ................................................................................................................... 12 图表 8: 以 FAAG 和 BAT 为首的科技巨头均涉足人工智能产业 ..................................................................... 13 图表 9: 深度学习算法的特征提取和规则构建均由机器完成 ........................................................................... 14 图表 10: 隐含层数量增加大幅降低了图像识别错误率................................................................................ 14 图表 11: 数据爆发式增长支撑了人工智能发展............................................................................................ 15 图表 12: GPU 芯片的计算单元数量远甚于 CPU 芯片................................................................................. 16 图表 13: GPU 芯片推理计算能力数十倍于 CPU 芯片................................................................................. 16 图表 14: 中国不断加大对人工智能产业的政策支持力度............................................................................ 17 图表 15: 2017 年全球 AI 融资额达 152.4 亿美元 ......................................................................................... 17 图表 16: 2018 年 1-9 月中国 AI 融资额 825 亿元 ......................................................................................... 17 图表 17: 2017 年中国人工智能融资规模已超美国....................................................................................... 18 图表 18: 人工智能产业链分为基础层、技术层和应用层,科技巨头普遍涉足多个环节........................ 19 图表 19: 中美 AI 基础层企业数差距明显(2017 年 7 月) ........................................................................ 20 图表 20: 中国芯片累计融资规模仅为美国 4.3%(截止 2017 年 7 月) .................................................... 20 图表 21: 中美应用层融资事件多于基础层和技术层(截止 2017 年 7 月).............................................. 20 图表 22: 大市场且技术成熟领域受中国资本追逐........................................................................................ 21 图表 23: GPU、FPGA 和 ASIC 各有优劣 ..................................................................................................... 22 图表 24: 在 PC GPU 市场,AMD、Intel 和 NVIDIA 呈三足鼎立 .............................................................. 23 图表 25: 在独立 GPU 市场,NVIDIA 占据第一大市场份额 ...................................................................... 23 图表 26: Tesla V100 大幅缩短深度学习训练时间 ........................................................................................ 23 图表 27: FPGA 市场份额由 Altera、Xilinx 瓜分(2016 年) ..................................................................... 24 图表 28: 寒武纪 NPU 芯片介绍 ..................................................................................................................... 25 图表 29: 主流人工智能开发框架 ................................................................................................................... 26 图表 30: 语音识别分为“降噪-特征提取-解码”三个环节 ............................................................................. 27 图表 31: 全球和中国智能语音市场均已形成行业巨头(2015 年)........................................................... 28 图表 32: 自然语言处理是实现人机互动闭环的关键技术............................................................................ 29 图表 33: 自然语言处理产品仍然集中在细分领域........................................................................................ 30 图表 34: 计算机视觉处理流程 ....................................................................................................................... 31 图表 35: 计算机视觉需要大量手工标注物体特征的图片............................................................................ 31 图表 36: 2020 年计算机视觉市场规模预计达 725 亿元............................................................................... 32 图表 37: 安防影像分析占计算机视觉市场规模的 68%(2017 年) .......................................................... 32 图表 38: 安防厂商、互联网巨头和创业公司是计算机视觉领域的主要玩家............................................ 33 图表 39: 用户通过智能语音来调取后端应用................................................................................................ 34 图表 40: 科技巨头均布局智能音箱 ............................................................................................................... 34 图表 41: 2019 年全球智能音箱销量将达 8500 万台..................................................................................... 35 图表 42: 2018Q2 亚马逊智能音箱出货量 480 万台...................................................................................... 35 图表 43: 中国视频监控市场规模超千亿(2017 年)................................................................................... 36 立足企业恒久发展 4 服务国家大局战略
5. 恒大研究院研究报告 图表 44: 图表 45: 图表 46: 图表 47: 图表 48: 图表 49: 图表 50: 图表 51: 大华股份智能警务方案 ................................................................................................................... 36 人脸实时监测和车辆检测助力警务管理........................................................................................ 36 智能风控流程 ................................................................................................................................... 37 中美智能投顾企业介绍 ................................................................................................................... 38 医学影像、辅助诊疗和语音病历是 AI+医疗的主要应用场景 .................................................... 39 自动驾驶“感知-认知决策-控制执行”环节 ..................................................................................... 41 SAE 将自动驾驶划分为 L0-L5 级................................................................................................... 41 百度自动驾驶研发领先腾讯和阿里................................................................................................ 42 立足企业恒久发展 5 服务国家大局战略
6. 恒大研究院研究报告 应用 机器翻译 刷脸支付 智能分发 图片美化 智能语音 辅助驾驶 资料来源:恒大研究院 1 人工智能:已融入多个生活场景,未来有望引 爆新一轮技术革命 1.1 人工智能已嵌入多个生活场景,被寄望为下一轮技术革 命 人工智能落地于多个场景,让人类生活变得更加美好。目前不少智能 手机应用已经嵌入人工智能技术,如机器翻译、智能分发、图片美化、智 能语音等,汽车也装载了辅助驾驶系统。机器翻译降低了不同文化间交流 的门槛,智能分发实现了“千人千面”的资讯分发,智能语音让人机互动 方式从键盘转变为语音,辅助驾驶让人类驾驶汽车变得更加轻松、容易。 人工智能有望成为全球经济增长的新引擎,因此被视作是互联网之 后的新一轮技术革命。人工智能促进经济增长的影响机制存在于以下方 面:  替代固定、繁琐和标准化工作,释放劳动力,既缓解人口老龄化时代 劳动力短缺,也提升劳动生产率,如机器翻译替代部分翻译的工作, 智能分发替代部分编辑的工作,智能语音替代部分客服助手工作,未 来的自动驾驶将替代驾驶员工作。  提升资源配置效率,如智能分发将资讯、广告等信息资源精准投放给 需求用户。  减少社会生产中的损耗,如自动驾驶避免了疲劳驾驶、违反交通规则 等所产生的交通事故。 基于上述三大机制,人工智能将使基于场景的微观领域创新传导至宏观 经济领域,技术进步提升社会生产率,打开新的增量空间,人工智能因此 被寄望为新一轮技术革命。 图表1:人工智能已落地于多个生活场景 功能 典型产品 利用计算机将一种自然语言(源语言)转 换为另一种自然语言(目标语言) 利用人脸来进行身份识别并完成支付结 算 将资讯、广告等信息自动且精准推送给 需求用户 识别、分类图像中的人像,并且利用算法 进行美化 识别、理解人类语音,并且实现问答、助 理和搜索等功能 完成自动泊车、保持车道、紧急刹车和辅 助倒车等功能 谷歌翻译、百度翻译 支付宝 今日头条 美图秀秀 Siri、小爱同学、度秘 Autopilot 立足企业恒久发展 6 服务国家大局战略
7. 恒大研究院研究报告 1.2 前景判断:短期或不及预期,长期仍充满希望 新技术革命依赖人工智能技术水平提升,奇点是业界和学界讨论焦 点。以新技术革命来定位人工智能意味着其不仅需要覆盖更多的应用场 景,而且需要更高的智能程度。因此人工智能有了“奇点”概念:奇点是 一个时刻,过了该时刻,人工智能的智能化程度将指数式上升,且拥有自 我完善能力,超越人类智慧,预测技术发展奇点是人工智能领域关注焦点。 对技术发展来说,短期将不及预期,长期仍有望引爆新一轮技术革 命,当前技术发展水平看自动驾驶。此轮以数据驱动的人工智能发展浪潮 (详见第 4 部分)存在部分硬伤:1)数据驱动意味着计算机无法理解规 则关联的内在机理,因此缺乏人类的推理能力和常识认知能力。2)深度 学习必须以海量数据作为训练集,缺乏人类快速提取特征能力(如看 iphone 一眼后就可以认出它),因此训练速度受到制约。此外,摩尔定律 逐渐失效让计算机数据采集、处理和存储能力短期内赶超人脑存疑,且生 命科学对人脑运作机理的探索速度比计算机科学发展要慢得多,数据驱 动的人工智能发展路径短期内难以被替代。因此人工智能短期内很难大 规模替代人类工作,短期技术发展程度和速度或不及预期,但是长期来看 人工智能始终处于螺旋上升通道中,未来仍然有望引爆新一轮技术革命。 面向特定领域的弱 AI 仍是当前技术发展重点,自动驾驶市场规模大且汇 聚技术、人才和资本,自动驾驶的技术能力和商业化程度是当前观察人工 智能技术发展水平的重要指标。 对产业发展来说,短期看商业模式,中期看公司技术研发,长期看基 础研究突破。短期来说,产业爆发需要将现有的技术条件更好地与应用场 景结合,创新服务模式来满足原有产品所难以满足的需求,例如今日头条 的“千人千面”精准分发和智能音箱的人机语音互动。中期来说,企业层 面的研发能力是关键,技术研发将提升和优化技术水平,解决产品中的技 术痛点,如计算机视觉企业能否提升复杂环境下动态人脸识别准确度将 直接决定智能安防的应用程度。长期来说,产业发展依赖算法、芯片等领 域基础研究突破,此轮人工智能浪潮正是源于深度学习理论的突破(详见 第 3 部分)。 立足企业恒久发展 7 服务国家大局战略
8. 恒大研究院研究报告 2 概念、标准与分类:人类思维和行为的模拟,目 前仍处于弱人工智能时代 2.1 概念:人类思维和行为的模拟 人工智能(Artificial Intelligence,简称 AI)是“模拟”人类思 维和行为的系统。人工智能对人类的“模拟”包括思考方式、行为规划和 学习能力等范围,最终目的是像人类一样感知周边环境并且做出反应。 图表2:人工智能的概念定义 来源 作者 概念定义 《2017 中国人工 智能系列白皮书中国人工智能创 新应用》 《人工智能》 《人工智能:一 种现代的方法》 《人工智能标准 化白皮书(2018 版)》 中国人工智能协 利用计算机模拟人类智能行为的科学,涵盖了训练计算机使 会、罗兰贝格 其能够完成自主学习、判断、决策等人类行为的范畴。 李开复、王咏刚 Stuart Rusell、 Peter Norvig 中国电子技术标 准化研究院 1) 让人觉得不可思议的计算机程序。 2) 与人类思考方式相似的计算机程序。 3) 与人类行为相似的计算机程序。 4) 会学习的计算机程序。 5) 根据对环境的感知,做出合理的行为,并且获得最大收 益的计算机程序。 能感知周围环境并采取行为以最大限度地实现其目标的系 统。 利用数字计算机或者数字计算机控制的机器模拟、延伸和扩 展人的智能,感知环境、获取知识并使用知识获得最佳结果 的理论、方法、技术及应用系统。 资料来源:恒大研究院 2.2 标准:图灵测试 图灵测试是判定机器智能与否最悠久、最经典的方法。人工智能是 “模拟”人类思维和行为的系统,但是模拟能力本身就是一个连续的光谱, 模拟能力只有超过某个标准,系统才会被认为是智能的。1952 年,图灵 在《计算机械与智能》(Computing Machinery and Intelligence)一文 中提出了“图灵测试”来验证机器有无智能:如果一台机器能够与人类展 开交流,且有超过 30%的人无法在规定时间内识别出与自己交谈的是人还 是机器,那么这台机器就具有智能。图灵测试提出至今已超过 60 年,不 过目前机器仅在短时长和细分领域的测试中通过了图灵测试。后来的计 算机科学家也提出了其他界定人工智能的标准,包括能否实现语音识别、 机器翻译、文本的自动摘要或者写作、战胜人类的国际象棋冠军、自动回 答问题。 立足企业恒久发展 8 服务国家大局战略
9. 恒大研究院研究报告 图表3:目前机器仅在短时长和细分领域的测试中通过了图灵测试 领域 时间 事件 文字交互 语音交互 营销文案 2014 年 6 月 2018 年 5 月 2018 年 7 月 机器人 Eugene Goostman 伪装成一个 13 岁的乌克兰男孩,在 5 分 钟的测试时长中取得了 33%成功率。 谷歌母公司 Alphabet 的董事长 John Hennessy 表示,在商务预约 领域,能够模仿真人语气的 Duplex 已经通过了图灵测试。 阿里巴巴的数字营销部门阿里妈妈发布了一款 AI 文案生成工具并 通过了图灵测试。 资料来源:搜狐科技,恒大研究院 2.3 分类:弱 AI、强 AI 和超强 AI 当前人工智能世界处于弱人工智能时代,人工智能还无法拥有人类 的推理、规划和学习等能力,超强人工智能仅存于哲学层面。为区分人工 智 能 的 智 能 程 度 , 人 们 提 出 了 弱 人 工 智 能 ( Artificial Narrow Intelligence , 简 称 ANI ) 、 强 人 工 智 能 ( Artificial General Intelligence , 简 称 AGI ) 和 超 强 人 工 智 能 ( Artificial Superintelligence,简称 ASI)三个分类。当前人工智能处于弱人工智 能的发展阶段,系统仅能解决某个特定问题,且往往扮演辅助工具的角色。 例如,AlphaGO 仅限于利用“大数据+深度学习”来推算围棋每一步获胜 的概率,但是并不了解每一步背后的原理。强人工智能仍然无法实现,人 工智能尚无法拥有人类推理、规划和学习能力,超强人工智能甚至只能从 哲学和科幻角度进行探讨。 图表4:当前人工智能世界处于弱人工智能时代 层级 定义 特点 弱人工智能 强人工智能 超强人工智 能 专注于且只能解决单个特定 领域问题的人工智能 能够胜任人类所有工作的人 工智能 在科学创造力、智能和社交 能力等每一个方面都比最强 人类大脑聪明的人工智能 功能上的局限性 拥有推理、知识表示、规划、学习、使用 自然语言沟通和整合实现既定目标的能力 尚无从技术角度探讨的可能性 资料来源:《人工智能》(李开复和王咏刚,2017),恒大研究院 典型代表 AlphaGO、无 人驾驶 无 无 立足企业恒久发展 9 服务国家大局战略
10. 恒大研究院研究报告 3 人工智能的“前身今世”:螺旋式发展,深度学 习开启新浪潮 图表5:人工智能发展历程 资料来源:CSDN,《人工智能》(李开复和王咏刚,2017),《智能时代》(吴军,2016),恒大研究院 3.1 起步时期:达特茅斯会议提出人工智能概念,人机对话 小程序 ELIZAL 令人惊艳  兴起:达特茅斯会议提出人工智能概念,人工智能迎来第一轮繁荣期。 1956 年达特茅斯会议,麦卡锡(John McCarthy)、明斯基(Marvin Minsky)、罗切斯特(Nathaniel Rochester)和香农(Claude Shannon) 等首次提出“人工智能”术语。此后,麻省理工大学、卡内基梅隆大 学等学府均建立人工智能实验室,美国国防高级研究计划署投入了 大笔研究资金,研究者也乐观认为“二十年内机器将能完成人能做到 的一切”。  标志事件:人机对话小程序 ELIZA 面世,智能交互能力令人惊艳。资 金投入和人才涌入产生了一批显著成果,其中人机对话小程序 ELIZA 是第一款人机对话程序。Eliza 被设计成一个可以通过交谈帮助病人 完成心理恢复的精神治疗医师,程序模拟人的反应来回答用户问题。  衰落:计算机技术制约早期人工智能发展,明斯基的《语义信息处理》 催生行业拐点。乐观情绪伴随着早期人工智能,但研究始终受制于当 时技术瓶颈:计算机性能制约了早期程序的应用、程序处理的对象少 且复杂性低、机器无法读取足够数据来实现智能化。1968 年,明斯 基在《语义信息处理》(Semantic Information)一文中指出了人工 智能的局限性:人们对语言的理解不是来源于语法和语义,而是来自 常识,人工智能无法拥有该能力,也就不可能实现人的智能。明斯基 的论文直接导致美国政府大规模削减人工智能研究经费。 3.2 专家系统时期:“知识库+推理机”组合实现人工智能 商用化  兴起:专家系统 XCON 为 DEC 公司每年节省数千万美元,人工智能迎 来新一轮繁荣。专家系统是基于知识的智能计算机程序系统,其内部 根据该领域大量的专家知识与经验进行推理和判断,即利用“知识库 +推理机”来模拟专家决策。1968 年第一台专家系统 DENDRAL 面世, 其可用于推断化合物的可能分子结构。1980 年卡内基梅隆大学为 DEC 立足企业恒久发展 10 服务国家大局战略
11. 恒大研究院研究报告 公司设计了专家系统 XCON,每年可为 DEC 省下超过 4000 万元经费, 人工智能商业化带动了新一轮产业热潮。  标志事件:日本斥资 8.5 亿美元研发第五代计算机。专家系统使人 工智能商业化落地 ,并且诞生了 Symbolics 、Lisp Machines、 IntelliCorp 和 Aion 等软硬件公司,日本甚至斥资 8.5 亿美元用以 研发第五代能够像人一样推理的计算机。  衰落:苹果和 IBM 台式机性能超过 Symbolics 等厂商生产的通用计 算机,专家系统逐渐淘汰。专家系统复杂而精密,使其造价和维护费 用居高不下,然而功能却仅限于极其狭小的领域,1987 年苹果和 IBM 公司生产的台式机性能都超过了 Symbolics 等厂商生产的通用计算 机,彻底终结了此轮以专家系统主导的人工智能浪潮。 3.3 深度学习时期:Hinton 论文开启人工智能新浪潮, Alphago 战胜人类世界冠军  兴起:2006 年 Hinton 提出了神经网络 Deep Learning 算法,开启了 深度学习在学术界和工业界的浪潮。Hinton 的深度学习打破了传统 BP 神经网络的短板:1)多隐层的人工神经网络具有优异的特征学习 能力,从而有利于可视化或分类。2)人工神经网络的训练难度可通 过“逐层初始化”来克服。  标志事件:Alphago 战胜人类世界冠军,微软语音识别错误率降至 5.5%。深度学习算法使人工智能获得突破性进展:在围棋领域,2016 年 3 月基于深度学习算法的 AlphaGo 成为了第一个击败人类围棋世 界冠军的人工智能程序,2016 年末 2017 年初该程序以 Master 为账 号与中日韩数十位职业围棋高手对弈,连续 60 局无一败绩。在语音 识别领域,深度学习突破了技术瓶颈,大幅降低语音识别的错误率, 2017 年微软转录 Switchboard 语料库录音的错误率已降至 5.5%。 图表6:深度学习使语音识别获得突破性进展 语音识别错误率(%) 25.0% 23.6%23.6%23.6%引入深度学习 20.0% 15.0% 10.0% 5.0% 18.7% 16.1% 13.4% 10.7% 8.0% 5.9% 5.5% 0.0% 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 资料来源:中国信通院,恒大研究院 立足企业恒久发展 11 服务国家大局战略
12. 恒大研究院研究报告 4 技术+政策+资本助力行业发展,Alphago 引爆 行业风口 4.1 新风口:未来十年人工智能或使全球 GDP 增长 12% 人工智能已成新风口,未来十年或使全球 GDP 增长 12%,以 FAAG 和 BAT 为首的科技巨头均涉猎人工智能,其中不少企业布局了全产业链。  市场规模:从全球来看,根据赛迪研究院估算,2018 年 AI 市场规模 预计达 2697.3 亿元,且呈加速增长态势。《经济参考报》统计国内外 20 家权威机构预测数据,未来十年 AI 将使全球 GDP 增长 12%,近 10 万亿美元。从中国来看,根据国务院发展规划,2020 年、2025 年和 2030 年中国 AI 核心产业规模将分别超 1500 亿元、4000 亿元和 10000 亿元,并且带动数万亿规模的相关产业。  巨头布局:中美科技巨头均涉足人工智能产业,Facebook、Amazon、 Google、Mircrosoft 和百度甚至布局了芯片、技术平台/框架、消费 级产品和行业解决方案的人工智能全产业链。其中,智能音箱 Echo、 智能超市 Amazon go、TensorFlow 系统、小冰聊天机器人、Watson、 Apollo、DuerOS 均已成为行业内的现象级产品。 图表7:中国人工智能发展规划目标 时间 核心产业规模(亿元) 带动相关产业规模(亿元) 2020 年 1500 10000 2025 年 4000 50000 2030 年 10000 100000 资料来源:《新一代人工智能发展规划》(国务院,2017),恒大研究院 立足企业恒久发展 12 服务国家大局战略
13. 恒大研究院研究报告 图表8:以 FAAG 和 BAT 为首的科技巨头均涉足人工智能产业 公司 芯片 技术平台/框架 消费级产品 行业解决方案 Facebook 神经网络训练硬件系统 Big Sur Apple Apple Neural Engine Amazon Annapurna ASIC Google 定制化 TPU、Cloud TPU、量子计算机 Mircrosoft FPGA 芯片 IBM 人脑模拟芯片 SyNAPSE 腾讯 百度 DuerOS 芯片 阿里巴巴 平头哥 资料来源:恒大研究院 深度学习模块 Torchenet、FBLearner Flow AWS 分布式机器学习平 台 TensorFlow 系统、 Cloud Machine Learning Engine 分布式机器学习工具包 DMTK、Bot Framework SystemML 腾讯云平台、Angel、 NCNN Paddle-Paddle PAI2.0 聊天机器人 Bot、人工 智能管家 Jarvis、智能 照片管理应用 Moment 可视化地图 Mapsense GPS 智能音箱 Echo、Alexa 语音助手、智能超市 Amazon go、PrimrAir 无人机 谷歌无人车、Google Home Skype 即时翻译、小冰 聊天机器人、Cortana 虚拟助理、Tay、智能 摄像头 A-eye、 Hololens 全息眼镜 WechatAI、 Dreamwrit、腾讯觅影 百度识图、百度无人 车、度秘 智能音箱天猫精灵 X1、 智能客服“阿里小蜜” 人脸识别技术 DeepFace、DeepMask、 SharpMask、 MultiPathNet Siri、IOS 照片管理、 自然语音处理 Vocal IQ Amazon Lex、Amazon Polly、Amazon Rekognition Voice Intelligence API、Google Cloud、 Deepmind 微软认知服务 Watson、Bluemis、 ROSS 智能搜索引擎“云搜” 和中文语义平台“文 智”、优图 AI 开放平台 Apollo、DuerOS ET 城市大脑 4.2 算法+算力+数据:行业发展的核心驱动力 4.2.1 算法:从传统机器学习到人工神经网络,深度学习大幅提升 机器学习能力 人工智能算法经历了基于既定规则系统、传统机器学习和深度学习 三个时代:  基于既定规则系统:人类搭建智能背后的逻辑关联,即人工提取 特征,并且构建特征之间的“IF…THEN…”关联规则。  传统机器学习算法:由机器构建逻辑关联,即人工提取特征后, 由机器根据输入的特征和分类构建“IF…THEN…”关联规则,其 本质是实现特征学习器功能。传统机器学习算法(如支持向量机 和决策树)的扩展性较差,适合小数据集,其始终难以模拟现实 世界的特征规律。  深度学习算法:特征提取和规则构建均由机器完成。深度学习是 一个复杂的、包含多个层级的数据处理网络,根据输入的数据和 分类结果不断调整网络的参数设置,直到满足要求位置,形成特 征和分类之间的关联规则。因此,深度学习由海量数据驱动,如 支撑图像识别的数据库 ImageNet 是一个百万量级图片数据集。 立足企业恒久发展 13 服务国家大局战略
14. 恒大研究院研究报告 人工神经网络是最典型的深度学习算法,深度学习的隐含层数量 将决定网络的拟合能力。 图表9:深度学习算法的特征提取和规则构建均由机器完成 资料来源:《人工智能》(李开复和王咏刚,2017),知乎,恒大研究院 30.0% 25.0% 图表10:隐含层数量增加大幅降低了图像识别错误率 28.2% 25.8% 图像识别错误率(%) 20.0% 15.0% 10.0% 5.0% 0.0% 8 层神经网络 16.4% 8 层神经网络 11.7% 19 层神经网 络7.3% 22 层神经网 6.7络% 152 层神经网 3络.5% 2010年 NEC美国 2011年 Xerox 2012年 AlexNet 2013年 Clarifi 2014年 VCG 2014年 GoogleNe t 2015年 ResNet 资料来源:ImageNet,《人工智能》(李开复和王咏刚,2017),恒大研究院 立足企业恒久发展 14 服务国家大局战略
15. 恒大研究院研究报告 4.2.2 数据:互联网孕育大数据时代,为深度学习提供外部支撑 互联网造就了大数据时代,海量、多维度数据为机器学习提供了养 料。数据驱动是深度学习算法区别于传统机器学习的关键点,因此深度学 习算法需要以海量大数据作为支撑。人工神经网络算法起源于 20 世纪 40 年代,此轮兴起一定程度上源于互联网带动数据量爆发。互联网生产并存 储大量图片、语音、视频以及网页浏览数据,移动互联网更是将数据拓展 到线下场景,线下零售消费、滴滴打车等数据丰富了大数据维度。灼识咨 询数据显示,全球结构化数据从 2013 年的 0.8ZB 增长至 2017 年的 2.3ZB (1ZB=10244GB),非结构化数据从 2013 年的 3.6ZB 增至 2017 年 11.3ZB, 两者复合增长率分别为 30.2%和 33.1%,预计 2022 年将达到 18.9ZB 和 55.7ZB。 图表11:数据爆发式增长支撑了人工智能发展 全球结构化数据(ZB) 结构化数据同比增长 60 全球非结构化数据(ZB) 非结构化数据同比增长 55.7 60% 39.5 40 40% 28.2 21.3 18.9 20 15.5 20% 11.3 12 3.6 4.7 0.8 0.9 6.2 8.3 1 1.5 2.3 3.5 5.3 7.7 0 0% 2013 2014 2015 2016 2017 2018E 2019E 2020E 2021E 2022E 资料来源:灼识咨询,恒大研究院 注:1ZB≈1.1 万亿 GB(即 10244GB) 4.2.3 算力:GPU 芯片提供高效计算能力,加速深度学习训练 “大数据+多层神经网络”需要高速和大规模算力作为支撑,GPU 芯 片弥补了 CPU 在并行计算上的短板,大规模、高速率的算力加速了深度 学习训练。“大数据+多层神经网络”意味着深度学习需要利用数据进行拟 合,即不断地迭代、试错以挖掘最优的关联规则,因此深度学习需要以算 力作为支撑。  CPU 芯片:擅长逻辑控制和串行计算,大规模和高速率计算能力不足。 从 CPU 芯片架构来看,负责存储的 Cache、DRAM 模块和负责控制的 Control 模块占据 CPU 的大部分,而负责处理计算的 ALU 仅占据了很 小一部分,因此 CPU 难以满足大规模和高速率的计算需求。  GPU 芯片:擅长并行计算,加速深度学习训练。GPU 芯片最初用于电 脑和工作站的绘图运算处理,对图片每个像素的处理是类型统一但 数量众多的工作,负责计算的 ALU 单元占据了 GPU 架构大部分,GPU 可一次执行多个指令算法。以英伟达的 GPU 芯片为例,Tesla P100 和 Tesla V100 的推理学习能力分别是传统 CPU 的 15 倍和 47 倍。 2011 年 GPU 被引入人工智能,并行计算加速了多层人工神经网络训 练。 立足企业恒久发展 15 服务国家大局战略
16. 恒大研究院研究报告 图表12:GPU 芯片的计算单元数量远甚于 CPU 芯片 计算单元 资料来源:物联网智库,恒大研究院 图表13:GPU 芯片推理计算能力数十倍于 CPU 芯片 GPU相对CPU的推理学习能力(倍) 50 47X 40 30 20 15X 10 1X 0 1X CPU Tesla P100 资料来源:英伟达官网,恒大研究院 Tesla V100 4.3 政策+资本:行业发展的沃土 政策的密集出台和资本的频频介入为人工智能行业发展提供了沃土, 使技术逐渐转化为商业实践。  政策支持:中国、美国和欧洲均出台了产业发展规划,中国对人工智 能产业的政策支持力度不断加大。中国对于人工智能产业的政策支 持力度不断加大,2015 年人工智能仅是中国制造 2050 和互联网+战 略的子集,而 2017 年人工智能形成了独立战略规划和实施细则,且 进入政府工作报告和十九大报告。2016 年,美国白宫陆续发布了《为 了人工智能的未来做好准备》、《美国国家人工智能研究与发展战略规 划》和《人工智能、自动化和经济》等报告,为美国人工智能产业发 展制定宏伟蓝图。此外,法国、欧盟和日本也均推出了人工智能战略。 立足企业恒久发展 16 服务国家大局战略
17. 恒大研究院研究报告 图表14:中国不断加大对人工智能产业的政策支持力度 时间 政策名称 发文机构 核心内容 2015 年 5 月 《中国制造 2025》 2015 年 7 月 2016 年 3 月 《国务院关于积极推进 “互联网+”行动的指导意 见》 《中华人民共和国国民经 济与社会发展第十三个五 年发展规划纲要》 2017 年 3 月 《2017 年政府工作报告》 2017 年 7 月 《国务院关于印发新一代 人工智能发展规划的通 知》 2017 年 10 月 《十九大报告》 2017 年 12 月 《促进新一代人工智能产 业发展三年行动计划 (2018-2020 年)》 国务院 国务院 全国人大 国务院 国务院 政治局 工信部 把智能制造作为两化融合的主攻方向;着力 发展智能产品与智能制造,推动生产过程智 能化。 将人工智能作为 11 项重点行动之一,加快人 工智能核心技术突破,促进人工智能在智能 家居、智能终端、机器人等领域的应用。 重点突破新兴领域人工智能技术。 首次将人工智能写入全国政府工作报告,加 快培育人工智能等新兴产业,把智能制造作 为主攻方向。 确定新一代人工智能发展三步走战略,人工 智能上升为国家战略。 人工智能写入十九大报告,推动人工智能与 实体经济的融合。 细化和落实人工智能发展战略,以信息技术 与制造技术深度融合为主线,以新一代人工 智能技术的产业化和集成应用为重点,推动 人工智能与实体产业的深度融合。 资料来源:恒大研究院  资本介入:2017 年全球人工智能融资规模达 152.42 亿美元,中国人 工智能融资规模已超美国。全球人工智能融资规模从 2013 年的 17.4 亿美元增至 2017 年的 152.4 亿美元(约合 1054.0 亿人民币),年复 合增长率 72.0%。2017 年中国人工智能融资额 825.0 亿人民币,融资 事件数 441 起。根据 CB Insight 数据,2017 年中国人工智能融资规 模占全球的 49%,而美国仅为 38%。 图表15:2017 年全球 AI 融资额达 152.4 亿美元 全球AI融资额(亿美元) 全球AI融资笔数(笔) 200 1600 1349 150 1200 152.4 100 888 800 635 50 482 310 62.6 400 17.4 34.8 45.7 0 0 2013 2014 2015 2016 2017 资料来源:CB Insight,恒大研究院 图表16:2018 年 1-9 月中国 AI 融资额 825 亿元 1,000 中国AI融资额(亿元) 中国融资事件数(笔) 441 600 800 469 492 825 500 400 600 341 645 300 400 200 156 384 53 272 200 100 24 101 0 0 2013 2014 2015 2016 2017 2018 资料来源:IT 桔子,恒大研究院 注:2018 年数据截止至 9 月 30 日 立足企业恒久发展 17 服务国家大局战略
18. 恒大研究院研究报告 图表17:2017 年中国人工智能融资规模已超美国 其他 13% 美国 38% 中国 49% 资料来源:CB Insight,恒大研究院 4.4 Alphago:引爆风口的催化剂 AlphaGO 战胜李世石九段标志人类最后棋类智力堡垒的失守,人工智 能行业热度被彻底引爆。早在 1997 年,IBM“深蓝”就战胜了世界冠军卡 斯帕罗夫,但是围棋比国际象棋难了 6-9 个数量级,围棋也因此被视作 是人类棋类智力的最后堡垒。2016 年 3 月 AlphaGO 战胜李世石九段点燃 了人工智能的热度,AlphaGO 使人们意识到人工智能技术的发展水平远甚 于人类预期,人力资本和资金开始大规模涌入。2017 年 10 月,DeepMind 推出 AlphaGO Zero,AlphaGO Zero 在没有人类经验情况下通过自我对弈 实现自我学习,这意味着部分领域的人工智能不需要人类经验就能实现 智能化。 5 人工智能产业链:基础层+技术层+应用层,中 国基础层存不足 5.1 产业链初探:基础层+技术层+应用层 人工智能产业链分为基础层、技术层和应用层。基础层提供算力和算 法,技术层致力于解决不同类别问题,应用层将技术应用于商业场景。  基础层:包含硬件和软件,分别提供算力和算法框架。人工智能技术 层由芯片和算法框架组成,芯片主要为深度学习的训练和推理提供运 算能力,算法框架是人工智能开发的“操作系统”,为开发者提供编 程环境和算法模块。目前中国企业尚未深度涉足基础层,芯片研制和 生产以及算法框架设计基本由国外巨头垄断。  技术层:致力于解决具体类别问题,语音识别、自然语言处理和计算 机视觉是主要方向。技术层开始使用机器学习和深度学习算法来解 决具体的语音或图像问题,并且根据问题导向划分为语音识别、自然 语言处理和计算机视觉三大技术方向,识别准确率等技术能力指标是 技术层关注焦点。  应用层:将技术运用于商业场景,模拟人类以解决实践问题。应用层 将语音识别、自然语言处理和计算机视觉直接应用于实践产品,如金 立足企业恒久发展 18 服务国家大局战略
19. 恒大研究院研究报告 融、医疗、安防等领域。应用层由“技术水平+用户体验”双轮驱动, 且用户体验更为关键,产品能否洞察人性、迎合用户需要将决定产品 成败。目前人脸识别认证、安防视频搜索和智能音箱已迈向成熟,而 自动驾驶、医疗影像诊断等产品处于探索期。 图表18:人工智能产业链分为基础层、技术层和应用层,科技巨头普遍涉足多个环节 资料来源:恒大研究院 5.2 产业链布局:中国偏好技术成熟、可应用性强的领域 5.2.1 中美对比:中国侧重技术层和应用层,美国侧重基础层 对比中美 AI 产业链布局(2017 年 7 月前),中国偏好技术相对成熟 的应用层和技术层(如语音识别和计算机视觉),而美国对需要长周期、 基础研究的芯片和技术平台的关注度明显超过中国。  企业分布(2017 年 7 月):中国技术层和应用层 AI 企业数与美国差 距较小,而基础层差距尤为明显。中国芯片、技术平台企业数仅为美 国 42.4%和 24.3%,而技术层和应用层差距较小,技术相对成熟的语 音识别和计算机视觉的企业数为美国的 150%和 76.8%,仍处于探索 期的自然语言处理仅为美国的 36.5%。  累计融资规模(截止 2017 年 7 月):中国在语音识别、计算机视觉 和智能无人机领域的累计融资规模超过美国,芯片融资规模差距明 显。中国人工智能融资同样投向了技术相对成熟、可应用性强的领域, 如语音识别、计算机视觉、智能机器人、自动驾驶的融资规模超过了 美国,而芯片企业融资仅为美国的 4.3%。  累计融资事件数(截止 2017 年 7 月):中美应用层融资事件均超基 础层和技术层,美国芯片领域融资事件数已比肩应用层。中美在无人 机、智能机器人和自动驾驶领域融资事件数明显超基础层和应用层, 表明技术层的通用技术需要根据细分应用场景进行再开发,使产品 有效结合技术和用户体验,这为小型企业切入人工智能提供机会。 立足企业恒久发展 19 服务国家大局战略
20. 恒大研究院研究报告 图表19:中美 AI 基础层企业数差距明显(2017 年 7 月) 中国 美国 中国企业数/美国企业数 300 200 100 42.4% 33 14 0 150.0% 144 24.3% 35 3624 252 190 146 92 76.8% 36.5% 56.0% 91 51 137.4% 125 91 75.6% 3141 160% 120% 80% 40% 0% 资料来源:腾讯研究院,恒大研究院 图表20:中国芯片累计融资规模仅为美国 4.3%(截止 2017 年 7 月) 中国 美国 中国融资规模/美国融资规模 400 300% 308.18 300 216.3% 233.2% 200% 159.9% 200 30.1% 134.67 158.3 147.4% 4.3% 85.5 122.36 100 13.28 25.76 30.87 19.31 90.9% 87.3% 107.15 73.2 30.92 56.82 72.7 13.26 65.08 100% 0 0% 资料来源:腾讯研究院,恒大研究院 图表21:中美应用层融资事件多于基础层和技术层(截止 2017 年 7 月) 中国 美国 中国融资事件数/美国融资事件数 600 400 343 114.8% 178.9% 311 200% 414 160% 120% 200 114 132115 33.2% 85.1% 4047 32.0% 1650 6838 171 55.0% 176 80% 115 42 40% 23.9%27.8% 0 0% 资料来源:腾讯研究院,恒大研究院 立足企业恒久发展 20 服务国家大局战略
21. 恒大研究院研究报告 5.2.2 中国融资事件分析:大市场且技术成熟领域受资本追捧 市场规模和技术成熟度是中国 AI 投资关注焦点。为了解近 2 年 AI 领域投融资状况,我们分析 IT 桔子 AI 融资数据库中 2017 年至今且金额 过亿的融资事件(共 92 笔),发现中国 AI 投资偏好未发生改变,即应用 层和相对成熟的技术层的融资事件数依旧超过基础层。此外,市场规模和 技术成熟度是决定融资能力的核心因素:  大市场的细分领域被资本追逐。自动驾驶、AI+医疗和计算机视觉融 资数明显超过其他领域,其中自动驾驶和 AI+医疗市场规模大,计算 机视觉通用性强,应用场景覆盖新零售、安防等多个领域。  技术趋于成熟且已有产品落地的领域是投资热点。在金额超过 5 亿 人民币的中国企业融资事件中,计算机视觉占据 9 笔,且合计金额超 200 亿元,语音识别占据 3 笔。自动驾驶和 AI 芯片处于研发初期, 因此芯片领域仅寒武纪获得过亿美元融资,自动驾驶领域则有多笔 资金投向了海外企业。 图表22:大市场且技术成熟领域受中国资本追逐 金额超过1亿元融资事件数 金额超过5亿元中国企业融资事件数 基础层 20 技术层 应用层 其中 7 笔投向海外企业 17 9 笔 融 资 合 计 超 15 200 亿 15 13 14 寒武纪 B 轮 10 融 资 达 数 亿 9 美元 7 7 5 5 5 2 1 3 33 2 2 1 1 1 0 资料来源:IT 桔子,恒大研究院 立足企业恒久发展 21 服务国家大局战略
22. 恒大研究院研究报告 6 基础层:芯片+开发框架 6.1 芯片:GPU 带来算力革命性突破,未来发展瞄准 AI 专用 芯片 人工智能引入 GPU 突破 CPU 并行计算短板,GPU、FPGA 和 ASIC 各有 优劣。“大数据+人工神经网络”的人工智能模式将海量数据切割进行并行 计算,这需要芯片作为硬件支撑。目前市场上的人工智能芯片主要有 GPU、 FPGA 和 ASCI 三类。  GPU:通用性强,但功耗高,目前仍是人工智能芯片首选。GPU 全称 图形处理器(Graphics Processing Unit),起初是专用于图像运算 的微处理器。人工智能训练有大量浮点计算和矩阵计算,GPU 计算的 内部并行度高,GPU 恰好突破了 CPU 在并行计算上的短板,为深度学 习带来革命性变化。GPU 通用性强,不过功耗相对较高。  ASIC:人工智能专用芯片,功耗低,但研发门槛高。ASIC 全称专用 集成电路(Application-Specific Integrated Circuit)。与 GPU 的 通用性截然相反,ASIC 特点是专用性,ASIC 根据任务和算法量身定 制芯片,结构上节省大量没有使用的逻辑实现,同等工艺下执行速度 超过其他类型芯片,且能耗更低。不过,ASIC 芯片无法更改任务目 标,适用的算法相对有限,研发周期明显长于其他类型芯片。Google 的 TPU 与寒武纪的 NPU 是 ASIC 的典型代表。  FPGA:介于 GPU 和 ASIC 之间,提供逻辑可设计的电路平台。FPGA 全 称现场可编程门阵列(Field Programmable Gate Array),其折中于 通用型芯片 GPU 和专用型芯片 ASIC 之间,用户可根据需要设计逻辑, 支持重复编程。FPGA 使用灵活,用户可随意组合逻辑功能,且无需 介入芯片布线和工艺,效率略高于 GPU(GPU 乘法器和加法器数量固 定,应用环节可能造成功能浪费)。FPGA 功耗小于 CPU,但是大规模 开发难度大,总体性价比不占优。 图表23:GPU、FPGA 和 ASIC 各有优劣 资料来源:恒大研究院 6.1.1 GPU 市场格局:Intel、AMD 和 NVIDIA 三足鼎立,NVIDIA 领跑 AI 赛道 GPU 芯片技术发展历史悠久,行业巨头技术先发优势明显。GPU 市场 呈现 Intel、AMD 和 NVIDIA 三足鼎立格局,尚无中国厂商有能力参与市场 竞争。从 JPR 提供的 2017Q4 数据来看,在 PC GPU 市场,Intel 市占率达 到 67.4%,AMD 和 NVIDIA 则瓜分了剩余的市场份额,市占率分别达到 18.4% 立足企业恒久发展 22 服务国家大局战略
23. 恒大研究院研究报告 和 14.2%;在独立 GPU 市场,NVIDIA 以 66.3%市占率占据第一大市场份 额。 NVIDIA 推出多款面向人工智能的 GPU 芯片,领跑 AI 赛道。2016 年 4 月 NVIDIA 推出了面向人工智能设计的 GPU——Tesla P100,2017 年 5 月推出了升级版——Tesla V100,将深度学习训练速度提升了约 2.4 倍。 图表24:在 PC GPU 市场,AMD、Intel 和 NVIDIA 呈三足鼎立 100% 80% 17.5% AMD Intel NVIDIA 19.3% 18.4% 60% 68.1% 40% 67.8% 67.4% 20% 14.4% 0% 2016 资料来源:JPR,恒大研究院 13.0% 2017Q3 14.2% 2017Q4 图表25:在独立 GPU 市场,NVIDIA 占据第一大市场份额 100% AMD NVIDIA 80% 70.5% 60% 72.8% 66.3% 40% 20% 29.5% 27.2% 33.7% 0% 2016 资料来源:JPR,恒大研究院 2017Q3 2017Q4 图表26:Tesla V100 大幅缩短深度学习训练时间 一个工作日深度学校训练量花费时间(小时) 50 44 40 30 18 20 10 7.4 0 8块K80训练量 8块V100 8块V100 资料来源:NVIDIA 官网,恒大研究院 立足企业恒久发展 23 服务国家大局战略
24. 恒大研究院研究报告 6.1.2 FPGA 市场格局:Xilinx、Altera 占据主要市场份额,Intel 并购布局 FPGA 核心玩家是 Altera、Xilinx,其中 Altera 被 Intel 天价收购。 与 GPU 相似,FPGA 市场同样出现寡头垄断趋势,市场份额由 Altera、 Xilinx 瓜分。2016 年 Xilinx、Altera 的 FPGA 市占率分别达到 54%和 36%, 剩余 10%市场份额由 Microsemi 和 Lattice 等厂商占据。2015 年 6 月, Intel 宣布以 167 亿美元价格收购第二大 FPGA 厂商 Altera,丰富 AI 芯 片产品线。 图表27:FPGA 市场份额由 Altera、Xilinx 瓜分(2016 年) 其他 10% Altera 36% Xilinx 54% 资料来源:电子工程网,恒大研究院 6.1.3 谷歌 TPU 领跑 ASIC,寒武纪 NPU 是新生力量 ASIC 行业格局未定,谷歌 TPU 引爆人工智能专用芯片热潮,寒武纪 NPU 尝试弯道超车。  谷歌 TPU:内在需求驱动谷歌研发 TPU。2011 年谷歌测算发现,如果 用户每天使用 3 分钟谷歌提供的语音搜索服务,谷歌的数据中心就 必须扩大两倍,深度学习的海量数据处理需求驱动谷歌研发更高效 的芯片。大约在 2015 年,谷歌在内部数据中心上线了 TPU 芯片 (Tensor Processing Unit)。TPU 为机器学习量身定制,每个操作 执行所需晶体管数量更少,因此提升了深度学习效率。根据谷歌发表 的论文,TPU 平均比当前 GPU 或 CPU 快 15-30 倍,性能功耗比高出约 30-80 倍。  寒武纪 NPU:避开传统芯片红海市场,发力智能芯片旨在弯道超车。 寒武纪脱胎于中科院学术团队,主要面向人工智能专用芯片,目前已 是中国芯片领域的独角兽企业。寒武纪瞄准了智能芯片,避开 Intel、 AMD 等巨头垄断的传统芯片市场,尝试利用技术迭代来实现弯道超车。 寒武纪有智能处理器 IP、MLU 智能芯片和软件开发环境三条产品线, 分别面向终端、云端和开发者。NPU 芯片是寒武纪核心产品,目前已 推出了 1A、1H8 和 1H6 三款产品,其中华为首款 AI 手机芯片麒麟 970 已集成寒武纪 1A,并在华为 Mate 10 中实现大规模商用。 立足企业恒久发展 24 服务国家大局战略
25. 恒大研究院研究报告 图表28:寒武纪 NPU 芯片介绍 特点 Cambricon-1A Cambricon-1H8 Cambricon-1H16 国际上首个成功商用的深度学习处理器 IP 产品,可用于计算机 视觉、语音识别、自然语言处理等 面向视觉应用,低能耗和小面积,可用于安防监控、智能驾驶、 无人机等 1A 的高性能版,能效比提升数倍,通用性好,可用于计算机视 觉、语音识别、自然语言处理等 资料来源:寒武纪官网,恒大研究院 6.2 开发框架:“开源+巨头支持”模式,百度推出 PaddlePaddle 6.2.1 开发框架链接软硬件,降低 AI 使用门槛 人工智能开发框架为 AI 开发、深度学习提供了软件环境,降低 AI 应用门槛帮助开发者进行高效训练和推断。芯片提升了底层硬件支持,不 过硬件和软件之间需要链接纽带,人工智能开发框架即是人工智能开发 和应用的“操作系统”。人工智能开发框架主要功能包括为开发者提供编 程环境和硬件工具库、根据开发需要分配 GPU 等硬件资源,其最终目的 是为开发者提供模块化、通用、灵活的软件环境,使开发者只需要关注高 层结构,无需注意底层琐碎问题,降低人工智能开发和使用门槛。 6.2.2 市场格局:开源平台普遍背靠互联网巨头,百度推出 PaddlePaddle TensorFlow、Torch、Caffee、CNTK 等主流框架各有所长,百度推出 国内首个开源框架 PaddlePaddle。目前最主流的人工智能开发框架有 TensorFlow、Torch、Caffee、CNTK 等,主要面向深度学习开发,各平台 在稳定性、调试难度、执行速度、内存占用等方面各有所长。2013 年百 度宣布其深度学习开源平台 PaddlePaddle 在开源社区 Github 及百度大 脑平台开放,PaddlePaddle 是首个国内企业推出的开源框架。 “开源+巨头支持”是人工智能框架的主流模式,巨头介入或为内部 应用和搭建“框架-硬件”产业链条的双重需求。主流人工智能框架均采 用开源模式,但是普遍由科技巨头支持,TensorFlow 和 CNTK 由谷歌和微 软研发推出,Torch 和 MXNet 分别被 Facebook 和亚马逊推荐(作为公司 的主要深度学习框架,且为生态系统开发提供软件代码、文档和投资)。 我们认为“开源+巨头支持”模式或源于以下原因:1)人工智能仍处于发 展初期,开源框架有助于推广,且有利于知识溢出和行业发展。2)开源 框架仍然需要不断进行技术迭代和开发体验优化(如由李沐及社区贡献 者开发的 MXNet 框架就因为 API 文档和自定义教程过于简单而难以满足 开发者需要),这些均需要雄厚资金的支持。3)谷歌、亚马逊、百度等科 技巨头布局开源平台一方面源于企业内部深度学习应用需要,拥有开发 框架知识产权可以避免后续发展受制于人,另一方面则可建立“框架-硬 件”产业链条,借力开源框架推广自身的人工智能业务,进而带动后续的 AI 芯片和 AI 云服务业务(自己研发平台对自己产业链上下游产品支持度 更好)。 立足企业恒久发展 25 服务国家大局战略
26. 恒大研究院研究报告 TensorFlow Caffee Torch Cognitive Toolkit (CNTK) MXNet PaddlePaddle 图表29:主流人工智能开发框架 开发者 编程语言 特点 谷歌 UC Berkely 视 觉学习中心和 社区贡献者 Facebook 推荐 C++或 Python C++ Lua 通用、灵活、使用数据流图进行计算,并提供了 可视化工具,但是速度慢且占用内存大,模型库 不够丰富。 最主流的工业级深度学习框架,稳定、速度快、 数据量大,专注于图像处理(适合于图像分类的 卷积神经网络),但是可扩展性和可移植性较 差。 灵活且速度快,支持全面的卷积操作,但是需要 学习 Lua 语言,可扩展性较差(新加层需自我实 现)。 微软 C++、C#、 功能与 TensorFlow 相似,可同时利用多台服务 Java、Python 器,但是缺乏可视化。 AWS 推荐 百度 C++ C++、Python 支持多 CPU 和分布式,速度快且节省内存,但是 API 文档较差。 易用、高效、灵活、可扩展,支持 Kubernetes 的深度学习库。 资料来源:百度百家号,CSDN,知乎,恒大研究院 7 技术层:语音识别+自然语言交互+计算机视觉 7.1 语音识别:正确率提升推动商业化,消费级产品或打破 市场格局 7.1.1 语音识别正确率已提升至 95%,颠覆人机交互模式仍需技术进 一步提升 深度学习将语音识别正确率提升至 95%,不过颠覆人机交互模式仍有 待于语音识别正确率提升。语音识别(Auto Speech Recognize,简称 AS) 是机器将语音转化为相应文本或命令的技术。从发展历史来看,语音识别 经历了 2 个技术阶段:1)GMM 计算概率分布-HMM 决策判断:GMM 是高斯 混合模型,HMM 是隐马尔可夫模型,两者结合将语音识别正确率提升至约 80%,不过该正确率仍然难以满足商业化需要。2)深度学习:2011 年深 度学习技术被引入语音识别,语音识别正确率突破了技术瓶颈(2017 年 识别正确率已达 95%),Siri、Google Assistant、Echo 等一系列商业化 产品随之涌现。不过,95%的正确率仅能满足偶尔使用需求,语音彻底取 代键盘成为最常用人机交互模式仍有待于正确率的进一步提升。 语音识别可分为“降噪-特征提取-解码”三个环节,深度学习提升 “特征-单词”映射正确率。语音识别首先对输入的语音信号进行清洗, 然后将信号切割成若干片段并抽取辨别单词的语音特征,最后根据深度 学习生成的语音模型将提取特征映射到单词。 立足企业恒久发展 26 服务国家大局战略
27. 恒大研究院研究报告 图表30:语音识别分为“降噪-特征提取-解码”三个环节 资料来源:CSDN,知乎,恒大研究院 7.1.2 市场格局:行业格局已初步形成,消费级产品助力科技巨头 后发制人 作为人工智能领域相对成熟的技术,语音识别市场格局已初步形成。 根据中国语音产业联盟数据,2015 年 Nuance 和科大讯飞分别占据全球和 中国语音市场的头把交椅。  Nuance 是全球最大的语音识别厂商,2015 年全球市场份额达 31.6%。 Nuance 语音识别技术被用于苹果 Siri,旗下产品 Dragon Drive(车 载语音识别)用于奔驰、雷克萨斯、丰田、荣威等众多汽车品牌。  科大讯飞是中国智能语音产业的领导者,2015 年中国市场份额达 44.2%。科大讯以讯飞超脑、AIUI 为内核打造了 AI 开放平台,面向 教育、城市、汽车、医疗和家居等多个场景,其在电信、金融、能源、 交通、政府等主流行业的市场份额达到 80%以上。 技术趋于成熟且消费级产品出现为行业格局带来变数,谷歌、苹果、 亚马逊以及百度、阿里等中美科技巨头目前在语音识别赛道增长迅猛。 Nuance 和科大讯飞在技术上的先发优势使其占据了大量市场份额,不过 随着语音识别技术趋于成熟,行业发展重心从基础技术研发转向产品应 用,谷歌、亚马逊和苹果等互联网巨头的消费级产品或将颠覆现有的市场 格局,Echo、Google Assistant 等消费级产品的诞生驱动科技巨头涌入 语音市场,科技巨头的人才和资本优势以及消费级产品积累的数据将侵 蚀 Nuance 和科大讯飞的基础技术优势,传统头部企业市占率或进一步下 滑。  全球市场来看,Nuance 市场份额已从 2012 年的 62%下滑至 2015 年 的 31.6%,谷歌和苹果市场份额已提升至 28.4%和 15.4%。  中国市场来看,科大讯飞市场份额已从 2012 年的 54.3%下滑至 2015 年的 44.2%,百度则提升至 27.8%。 立足企业恒久发展 27 服务国家大局战略
28. 恒大研究院研究报告 图表31:全球和中国智能语音市场均已形成行业巨头(2015 年) 资料来源:中国语音产业联盟,恒大研究院 7.2 自然语言处理:实现机器“听得懂”,技术成熟度仍较 低 7.2.1 自然语言处理实现机器“听得懂”,语言规则复杂性制约技术 成熟度 自然语言处理主要解决机器“听得懂”问题,机器翻译、问答系统和 文 本 摘 要 是 其 主 要 应 用 场 景 。 自 然 语 言 处 理 ( Natural Language Processing,简称 NPL)主要解决机器“听得懂”问题,即理解人类语言 和文字,是人工智能的核心分支之一。自然语言处理也是人机互动闭环的 关键技术,计算机首先需要使用语义理解技术来分析用户输入的语言,进 而调取知识库,最后生成语言输出给用户。自然语言处理主要应用于以下 领域:  机器翻译:机器翻译将一种自然语言翻译到另一种自然语言,其不仅 包含了两种语言间词和短语的映射,而且需要根据上下文的语境表 征并结合自然语言知识图谱(基于海量数据训练)进行适当推理,最 后给出最合适、自然的翻译结果。  问答系统:问答系统旨在使计算机像人类一样用自然语言与人进行 交流,即人们向计算机提问并获取关联度较高的答案。问答系统目前 已广泛应用于聊天机器人、智能客服、智能手机助手。  文本摘要:文本摘要通过阅读文字段落进而将其中的核心内容提炼 出来。文字摘要已有广泛的应用场景,如新闻标题和关键词的提炼, 也包括谷歌、百度等搜索引擎的优化,实现搜索的“所见即所得”, 提升用户搜索的准确率。 语言的不确定性、不可预测性、长尾现象和非线性关联使自然语言 处理的技术成熟度较低。自然语言处理的技术成熟度明显逊于语音识别 和计算机视觉,其在技术上主要面临以下挑战:1)词法、句法、语义、 语用和语音的不确定性。2)新的词汇、术语、语义和语法的不可预测性。 3)数据不充分的长尾现象,即数字资源难以覆盖全部语言现象。4)语义 知识的非线性关联,即语义关联难以用简单数学模型描述。以“我们把香 蕉给猴子,因为它们熟透了”和“我们把香蕉给猴子,因为它们饿了”两 句为例,其中的“它们”需要结合猴子和香蕉属性进行推理。 立足企业恒久发展 28 服务国家大局战略
29. 恒大研究院研究报告 图表32:自然语言处理是实现人机互动闭环的关键技术 资料来源:CNKI,恒大研究院 7.2.2 市场格局:市场较为分散,新入局者仍有机会 技术发展水平制约自然语言处理头部企业诞生,新入局者仍有机会。 语言规则复杂性以及技术的低成熟度使自然语言处理领域尚未诞生覆盖 所有细分领域且占据市场多数份额的龙头企业。目前,自然语言处理产品 可分为 3 类:1)细分领域技术应用:人工智能律师 Ross、百度和谷歌翻 译。2)消费级平台产品:如 Alexa 语音助手和小度在家等,不过仅限于 资讯了解、闹钟设定、任务提醒等简单功能。3)面向 B 端的产品解决方 案:如 Duroes、谷歌和三角兽等,但是功能和应用场景仍然相对有限。 因此,受制于技术水平和语义规则复杂性,自然语言处理市场相对分散, 新入局者仍有机会获取一定的市场份额。 立足企业恒久发展 29 服务国家大局战略
30. 恒大研究院研究报告 企业 谷歌 微软 亚马逊 苹果 图表33:自然语言处理产品仍然集中在细分领域 自然语言处理产品 谷歌翻译、云语言 API(核心功能是情感分析、实体识别和语法分析)、谷歌 Assistant 微软小冰、Cortana(个人智能助理) Alexa 语音助手(了解资讯、设定闹钟、播放音乐、任务提醒、与智能家居交 互)、Echo 智能音箱 Siri IBM 人工智能律师 Ross(对话查询法律条文,并通过引用相关的立法文献) 百度 百度翻译、Dureos 平台、小度在家(智能音箱) 今日头条 今日头条 APP(利用自然语言处理对分发内容进行分类筛选) 搜狗 搜狗输入法(利用自然语言处理优化输入法) 科大讯飞 提供自然语言处理解决方案 云知声 提供语义分析解决方案 三角兽 提供自然语言处理产品方案(主要用于智能客服、智能手机方案和智能硬件) 资料来源:各产品官网,搜狐科技,新浪科技,百家号,恒大研究院 7.3 计算机视觉:实现机器“看得懂”,安防厂商、科技巨 头和创业公司机会并存 7.3.1 计算机视觉实现机器“看得懂”,静态物体识别技术趋于成熟 计算机视觉实现了计算机“看得懂”,人脸识别、OCR 和图像结构化 是其主要应用场景。计算机视觉是用计算机模拟人眼对目标进行识别、跟 踪和测量,并且对图形进行处理,即实现计算机“看得懂”。计算机视觉 处理过程包括预处理、分割、特征提取和分类四个环节:预处理主要对图 像传输过程中的退化进行改善(如亮度、色彩和对比度),切割将图像分 成互补重叠而又具有各自特征的子区域,特征提取描绘边缘的方向密度 分布,分类根据算法模型给出类型结果。计算机视觉可用于以下领域:  人脸识别:基于人的脸部特征信息进行身份识别,用于门禁考勤、身 份认证、人脸对比等。  文字 OCR:计算机读取印在或写在纸上的字,实现文字的快速录入。  图像结构化:提取图片或视频中的人、车、物,使得图片和视频的信 息可以被计算机搜索和查询,并对车辆及车辆行为、人体属性及其行 为进行分析。 静态物体识别技术趋于成熟,监督学习和推理能力是计算机视觉技 术的主要短板。从技术成熟度来看,生物特征(人脸、指纹和瞳孔)和静 态物体识别较为成熟,动态图像识别难度较大。从图像识别技术瓶颈来 看,1)现有技术难以解决光线过爆和过暗问题。2)图像识别分类主要依 赖监督学习(利用标记训练数据来推断分类),即机器学习需要手工标注 立足企业恒久发展 30 服务国家大局战略
31. 恒大研究院研究报告 物体特征,数据标注的体量和数量受限使计算机可识别的物体种类有限。 3)现有技术仍然由数据驱动,因此计算机视觉技术缺乏基于常识的推理 能力。 图表34:计算机视觉处理流程 资料来源:CSDN,恒大研究院 图表35:计算机视觉需要大量手工标注物体特征的图片 资料来源:豆瓣,恒大研究院 7.3.2 市场格局:2020 年中国市场规模预计 725 亿元,安防厂商、 互联网巨头和创业公司机会并存 计算机视觉 2020 年市场规模预计达 725 亿元,安防厂商、互联网巨 头和创业公司是主要玩家。根据智研咨询的数据,2017 年计算机视觉市 场规模为 40 亿元,2020 年市场规模预计达 725 亿元。国内计算机视觉的 玩家有三类:1)海康、大华等安防厂商:安防影像分析的市场需求驱动 此类企业的技术研发。2)互联网巨头:以百度为首的互联网巨头在数据 获取上有明显优势,且以收购或并购形式扩大技术优势。3)创业公司: 包括商汤科技、依图科技和旷视科技等企业,普遍以细分领域为发力点。 立足企业恒久发展 31 服务国家大局战略
32. 恒大研究院研究报告 图表36:2020 年计算机视觉市场规模预计达 725 亿元 市场规模(亿元) 增长率 800 600 400 200 11 0 2016 263.6% 725 300% 40 2017 200.0% 165.8% 319 120 200% 127.3% 100% 2018E 2019E 0% 2020E 资料来源:智研咨询,恒大研究院 图表37:安防影像分析占计算机视觉市场规模的 68%(2017 年) 泛金融身份认 证 8% 互联网娱乐 4% 其他 3% 广告营销 18% 安防影像分析 68% 资料来源:智研咨询,恒大研究院 立足企业恒久发展 32 服务国家大局战略
33. 恒大研究院研究报告 企业 海康 威视 大华 股份 百度 商汤 科技 旷视 科技 依图 科技 图表38:安防厂商、互联网巨头和创业公司是计算机视觉领域的主要玩家 主要计算机视觉产品 资本化情况 “深眸”系列智能摄像机:深度学习实现视频图像结构化,精准识别人和 车,集目标提取、检索、分析、存储及行业应用于一体。 “脸谱”系列人脸分析服务器:基于高密度 GPU 和深度学习,实现人脸精 2010 年 5 月 IPO, 准识别,1v1 比对、身份确认、布控报警、融合行业平台综合管理应用。 沪深 300 成分股 “神捕”系列智能交通产品:“深度学习+智能交通摄像机算法+视频智能 分析服务器”检测和分析道路上人、车和路的目标特征、行为、事件。 “天眼”系列动态人脸识别服务器:通过人脸检测、人脸跟踪和人脸识别 等算法,实现从人脸采集到分析到布控的全过程监控,提供黑名单对比报 警、不明人员身份确认、重点人员身份排查、事中与事后检索等功能。 2008 年 5 月 IPO, 沪深 300 成分股 已开放包括人脸识别、文字识别(OCR)、图像审核、图像识别和图像搜索 2005 年 8 月 IPO 5 大类别、58 项基础能力。 累计融资 26.3 亿美 “产+研”赋能垂直行业,推出面向智能视频(人脸对比、视频结构化解析 元,投后估值 60 亿 等)、身份验证、移动互联网(手机图像处理)等领域的产品 美元 Face++人工智能开放平台:人脸识别,包括人脸检测、人脸关键点和属性分 2017 年至今累计融 析、人脸比对和人脸搜索。 资 10.6 亿美元,投 FaceID 在线人脸身份验证平台:身份证 OCR、活体检测、刷脸验人。 后估值约 30 亿美元 “蜻蜓眼”人像大平台:可进行基于图片的静态人脸比对,和基于视频流、 累计融资 3.86 亿美 图片流的动态人像识别及比对。 元,投后估值超 20 “蜻蜓眼”车辆大平台:兼容图片流和视频流的车辆及品牌识别、假套牌分 亿美元 析和图片视频“以图搜车”。 资料来源:各企业官网,恒大研究院 8 应用层:智能语音+安防+金融+医疗+自动驾驶 8.1 智能语音:人工智能时代的流量入口,科技巨头群雄逐 鹿 智能语音或将成为人工智能时代的流量入口,以 FAAG 和 BAT 为代表 的科技巨头均发力智能语音技术。智能语音主要通过“语音识别+自然语 言处理”作为媒介来调取后端应用,从而为用户提供服务。随着语音识别 和自然语言处理技术的日趋成熟,人机互动方式将逐渐从文字转变为语 音,智能语音或将成为人工智能时代的流量入口。因此,以 FAAG 和 BAT 为代表的科技巨头均发力智能语音技术,推出了 Siri(苹果)、Assistant (谷歌)、Alexa(亚马逊)、Cortana(微软)、DuerOS(百度)、腾讯叮当 (腾讯)等产品,以占据下一轮技术迭代的风口。主流智能语音已覆盖了 日常信息查询、影音娱乐、个人助手、生活服务、智能家居控制等功能, 实现人、物和服务的互通互联。 手机、车载设备和智能音箱是智能语音的硬件载体,其中主打家庭 场景的智能音箱已成新风口。目前,手机、车载设备和智能音箱是智能语 音技术的主要硬件载体,分别面向移动场景、驾驶场景和家庭场景。其中, 主打智慧家庭的智能音箱已成众多科技巨头布局重点:1)智能音箱是家 庭 IoT 设备(Internet of things)的控制器,智能音箱未来有望带动同 立足企业恒久发展 33 服务国家大局战略
34. 恒大研究院研究报告 一厂商其他家庭 IoT 产品的消费量(如冰箱、空调等)。2)作为家庭生活 的流量入口,智能音箱将为厂商提供家庭生活的行为数据,进一步支撑数 字营销和产品研发。2017 年全球智能音箱出货量达 3000 万台,2019 年 预计达 8500 万台,2018Q2 亚马逊和谷歌合计占据了 70%的智能音箱市场 份额。作为消费级人工智能产品,用户体验、功能覆盖的优先级高于技术 水平,因此智能音箱的生态整合能力是未来发展的关键,流量入口的“网 络效应”将取决于平台能否接入更多种类的应用、设备以及更多数量的用 户。 图表39:用户通过智能语音来调取后端应用 资料来源:恒大研究院 图表40:科技巨头均布局智能音箱 资料来源:百度百科,新浪科技,搜狐科技,恒大研究院 立足企业恒久发展 34 服务国家大局战略
35. 恒大研究院研究报告 图表41:2019 年全球智能音箱销量将达 8500 万台 全球智能音箱销量(万台) 10,000 8,000 6,000 4,000 2,000 0 255 2015 650 2016 8500 3000 5630 2017 2018E 2019E 图表42:2018Q2 亚马逊智能音箱出货量 480 万台 2018Q2智能音箱出货量(万台) 480 500 400 320 300 190 200 80 100 30 30 0 资料来源:奥维云网,恒大研究院 资料来源:Strategy Analytics,恒大研究院 8.2 AI+安防:智慧安防助力警务管理,动态人脸识别仍存 不足 千亿视频监控市场使“AI+安防”落地,智能安防的视频结构化、人 脸比对功能助力警务管理。2018 年中国视频监控市场规模预计达 1192 亿 元,千亿市场和政府网格化管理的双重驱动力使“AI+安防”落地。借助 于计算机视觉技术,人工智能能够对视频数据进行实时结构化处理,不仅 使警务人员对视频内容进行快速检索,而且还可自动将抓拍人脸与数据 库进行比对,提供黑名单预警、人员布控、人脸检索、大库比对等智能化 应用,对嫌疑人员进行实时布控,警务管理效率明显提升:  案例一:2016 年某地公安引入大华股份的警务方案后,警情同比下 降 46%,落地侵财破案率达到 72%,入户盗窃破案率达到 61%,扒窃 破案率高达 90%。  案例二:某抢劫案侦破需要对来自 500 多个监控点的长达 250 个小 时视频中的 50 万人流进行分析,传统人力查阅至少需要 30 天时间, 且极易遗漏关键信息,而海康威视人工智能视频分析技术仅 5 秒就 找到了犯罪嫌疑人。  案例三:襄阳市襄城区曾发生抢劫案,接警后嫌疑人照片被导入旷视 (Face++)智能安防人脸识别系统比对搜索,民警迅速锁定了涉案人 员。 “AI+安防”目前受制于误报率和复杂多变的应用环境,动态人脸监 控尚未大规模运用。目前动态人脸识别准确率无法达到 100%,导致系统 频频误报干扰正常警务工作,使不少公安部门弃用动态人脸识别。此外, 现有人脸识别未形成数据闭环(缺乏自主学习和自主标注功能),千万人 口级城市仍然存在数十万的人脸盲点。 立足企业恒久发展 35 服务国家大局战略
36. 恒大研究院研究报告 1,400 1,200 1,000 800 600 400 200 0 图表43:中国视频监控市场规模超千亿(2017 年) 中国视频监控市场规模(亿元) 1192 1064 962 870 800 582 242 290 348 2010 2011 2012 2013 2014 2015 2016 2017E 2018E 资料来源:中商产业研究院,恒大研究院 图表44:大华股份智能警务方案 资料来源:安防知识网,恒大研究院 图表45:人脸实时监测和车辆检测助力警务管理 资料来源:头条号,恒大研究院 立足企业恒久发展 36 服务国家大局战略
37. 恒大研究院研究报告 8.3 AI+金融:人工智能助力金融服务效率,身份认证、风 控和投顾是三大应用场景 重复度高、数据标准化和数据处理量大使金融成为人工智能落地场 景,智能身份认证、智能征信风控和智能投顾理财是 AI+金融典型应用。 资料归档等固定程序工作以及客户、行业数据整合优化均可被人工智能 取代,节省人力和物力,并且提升金融服务效率。目前“AI+金融”主要 集中在以下三个方面:  智能身份认证:基于计算机视觉的人脸识别使得用户远程开户、刷脸 支付成为现实,助力金融机构远程获客和数字营销,优化了用户体验, 且人脸信息较难复制和盗取特点提升了金融服务的安全性。目前智 能身份识别技术较为成熟,已广泛应用于银行和券商开户、业务办理 以及新零售等场景。  智能风控:人工智能技术可助力金融行业形成标准化、模型化、智能 化、精准化的风控系统。传统风控依靠地推式实地考察和人工资质核 实,效率低且存在委托代理风险,而智能风控可实现实时、智能征信 和审批,提升放贷效率。对个人用户来说,多维度用户数据(如通话 记录、短信信息、购买历史和社交网络信息)通过自然语言处理可转 化为用户特征画像,进而根据评分模型评估个人信用。对企业用户来 说,智能征信风控可挖掘企业间关联以及企业子母公司、上下游、竞 争对手和高管等深度信息,最后使用机器学习来评估企业还款能力。 以京东金融为例,其基于人工智能开展放贷业务效率比传统金融机 构提升了 70 倍,成本降低了 30%。智能风控技术已经较为成熟,未 来数据数量与质量将决定风控效果。  智能投顾:智能投顾通过特定算法模型管理帐户,结合投资者风险偏 好、财产状况与理财目标,为用户提供自动化的资产配置。AI+投顾 有以下优势:1)挖掘用户个性化需求,弥补投资顾问在深度了解客 户方面的不足。2)结合用户需求以及生命周期等特征,提供“千人 千面”的定制化资产配置。从行业格局来看,智能投顾已孕育了诸多 知 名 公 司 , 2017 年 Betterment 在 美 国 的 AUM ( Asset Under Management,简称 AUM)达 80 亿美元,中国则诞生了理财魔方、摩 羯智投和金贝塔等头部企业,分别主打国内资产配置、“银行+人机结 合”和“基金+社交跟投”,不过智能投顾尚处于技术探索期,技术仍 在不断改良和优化。 图表46:智能风控流程 资料来源:恒大研究院 立足企业恒久发展 37 服务国家大局战略
38. 恒大研究院研究报告 企业 Betterment Wealthfront Personal Capital 理财魔方 金贝塔 摩羯智投 创建时间 2008 年 2008 年 2009 年 2015 年 2016 年 2016 年 图表47:中美智能投顾企业介绍 服务模式 管理资产规 模 资产配置:基于投资者年龄、收 80 亿美元 入、投资的目的、期望收益等,以 自动化在线方式提供科学、安全、 (2017 年 5 月) 有效的股债配置方案 资产配置:利用人工智能,为经 调查问卷风险评估的用户提供个 性化的资产投资组合建议 35.2 亿美 元(2016 年 6 月) 线上财富管理+线下私人银行:利 用自动化算法为投资者提供线上 资产配置,对高端投资者推出收 费的一对一个性化投顾服务 34 亿美元 (2016 年 末) 基金配置:利用大数据和智能算 累计超 10 法为用户提供基于国内公募基金 亿元(2018 的全球资产配置 年 1 月) 基金+社交跟投:基于 Smart Beta 提供策略组合,并提供新财富分 析师及民间投资高手的投资组 不详 合,供 C 端用户跟投 银行+人机结合:嵌套于招行 APP, 超 100 亿 机器学习分析用户产品偏好、交 易行为及个人信息,并根据传统 (2018 年 3 月) 银行业资深经验提供人工服务 管理层及股东背景 投资方包括 Kinnevik、 Anthemis Group,估值 约 8 亿美元 《漫步华尔街》作者马 尔基尔担任首席投资 官,投资方包括 Index Ventures、Benchmark, 累计融资额超 2 亿美元 由 Paypal 和 Intuit 前 CEO Bill Harris 创立, 投 资 方 包 括 IVP 、 BlackRock,累计融资额 2.7 亿美元 创始团队有百度及券商 背景,投资方包括蝙蝠 源创资本和新毅资本, 累计融资额 7000 万元 嘉实基金旗下的智能投 顾产品,并得到蚂蚁金 服 A 轮投资 招商银行旗下的智能投 顾产品 资料来源:百家号,ASO114,搜狐财经,网易新闻,恒大研究院 8.4 AI+医疗:医学影像、辅助诊疗和语音电子病例是主要 应用场景,腾讯觅影已筛查 400 多例早期食道癌病例 人工智能赋能医生,提升诊疗能力和工作效率破局医疗服务痛点。 人口老龄化加剧、慢性疾病增长使大众对医疗服务需求日益增加,而区域 医疗资源分布不均,医生培养周期长,优质医疗服务供不应求等医疗服务 痛点使其成为 AI 应用场景。目前 AI+医疗主要集中在医学影像、辅助诊 疗和语音电子病历三大领域:  医学影像:AI+医学影像利用计算机视觉技术来模拟医生读片,筛选 出有潜在疾病的影像片子并且指出病灶所在位置。传统人工读片模式 速度慢,读片量有限,且基层医院医生受限于知识结构难以发现早期 病变。AI+医学影像助力疾病早期筛查,提高患者生存率。  辅助诊疗:AI+辅助诊疗是让计算机学习医疗知识和诊疗案例,帮助 医生诊疗推理疾病原因,并且给出可靠的诊断治疗方案。AI+辅助诊 疗弥补了社区医院、村诊所等基层医疗卫生机构在诊疗能力方面的短 立足企业恒久发展 38 服务国家大局战略
39. 恒大研究院研究报告 板,提升基层医疗效率,降低患者的就医成本。以精神疾病为例,中 国人均精神科专家不足发达国家 10%,检查率仅 9%,人工智能辅助诊 疗可将诊断效率提升 69%。  语音电子病例:语音电子病例利用语音识别技术将医生语音直接转 成电子文字病例。撰写病例往往占据医生大量时间,根据香港德信的 调查,50%中国住院医生每天用于写病例时间超 4 小时,有部分医生 甚至超 7 小时。语音电子病例大幅节约医生在患者病程、手术记录等 电子文本的录入时间,使医生专注于医患交流。 图表48:医学影像、辅助诊疗和语音病历是 AI+医疗的主要应用场景 资料来源:上官新闻,万灵盘古官网,恒大研究院 科技巨头纷纷入局,腾讯觅影已筛查 400 多例早期食道癌病例。2016 年 10 月百度推出了“百度医疗大脑”,2017 年 3 月阿里云发布医疗操作 系统“ET 医疗大脑”,2017 年 8 月腾讯推出 AI 医学影像产品“腾讯觅 影”。腾讯觅影已在全国 100 多家三甲医院落地,覆盖食管癌、肺癌、糖 尿病视网膜病变、乳腺癌、结直肠癌和宫颈癌六种疾病的早期筛选,筛查 出高风险病变 3.7 万例。以食管癌为例,由于缺乏足够认知和有效筛查 手段,中国早期食管癌检出率低于 10%,而腾讯觅影对早期食道癌发现准 确率高达 90%,截止 2018 年 9 月已筛查 400 多例早期食道癌病例。 AI+医疗仍处于发展初期,缺乏高质量标注数据是 AI+医疗面临的主 要挑战。医疗服务特殊性使其对产品识别准确性要求高,因此数据标注准 确性尤为关键,且医学影像需要训练数据量大,仅腾讯觅影食管癌筛选系 统就使用了 10 万张不同级别医生双盲随机循环标注的医学影像作为训练 数据。 8.5 自动驾驶:未来或颠覆全球汽车产业链,谷歌、特斯拉 和百度领跑自动驾驶赛道 自动驾驶通过“感知-认知决策-控制执行”模拟人类驾驶,主流自动 驾驶系统处于 L2、L3 级技术水平。自动驾驶是依靠人工智能、视觉计算、 雷达、监控装置和全球定位系统协同合作,让计算机在没有任何人类主动 操作情况下,自动安全地操作机动车辆。自动驾驶通过“感知-认知决策 -控制执行”三个环节来模拟人类车辆驾驶流程,感知环节主要由传感器 检测周边障碍物和道路环境,认知决策环节根据云端算法、地图和数据进 行行为决策与路线规划,控制执行环节负责最后的车辆行驶。根据 SAE(国 际自动机工程师学会)定义,自动驾驶分为 L0-L5 六级,L4、L5 是无人 驾驶阶段,汽车可在限定环境或全部环境下去自动完成驾驶任务,L1、L2 和 L3 是辅助驾驶阶段,汽车可完成纵向、转弯和加减速等操作,但是仍 然需要人类驾驶员随时接管车辆。目前,包括特斯拉 AutoPilot 在内的自 动驾驶系统均处于 L2、L3 级,百度“阿波龙”则是全球首款量产的 L4 级 自动驾驶巴士。 立足企业恒久发展 39 服务国家大局战略
40. 恒大研究院研究报告 自动驾驶或颠覆全球汽车产业链,谷歌、特斯拉和百度领跑中美自 动驾驶。自动驾驶的颠覆性影响存在于以下方面:1)自动驾驶使车辆不 再受驾驶员心理和情绪干扰,减少违反交通犯规和人为疏忽所造成的交 通事故。NHTSA(美国国家公路交通安全管理局)报告显示,特斯拉在引 入 AutoPilot 后,每百万英里交通事故数从 1.3 降至 0.8。2)自动驾驶 将节省人工驾驶的时间成本,根据科技智库 RethinkX 估计,美国在汽车 驾驶上花费了 1400 亿小时,这部分时间释放的生产力将使 GDP 增长 1 万 亿美元。3)共享出行将成为现实,私家车保有量减少将大幅降低温室气 体排放。汽车行业巨大市场规模以及自动驾驶颠覆性影响让科技巨头纷 纷入局自动驾驶,目前谷歌、特斯拉和百度分别领跑中美自动驾驶赛道:  谷歌:先发优势明显,测试里程、传感器制造设计和全自动驾驶均领 先其他厂商。谷歌是科技巨头中最早布局自动驾驶的企业,2009 年 谷歌就创建了自动驾驶项目,2012 年谷歌获得了美国第一张自动驾 驶测试牌照。先发优势已形成了技术上领先:1)测试里程远超其他 厂商:截止 2018 年 8 月谷歌自动驾驶测试里程数已达 900 万公里。 2)拥有自己设计制造的自动驾驶硬件传感器:包括激光雷达、视觉 传感器等。3)公路测试完全自动驾驶:2017 年末谷歌路测完全自动 驾驶,即测试车辆中没有驾驶员掌握方向盘。2016 年 12 月,谷歌自 动驾驶 Waymo 脱离谷歌母公司 Alphabet 独立运作,开启了商业化进 程,目前已经在美国菲尼克斯推出了 600 辆无人出租车供志愿者试 用。  特斯拉:AutoPilot 商业化早,且用户体验好,但技术存风险。特斯 拉 AutoPilot 是最早商业化且受关注程度最高的自动驾驶技术,2015 年特斯拉为 Model S 开启了 AutoPilot 功能。从技术能力来看, AutoPilot 处于 L2、L3 级。从用户体验来看,AutoPilot 操作简单, 对道路环境的宽容度高,且能及时、准确处理变道和插队情况。不过, AutoPilot 发生了多起因未能识别障碍物而发生的车祸,技术仍然存 在巨大风险。2016 年 5 月美国弗罗里达州一位车主使用自动驾驶时 发生事故死亡,同年 1 月 AutoPilot 在中国京港粤高速上因未能识 别道路清扫车而发生撞击致死事故。  百度:自动驾驶研发明显领先腾讯和阿里,商用型 L4 级自动驾驶客 车“阿伯龙”已量产下线。百度是中国自动驾驶赛道最早的入局者, 百度启动自动驾驶项目、成立自动驾驶事业部、获得 T3 牌照和推出 自动驾驶平台的时间节点均领先于腾讯和阿里。2018 年 7 月百度自 动驾驶技术已进入商业化阶段,百度和金龙客车推出的首款商用型 L4 级自动驾驶客车“阿伯龙”正式量产下线,将在北京、雄安、深圳 和日本东京等地进行商业化运 立足企业恒久发展 40 服务国家大局战略
41. 恒大研究院研究报告 图表49:自动驾驶“感知-认知决策-控制执行”环节 资料来源:亿欧智库,恒大研究院 图表50:SAE 将自动驾驶划分为 L0-L5 级 自动驾 驶等级 名称 定义 驾驶操 周边监 作 控 人工驾 人类驾 人类驾 L0 驶 有人类驾驶者全权驾驶汽车。 驶员 驶员 车辆对方向盘和加减速中的一项 人类驾 L1 辅助驾 操作提供驾驶,人类驾驶员负责 驶员和 人类驾 驶 驶员 其余的驾驶动作。 车辆 车辆对方向盘和加减速中的多项 部分自 人类驾 L2 操作提供驾驶,人类驾驶员负责 车辆 动驾驶 驶员 其余的驾驶动作。 由车辆完成绝大部分驾驶操作, 条件自 L3 动驾驶 人类驾驶员需保持注意力集中以 车辆 车辆 备不时之需。 高度自 由车辆完成所有驾驶操作,人类 L4 驾驶员无需保持注意力,但限定 车辆 车辆 动驾驶 道路和环境条件。 完全自 由车辆完成所有驾驶操作,人类 L5 车辆 车辆 动驾驶 驾驶员无需保持注意力。 资料来源:汽车科技,恒大研究院 接管 人类驾 驶员 人类驾 驶员 人类驾 驶员 人类驾 驶员 车辆 车辆 应用场 景 无 限定场 景 所有场 景 立足企业恒久发展 41 服务国家大局战略
42. 恒大研究院研究报告 时间 2013 年 2015 年 12 月 2015 年 12 月 2018 年 3 月 2018 年 3 月 2018 年 7 月 2018 年 9 月 图表51:百度自动驾驶研发领先腾讯和阿里 事件 同行对比 百度研究院启动自动驾驶项目 百度成立自动驾驶事业部 百度自动驾驶首次路测成功 百度率先获北京 T3 牌照(国内最高级 别) 腾讯于 2017 年 11 月宣布进军自动驾 驶 阿里于 2018 年 4 月首次宣布将进行自 动驾驶研发 2018 年 4 月腾讯自动驾驶测试车出现 于北京四环 腾讯于 2018 年 9 月获 T3 牌照 百度推出自动驾驶平台 Appolo 百度和金龙客车推出的首款商用型 L4 级自动驾驶客车“阿伯龙”正式量产 下线 百度已有 25 辆自动驾驶测试车 其余厂商仅有 1-2 辆 资料来源:百家号,百度百科,搜狐科技,新浪科技,恒大研究院 注:北京自动驾驶 T3 牌照表示自动驾驶汽车具有路况认知与交通法遵守、路线执行、应急处置等多项综合能力 立足企业恒久发展 42 服务国家大局战略
43. 恒大研究院研究报告 恒大研究院简介 恒大研究院(恒大智库有限公司)成立于2018年1月,是恒大集团设立的科学研究机构,以“立足企 业恒久发展 服务国家大局战略”为使命,追求成为国内顶级研究院,致力建成中国特色新型智库。研究 院对内为集团领导决策提供研究咨询,为集团发展提供研究支持;对外建设成为杰出的经济金融市场专业 研究领导者,建立与社会公众和公共政策沟通的桥梁,传递企业社会责任的品牌形象。 免责声明 本报告由恒大研究院(恒大智库有限公司)提供,仅供本公司客户使用。本报告仅在相关法律许可的 情况下发放,所提供信息均来自公开渠道。本公司尽可能保证信息的准确、完整,但不对其准确性或完整 性做出保证。 本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,相关的分析意见及推测可能 会根据后续发布的研究报告在不发出通知的情形下做出更改,投资者应当自行关注相应的更新或修改。 市场有风险,投资需谨慎。本报告中的信息或所表述的意见仅供参考,不构成对任何人的投资建议。 投资者不应将本报告为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断,本公司、 本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告 中的任何内容所引致的损失负责。 本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引 用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“恒大研究院”,且不 得对本报告进行任何有悖原意的引用、删节和修改,否则由此造成的一切不良后果及法律责任由私自引 用、刊发者承担。 本公司对本免责声明条款具有修改和最终解释权。 行业投资评级的说明: 推荐:研究员预测未来半年行业表现强于沪深300指数; 中性:研究员预测未来半年行业表现与沪深300指数持平; 减持:研究员预测未来半年行业表现弱于沪深300指数。 联系我们 地址: E-mail: 北京 北京市朝阳区东三环中路5号财富金 融中心6层607-608(100020) [email protected] 上海 深圳 上海市黄浦区黄河路21号鸿祥大厦 广东省深圳市南山区海德三道1126号 11楼 (200003) 卓越后海中心37楼(518054) [email protected] [email protected] 立足企业恒久发展 43 服务国家大局战略