2018世界人工智能产业发展蓝皮书 中国信通院

lstaytodo

2018/09/29 发布于 技术 分类

文字内容
1. 2018 世界人工智能产业 发展蓝皮书
2. 2018 世界人工智能产业发展蓝皮书 2 2018 世界人工智能产业发展深 度分析报告 概述与说明  产业发展环境 技术环境 全球人工智能企业  全球投融资 产业发展 40 人工智能技术成熟度曲 线,2018 年 前言 人工智能已经成为新一轮科技革命和产业变 革的核心驱动力,正在对世界经济、社会进步 和人类生活产生极其深刻的影响。为了进一 步顺应发展规律、把握未来趋势,加快发展 新一代人工智能,经国务院批准,国家发展和 改革委员会、科学技术部、工业和信息化部、 国家互联网信息办公室、中国科学院、中国工 程院和上海市人民政府于 2018 年 9 月 17 日 至 19 日在上海共同举办 2018 世界人工智能 大会。举办本次世界人工智能大会,是共同谋 划人工智能技术和产业发展的动员大会,也 是推动互联网、大数据、人工智能和实体经 济深度融合发展的重要举措。 本次大会以“人工智能赋能新时代”为主题, 以“国际化、高端化、专业化、市场化”为特 色,集聚全球人工智能领域最具影响力的科 学家、企业家和投资家,以及相关政府领导 者和城市管理者,围绕人工智能领域的技术 前沿、产业趋势和热点问题发表演讲和进行 高端对话,打造世界顶尖的人工智能合作交 流平台。大会集中汇聚最权威的观点和共识, 集中展示最前沿的新技术、新产品、新应用、 新理念,为应对人类发展面临的共同难题、 创造人类美好生活汇聚“中国方案”和“世 界智慧”。 上海以中国改革开放排头兵、创新发展先行 者的责任担当,与国家各相关部委办和机构 紧密携手,共同举办 2018 世界人工智能大 会。这是上海加快建设“五个中心”、全面打 响“四大品牌”,以及深入推进改革开放、优 化整体营商环境的重要抓手和切实举措。以 此次大会为契机,上海将加快推进人工智能 产业创新和深度应用,着力打造国家人工智能 发展高地,争取建设成为人工智能创新策源 地、应用示范地、产业和人才集聚地。 本蓝皮书作为大会的重要报告成果,是由中 国信息通信研究院联合国际权威信息技术研 究和分析咨询机构 Gartner Group,借助本次 大会举办的契机,打开中国人工智能领域与 世界对话的窗口,对全球人工智能的产业发展 情况及技术路线趋势进行全面深度分析。希 望本书对人工智能领域的从业者、研究者,以 及感兴趣的读者们,带来有益的思考与借鉴, 发挥必要的启示作用。 世界人工智能大会组委会 2018 世界人工智能产业发展蓝皮书由中国信息通信研究院发布。由中国信息通信研究院提供的编辑内容与 Gartner 的分析结果相互独立。Gartner 的所有调研报告的版权均为 Gartner, Inc. 所有。© 2018 Gartner, Inc. 保留所有权利。所有 Gartner 资料在本出版物中的使用均已获得授权。使用或者发布 Gartner 调研报告并不表示 Gartner 认可中国信息通信研究院的产品和/或战略。未经 Gartner 事先书面许 可,不得以任何形式复制或分发本出版物。本出版物中包含的信息均取自公认的可靠来源。Gartner 不对此类信息的准确性、完整性或适当性做出任何保证,并且不对此类信息中的错误、遗漏或不适当承担 任何责任,也不对此类信息的任何解读承担任何责任。此处表明的观点随时可能更改,恕不另行通知。虽然 Gartner 调研报告可能会讨论相关的法律问题,但 Gartner 并不提供法律建议或法律服务,不应将 其调研报告解释为或用作法律建议或法律服务。Gartner 是一家上市公司,其股东拥有的公司或基金可能与 Gartner 调研报告中涉及的实体有财务利益关系。Gartner 的董事会成员可能包括这些公司或基金 的高级管理人员。Gartner 调研报告是由其调研组织独立完成的,并没有受到这些公司、基金或其管理人员的介入或影响。有关 Gartner 调研报告的独立性和完整性的详细信息,请参阅其网站上的“Guiding Principles on Independence and Objectivity”(独立性和目标的指导原则)。 2
3. 3 中国信息通信研究院的研究报告 2018 世界人工智能产业发展深度分析报告 1 概述与说明 1.1 报告概述 本蓝皮书将分享人工智能领域的研究成果和 实践经验,对全球各主要人工智能强国产业 发展及技术路线现状与趋势进行全面掌握, 详细阐述人工智能领域的技术研究、产业投 入、服务应用,从而为促进人工智能技术和产 业发展提供一定的基础资料与指导。本蓝皮 书的编制,是在对世界人工智能产业发展的 深入、广泛调研基础上,结合调研数据和权威 部门相关资料,通过梳理人工智能技术、产业 和应用发展情况,分析人工智能的技术热点、 企业情况、产业应用和未来趋势,由编制团队 共同完成。 本报告以全球人工智能产业地图为中心展开 论述,该地图由中国信息通信研究院信息化 与工业化融合研究所和数据研究中心联合绘 制。地图通过对全球人工智能产业从底层技 术到垂直应用,从产业结构到产业分布,从研 究机构到政府政策等多角度进行了系统分析 与绘制,盘点了人工智能的发展态势,为推动 人工智能产业发展提供重要决策参考。同时, 中国信息通信研究院华东分院针对产业地图 的内容进行了充分的阐述和延伸,设计了本报 告的总体框架结构,详细阐述了产业发展环 境、技术环境、全球人工智能企业发展情况以 及人工智能产业化应用领域情况等,更加清 晰的反应人工智能产业发展现状。 1.2 撰写说明 全球人工智能产业地图主要包括以下几个部 分:(1) 产业链地图 (2) 产业分布地图 (3) 产业 研究机构与配套政策。 1) 产业链地图版块 本版块人工智能产业链结构划分为基础支撑 层、软件算法层与行业应用层。 基础层产业地图主要从 计算硬件(云端训 练、云端推算、设备端推理、智能芯片、智能传 感器)、计算系统技术(云计算、大数据、5G 通信与物联网)和数据(数据采集、标注和分 析)三个维度对全球主要从事基础层产业的 典型企业进行绘制。 软件算法层产业地图主要从算法理论(机器 学习算法、类脑算法、知识图谱)、开发平台 (基础开源框架、技术开放平台)和应用技术 (计算机视觉、自然语言处理和人机交互)三 个维度对全球主要从事软件算法层产业的典 型企业进行绘制。 应用层面产业地图主要从行业解决方案 (“AI+”行业垂直应用)和典型产品(视觉产 品、语音终端、机器人、智能汽车、无人机)两 个维度对全球主要从事应用层产业的典型企 业进行绘制。 2) 产业分布地图版块 本版块主要盘点与绘制了中国各省市以及国 际上人工智能产业领先的国家典型 AI 企业分 布、规模及企业名目。 3) 产业研究机构与政策版块 本版块主要盘点与绘制了中国与国际上的人 工智能主流行业研究机构、联盟与产业政策 文件。 本报告的结构分为五部分:1) 产业发展环 境 2) 技术环境 3) 全球人工智能企业的情况 4) 全球投融资的情况 5) 产业发展情况 1) 产业发展环境 本部分从人工智能发展进程、全球各国人工 智能相关政策以及人工智能发展条件进行 阐述,全面论述了人工智能产业发展的基础 与环境。 2) 技术环境 此部分从全球专利、论文、科研环境和技术 竞赛方面总结出人工智能领域的当前技术 环境。 3) 全球 AI 企业的情况 此部分从结构、规模和区域分布方面论述了 全球人工智能企业的情况。 3
4. 4) 全球投融资的情况 此部分阐述了人工智能领域全球投融资的分 布、规模和轮次,从投融资和产业规模方面分 析了人工智能产业的发展。 5) 产业发展情况 本部分阐述了全球人工智能产业技术与应用 的发展现状,发展趋势情况,以及一些典型人 工智能企业应用例举。 报告具体研究范围和数据来源说明如下: 1) 人工智能企业 本报告所述人工智能企业来源于中国信息通 信研究院数据研究中心监测平台,界定范围总 体上指提供人工智能产品、服务和相关解决 方案的企业。企业具体可以分为技术维度和 产品/解决方案两个维度。技术维度包含算法 平台、基础硬件、语音视觉等通用技术的提供 方和制造方,产品/解决方案维度包含各类人 工智能产品的生产商和解决方案提供商,以 及各垂直行业的解决方案提供商。 2) 投融资 本报告中的投融资数据来源于 CB insights、IT 桔子、新芽等投融资网站,是基于人工智能企 业名录进行匹配后整理统计的结果。 3) 专利数据 本报告中的专利数据来源于中国信息通信研 究院知识产权中心的研究成果,知识产权中 心根据智慧芽等专业数据库对全球范围内的 AI 专利进行检索统计。 4) 论文数据 本报告中的论文数据来源于 Web of Science 核心合集,是基于数据研究中心的人工智能 关键词词表进行检索统计的结果。 5) 产业应用数据 本报告中的产业应用数据来源于上海合合信 息科技发展有限公司的启信宝产品,以及 CA ICT、PwC、MarketsandMarkets、Grand View Research、IFR、罗兰贝格、中商产业研究院、 前瞻产业研究院等各大市场研究机构报告或 网站相关预测。 6) 数据单位说明 本报告中各项市场数据所采用币种,在未有具 体说明时,默认币种为人民币。 2 产业发展环境 2.1 人工智能发展大事件 人工智能大致可分为三个阶段:第一阶段 (1956-1980) 人工智能诞生;第二阶段 (19802000) 人工智能步入产业化;第三阶段(2000至今)人工智能迎来爆发。 第一阶段 (1956-1980) 人工智能诞生 时间 1956 1957 1969 标志性事件 美国达特茅斯会议聚集了最早 的一批研究者,确定了人工智能 的名称与任务,被称为 AI 诞生 的标志。 康奈尔大学的实验心理学家弗 兰克•罗森布拉特模拟实现了神 经网络“感知机”。 国际人工智能联合会成立,并 在美国华盛顿州西雅图召开了 第一届会议。 本蓝皮书不求面面俱到,仅对目前人工智能领 域涵盖的产业与技术发展环境、全球企业情 况和产业化应用等方面进行分析阐述。文中 不过多地给出人工智能领域观点性的陈述, 力求以较为浅显易懂的语言和方式进行陈 述。对于文中的主要内容,欢迎社会各界专家 学者提出建议,我们将积极听取各方专家的 意见,继续改进完善。 4
5. 5 第二阶段 (1980-2000) 人工智能步入产业化 时间 1980 1982 1986 1988 1997 标志性事件 卡耐基•梅隆大学为 DEC 公司设计了一个名为 XCON 的专家系统,取得了巨大的成功,在那个时期,它每年可为该公司节省 4,000 万 美元。 日本计划投入 8.5 亿美元开发人工智能计算机(第五代计算机),旨在造出能够与人对话、翻译语言、解释图像,并且像人一样推理 的机器。 多层神经网络和 BP 反向传播算法出现,提高了自动识别的精确度。 德国人工智能研究中心成立,也是目前世界上最大的非营利人工智能研究机构。 深蓝计算机战胜国际象棋冠军,成为 AI 历史上的里程碑事件;受到摩尔定律的影响,计算性能开始大幅提升。 第三阶段(2000-至今)人工智能迎来爆发 时间 标志性事件 2006 Geoffrey Hinton 在《Science》上提出基于深度信念网络可使用非监督学习的训练算法,使得深度学习在学术界持续升温。 2011 IBM Waston 系统参加美国“危险边缘”(Jeopardy!) 节目,打败人类选手。 2012 深度学习算法通过 ImageNet 比赛名声大噪,进而被广泛采用。 2016 DeepMind 开发的 AlphaGo 击败前世界围棋冠军李世石。 2.2 各国 AI 相关政策 人工智能的迅速发展将深刻改变人类社会和世界的面貌,为了抓住 AI 发展的战略机遇,越来越多的国家和组织已争相开始制定国家层面的发展 规划。 美国 时间 1998 2013 2013.4 2015.10 2015.11 2016.10 2016.10 2017.9 2017.10 单位 美国网络和信息技术研发小组委员会 美国白宫 美国白宫 美国国家经济委员会和科技政策办公室 美国战略与国际研究中心 美国国家科技委员会与美国网络和信息技术研发小组 委员会 美国国家科技委 美国国会 美国信息产业理事会 发布政策 《下一代互联网研究法案》(P.L. 105-305) 国家机器人计划: 《机器人技术路线图:从互联网到机器人(2013 版)》 推动创新神经技术脑研究计划 新版《美国国家创新战略》 《国防 2045》 《国家人工智能研究和发展战略计划》 《为未来人工智能做好准备》 自动驾驶法案 (SELF DRIVE ACT) 自动驾驶法案 (AV START ACT) 《人工智能政策原则》 5
6. 中国 时间 2015.7 2016.3 2016.4 2016.5 2016.5 2016.7 2017.3 2017.7 2017.12 2018.4 其他国家及国际组织 时间 2013.6 2015.1 2016.5 2016.6 2017 2017.5 2017.6 2018.6 2018.6 2013 单位 国务院 国务院 工信部、国家发改委、财政部 中共中央、国务院 国家发改委、科技部、工信部、中央网信办 国务院 国务院 国务院 工业和信息化部 教育部 单位 日本内阁 日本经济产业省 日本内阁 日本经济再生本部 日本政府 日本经济产业省 日本内阁 日本内阁 日本内阁 韩国电子通信研究院 发布政策 《国务院关于积极推进“互联网+”行动的指导意见》 《国民经济与社会发展第十三个五年规划纲要》 《机器人产业发展规划 (2016-2020 年)》 《国家创新驱动发展战略纲要》 《“互联网+”人工智能三年行动实施方案》 《“十三五”国家科技创新规划》 《政府工作报告》 《新一代人工智能发展规划》 《促进新一代人工智能产业发展三年行动计划 (20182020 年)》 《高等学校人工智能创新行动计划》 发布政策 《日本再兴战略》 《新机器人战略》 《科学技术创新综合战略 2016》 《日本再兴战略 2016》 《下一代人工智能推进战略》 《新产业构造蓝图》 《科学、技术和创新综合战略 2017》 《综合创新战略》 《未来投资战略 2018》 Exobrain 计划 6
7. 7 时间 2014.7 2016.8 2017.7 2018.5 2013 2016.12 2017.1 2017.10 2010.7 2011.11 2013.4 2017.6 2013 2017.3 2018.5 2017.5 2013.1 2013.12 2015.12 2016.6 2016.10 2017.10 2016.8 2016.12 2017.12 单位 韩国贸易工业和能源部 韩国政府 韩国国会 第四次工业革命委员会(韩国) 英国政府 英国政府科学办公室 英国政府 英国政府 德国政府 德国政府 德国联邦教育与研究部“工业 4.0 工作组” 德国交通部伦理委员会 法国政府 法国经济部与教研部 法国政府 新加坡国家研究基金会 欧盟 欧盟委员会与欧洲机器人协会 欧盟 SPARC 欧盟委员会 欧盟议会法律事务委员会 (JURI) 欧盟 联合国世界科学知识与技术伦理委员会 电气和电子工程师协会 (IEEE) 电气和电子工程师协会 (IEEE) 发布政策 第二个智能机器人总体规划 (2014-2018) 九大国家战略项目 《机器人基本法案》 《人工智能研究与发展(R&D)战略》 八项伟大的科技计划 《人工智能:未来决策制定的机遇与影响》 现代工业战略 《在英国发展人工智能产业》 《思想•创新•增长⸺德国高技术战略 2020》 《将“工业 4.0”作为战略重心》 《保障德国制造业的未来:德国工业 4.0 战略实施建议》 《自动和联网驾驶》报告 《法国机器人发展计划》 《人工智能战略》 法国与欧洲人工智能战略研究报告 “AI.SG”国家人工智能计划 “人脑项目”(Human Brain Project) SPARC 计划 机器人技术多年路线图 提出了人工智能立法动议 《欧盟机器人民事法律规则》 “地平线 2020” 《机器人伦理初步报告草案》 《合伦理设计:利用人工智能和自主系统最大化人类福祉 的愿景(第一版)》 《人工智能设计的伦理准则(第二版)》 7
8. 2.3 发展条件 2.3.1 算法的演进 人工智能算法发展至今不断创新,学习层级 不断增加。学术界早期研究重点集中在符号 计算,人工神经网络在人工智能发展早期被 完全否定,而后逐渐被认可,再成为今天引领 人工智能发展潮流的一大类算法,显现出强 大的生命力。目前流行的机器学习以及深度 学习算法实际上是符号学派、控制学派以及 连接学派理论的进一步拓展。 表 2-1 深度学习框架 框架 单位 TensorFlow Caffe PaddlePaddle CNTK Torch Keras Theano DL4J MXNet 谷歌 加州大学伯 克利分校 百度 微软 Facebook 谷歌 蒙特利尔 大学 Skymind DMLC 社区 支持语言 Python/C++/Go/… C++/Python Python/C++ C++ Lua Python Python Java/Scala C++/Python/R/… 简介 神经网络开源库 卷积神经网络开源框架 深度学习开源平台 深度学习计算网络工具包 机器学习算法开源框架 模块化神经网络库 API 深度学习库 分布式深度学习的库 深度学习开源库 图表 2-1 人工智能掀起新一轮技术发展浪潮 资料来源:中国信息通信研究院(2018 年) 8
9. 9 机器学习算法和深度学习算法是人工智能中 的两大热点,开源框架成为科技巨头全面布 局的重点。开源深度学习平台是推进人工智 能技术发展的重要动力,开源深度学习平台 允许公众使用、复制和修改源代码,具有更 新速度快、拓展性强等特点,可以大幅降低企 业开发成本和客户的购买成本。这些平台被 企业广泛的应用于快速搭建深度学习技术开 发环境,并促使自身技术的加速迭代与成熟, 最终实现产品的应用落地。 人工智能仍在迅速发展,而且改变着人们的生 活,还有更多人工智能算法正等待着计算机科 学家去挖掘。由于技术投资周期较长,中国大 多数人工智能企业还缺少原创算法,仍需要未 雨绸缪,重视 AI 算法层面的人才储备;将学术 研究和产业应用场景相结合,鼓励创新,积极 挖掘 AI 算法方面的人才,让具备强大潜力的 人工智能研究者能够真正投入业界。 2.3.2 算力的提升 人工智能算法的实现需要强大的计算能力支 撑,特别是深度学习算法的大规模使用,对计 算能力提出了更高的要求。2015 年起人工智 能迎来了真正的大爆发,这在很大程度上与 GPU 的广泛应用有关。在此之前,硬件算力并 不能满足人工智能计算能力的需求,当 GPU 与人工智能结合后,人工智能才迎来了真正的 高速发展,因此硬件算力的提升是 AI 快速发 展的重要因素之一。 图表 2-2 人工智能算力发展情况 资料来源:中国信息通信研究院(2018 年) 图表 2-3 人工智能高性能计算单元 资料来源:中国信息通信研究院、互联网 9
10. 近年来,新型高性能计算架构成为人工智能 技术演进的催化剂,随着人工智能领域中 深度学习热潮的涌现,计算芯片的架构逐渐 向深度学习应用优化的趋势发展,从传统的 CPU 为主 GPU 为辅的英特尔处理器转变为 GPU 为主 CPU 为辅的结构。2017 年,NVIDIA 推出的新一代图形处理芯片 Tesla V100,主 要用于研究基于深度学习的人工智能。针对于 谷歌开源深度学习框架 TensorFlow,谷歌推 出为机器学习定制的 TPU。 图表 2-4 Tesla V100 训练与推理性能比对 资料来源:NVIDIA 官网 人工智能发展急需核心硬件升级,人工智能 芯片创新加速,计算创新成为布局重点。现有 芯片产品在基础能力上无法满足密集线性代 数和海量数据高吞吐需求,亟需解决云端的 高性能和通用性,终端的高能效和低延时等 问题。 从人工智能芯片所处的发展阶段来 看,CPU、GPU 和 FPGA 等通用芯片是目 前人工智能领域的主要芯片,而针对神 经网络算法的专用芯片 ASIC 也正在被 Intel、Google、NVIDIA 和众多初创公司陆续 推出,并有望将在今后数年内取代当前的通用 芯片成为人工智能芯片的主力。 图表 2-5 人工智能芯片产业图谱 资料来源:中国信息通信研究院(2018 年) 10
11. 11 图表 2-6 人工智能芯片之争呈白热化态势 资料来源:中国信息通信研究院(2018 年) 2.3.3 数据的支撑 从软件时代到互联网,再到如今的大数据时 代,数据的量和复杂性都经历了从量到质的 改变,大数据引领人工智能发展进入重要战 略窗口。 数据是人工智能发展的基石,人工智能的核 心在于数据支持。从发展现状来看,人工智 能技术取得突飞猛进得益于良好的大数据基 础,海量数据为训练人工智能提供了原材料。 根据 We Are Social 2018 年第三季度全球数 字统计报告显示,全球互联网用户数已经突 破了 41 亿,全球独立移动设备用户渗透率达 到了总人口的 67%。 大数据是人工智能发展的助推剂,这是因为 有些人工智能技术使用统计模型来进行数据 的概率推算,比如图像、文本或者语音,通过 把这些模型暴露在数据的海洋中,使它们得到 不断优化,或者称之为“训练”。有了大数据的 支持,深度学习算法输出结果会随着数据处 理量的增大而更加准确。 由学术及研究机构承担建设的公共数据集不 断丰富,推动初创企业成长。公共数据集一般 用作算法测试及能力竞赛,质量较高,为创新 创业和行业竞赛提供优质数据,给初创企业 带来必不可少的资源。 行业数据集是企业的核心竞争力,行业数据 集与产业结合紧密,各个公司的自建数据集 属于企业的核心竞争力。数据服务产业快速 发展,主要包括数据集建设、数据清洗、数据 标注等。 11
12. 表 2-2 全球部分人工智能公共数据集情况 类型 自然语言处理 数据集名称 WikiText SQuAD Common Crawl Billion Words 语音识别 机器视觉 VoxForge TIMIT CHIME SVHN ImageNet Labeled Faces in the Wild 图表 2-7 行业数据库分类 特点 维基百科语料库 斯坦福大学问答数据集 PB 级别的网络爬虫数据 常用的语言建模数据库 带口音的语料库 声学-音素连续语音语料库 包含环境噪音的语音识别数据集 谷歌街景中的图像数据集 基于 wordnet 构成,常用的图像数据集 面部区域图像数据集,用于人脸识别训练 资料来源:中国信息通信研究院(2018 年) 3 技术环境 3.1 专利 1999 年至 2017 年,全球人工智能领域中图像识别、生物特征识别、 语音识别、语音合成、自然语言理解、机器学习等关键技术分支的发 明申请及授权专利数量(合并同族后)超过 10 万项。中国人工智能专 利申请和授权量自 2010 年开始逐年增加,自 2014 年开始实现快速增 长。 Fig. 3-1 Global AI Related Patent Application Trend 图表 3-1 全球人工智能相关专利申请趋势 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 中国 其他国家 全球 资料来源:中国信息通信研究院(2018 年) 图表 3-1 全球人工智能相关专利申请趋势 12
13. 对比全球各国人工智能专利数量,中国、美国和日本专利申请数量领 先,中国已超过美国成为 AI 领域专利申请量最高的国家。中、美、日三 国专利申请总量占全球 AI 专利的 75%。 从专利权人的角度分析,美国、日本、韩国科技巨头企业在人工智能领 域专利积累具有领先优势,微软专利申请量居全球首位、其次是 IBM 和 Google。 Fig. 3-2 Geographical Distribution of Global AI PatentFig. 3-4 Main Applicants for Global AI Related Patents 图表 3-4 全球人工智能相关专利主要申请人 Appl图ic表ati3o-n2s全球人工智能专利申请地域分布 MICROSOFT 法国 1.3% 英国 1.3% 荷兰 1.1% 德国 2.7% 加拿大 1.0% 韩国 8.9% 其他 8.7% 中国 37.1% IBM GOOGLE SAMSUNG AT&T 百度 国家电网 TOSHIBA FUJITSU NEC 0 1000 2000 3000 4000 5000 日本 13.1% 美国 24.8% 资料来源:中国信息通信研究院(2018 年) 图表 3-4 全球人工智能相关专利主要申请人 图表 3-2 全球 AI 专利申请地域分布 资料来源:中国信息通信研究院(2018 年) 3.2 论文 中国人工智能专利申请主要来自北京、广东、江苏、上海和浙江 5 个省 1998 至 2018 年间,全球人工智能领域论文、期刊数量大幅增长,总数 市。其中北京申请和授权的人工智能专利数量超过 10,000 件。 量突破 63 万篇,年复合增长率达到 11.59%。2017 年 Web of Science Fig. 3-3 Geographical Distribution of AI Patent Applica核tio心n集s合in收录的全球人工智能论文、期刊等学术发表物达到 6.51 万 份。其中,中国(含港澳台地区)人工智能论文、期刊等学术发表物 Chin图a表 3-3 中国人工智能专利申请地域分布 达到 1.73 万份,年复合增长率达到 24.32%。中国 AI 论文全球占比由 1998 年的 5.52% 提升到 2017 年的 26.63%,说明中国在人工智能科研 12000 领域实力大幅增长。 10000 8000 从全球增长趋势来看,1998-2017 年大体保持持续增长的态势,其中在 2001-2007 年和 2012-2016 年两个阶段中,年均增长率超过 10%;20082011 年增速有所下降,并在 2010 年度数量有所下降。 6000 4000 2000 0 北京 广东 江苏 上海 浙江 四川 山东 陕西 安徽 湖北 资料来源:中国信息通信研究院(2018 年) 图表 3-3 中国 AI 专利申请地域分布 13
14. Fig. 3-5 Global/China AI Paper Publication Trend 图表 3-5 全球/中国人工智能论文申请趋势 70000 60000 50000 40000 30000 20000 10000 0 30% 25% 20% 15% 10% 5% 0% 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 全球 中国 中国占比 资料来源:中国信息通信研究院(2018 年) 图表 3-5 全球/中国 AI 论文申请趋势 世界人工智能研究主要国家中,美国一直处于领先态势,学术研究数 量高于其他国家。但中国 AI 学术发表物数量快速增长,在 2009 年及 2014 年后,中国超过美国取得总量第一的位置。此外,印度在人工智能 科研领域于 2013 年起快速发展,并在 2014 年年发布人工智能论文数 量超越英国,位居全球第三位。 图表 3-7 各国人工智能论文产出趋势 1998-2018 年,全球人工智能领域论文产出量最多的是美国 14.91 万篇, 中国以 14.18 万篇位居次席,英国、德国、印度分列三至五位。 Fig. 3-6 TOP 10 Countries for AI Paper Output 美国 德国 中国 印度 英国 日本 加拿大 法国 图表 3-6 全球人工智能论文产出量 TOP10 国家 资料来源:中国信息通信研究院(2018 年) 160000 149096 141840 140000 120000 100000 80000 60000 40000 20000 41229 34786 29132 28959 26956 23632 23391 22513 0 美国 中国 英国 德国 印度 日本 加拿大 法国 西班牙 意大利 中国人工智能论文产出最多的机构是中国科学院,清华大学、哈尔滨 工业大学分列二、三位。从数量来看,中国科学院以超过 1 万篇的数量 遥遥领先于排名第二的清华大学(4,500 余篇)和其他机构。 图表 3-8 中国人工智能论文产出趋势 资料来源:中国信息通图信表研3究-6 院全(球201A8I 论年文)产出量 TOP10 国家 资料来源:中国信息通信研究院(2018 年) 14
15. Web of Science 收录的高被引文献中,中国人工智能相关文献数量和 占比自 2012 年起快速增长,从 2008 年时不足 15%,增长到 2017 年时 的 47%,说明中国人工智能领域的科研水平质量获得较大程度提升。 F图ig.表3-39-9T中re国nd人o工f H智ig能h高ly被C引ite论d文AI产P出ap趋er势Output in China 以大学为代表的科研机构在人工智能领域具有较强的科研实力,站在 人工智能理论技术发展前沿。科研机构具备一定规模的科研团队,拥 有较为先进的实验室和研究设施,与企业等其他机构相比,具有独特 的比较优势。科研机构也能够持续性地培养人工智能高端人才,为行 业的持续发展提供后备力量。 德国特里尔大学和 Schloss Dagstuhl – Leibniz 信息中心联合维护的数 300 60.0% 字数目索引与图书馆项目(Digital Bibliography & Library Project,简称 250 50.0% DBLP)收录大量计算机领域的期刊与文献,并基于计算机领域科学文 献的元数据提供文献检索服务。近五年,DBLP 每年新收录 30-40 万篇 200 40.0% 文献,截至目前,DBLP 索引文献超过 420 万篇。可据此统计每年发表 150 30.0% 过被 DBLP 收录的人工智能领域文献的科研机构和学者,以了解学界 100 20.0% 对人工智能领域的关注程度。 50 10.0% 根据 DBLP 索引的文献数据统计 2013-2017 年每年在人工智能领域索 0 0.0% 引文献上发表过论文的科研机构和机构内学者数量,不少国家对人工 智能的关注度在 2015 年有明显提升,2016 年有所降温后,2017 年又 中国高被引文献数量 中国占比 达到高点。各年度在 DBLP 索引文献上发表过论文的科研机构和学者 F数ig量. 如3-下11图所A示tte。ntion to AI Paid by the Scientific Research 资料来源:中国信息通图信表研3究-9 院中(国20A1I8高年被)引论文产出趋势 Community 图表 3-11 人工智能在科研领域的关注度 3.3 科研环境 全球的科学、技术、工程和数学领域 (STEM) 毕业生每年都在增加,中 国居世界首位。根据世界经济论坛报道,2016 年中国有 470 万毕业生 来自 STEM 领域。此外,中国每年总共有 3 万名 STEM 博士毕业生。位 于中国之后,排名第二的国家是印度。印度在 2016 年有 260 万 STEM 毕业生,包括本土和海外的留学生毕业生。不仅在 STEM 毕业生总数 上,在海外读书的留学生数量上,印度同样仅次于中国位于全球第二, 且其中有 26% 的留学生在学习计算机科学和数学专业。 1600 1400 1200 1000 800 600 400 200 1251 229 1160 220 1438 246 0 2013 2014 2015 1397 237 2016 1439 241 2017 Fig. 3-10 Number of STEM Graduates in the Countries (2016) 图表 3-10 各国 STEM 毕业生数量(2016 年) 中国 4,700,000 科研机构(家) 学者(人) 资料来源:CS Rankings、中国信息通信研究院 图表 3-11 人工智能在科研领域的关注度 印度 2,600,000 美国 568,000 俄国 561,000 伊朗 335,000 印度尼西亚 206,000 日本 195,000 0 1,000,000 2,000,000 3,000,000 4,000,000 5,000,000 资料来源:世界经图济表论3坛-10、中各国国信STE息M通毕信业生研数究量院(2016 年) 15
16. 美国人工智能技术水平稳居全球首位,领先优势明显,人工智能研究 3.4 技术竞赛 机构数量和学者数量在全球占比接近半数。中国科研机构数量与英 人工智能的技术发展不仅体现在专利论文等科研著作方面,从全球举 国、印度相当,学者数量与美国存在差距,但明显高于其他国家,且近 办的各类技术挑战赛中也可窥见一斑。根据 Kaggle 上发布的竞赛数 Fig年.来3总-1体2呈增TO加P趋1势0,C20o17u年nt比rie20s13f年or增长N约um30b%e。r of Scientific Re据s,e目ar前c正h 在进行的竞赛有 19 个,已经结束归档的竞赛达 275 个。竞赛 内容涉及图像识别问题、语音识别问题、物体检测问题、分类问题以及 Institutions with Publications 多种场景下的预测型问题等。不同竞赛的参赛队伍数量也不尽相同, 图表 3-12 发文科研机构数量占比 TOP10 国家 一些热门竞赛参赛队伍可以达到上万个,奖金池可达上百万美元。 新西兰 2% 以色列 2% 澳大利亚 3% 其他 19% ImageNet 每年举办的大规模视觉识别挑战赛 (ILSVRC) 是计算机视觉 领域开始较早和影响力较大的赛事。自 2010 年开始每年举办一次,参 赛程序会对物体和场景进行分类和检测。在对物体的分类准确度上, 人类的水平是 95%,从 2015 年起,最佳人工智能系统的表现已经超 美国 过人类,在 2017 年的 ILSVRC 竞赛上,AI 系统的分类准确度已经达到 43% 97.5%。 图表 3-14 ILSVRC 最佳分类准确率 德国 3% 巴西 4% 英国 5% 中国 印度 加拿大 5% 6% 8% Fig. 3-13 TOP10 Countries for Number of 资料来源:CS Rankings、中国信息通信研究院 图表 3-12 发文科研机构数量占比 TOP10 国家 Publications 图表 3-13 发文学者数量占比 TOP10 国家 Scholars with 德国 巴西 新加坡 2% 2% 印度 2% 3% 以色列 澳大利亚 3% 5% 英国 6% 加拿大 7% 其他 12% 中国 11% 美国 47% 资料来源:CS Rankin图gs表、中3国-13信发息文通信学研者究数院量占比 TOP10 国家 资料来源:中国信息通信研究院(2018 年) 在自然语言处理领域中比较有影响力的竞赛有基于斯坦福问题答案 数据集 (SQuAD) 的系统问答竞赛。SQuAD 是一个阅读理解数据集, 由众包工作者从众多维基百科文章中提出问题构成,每个问题答案 都是相应阅读段落中的一段文字或是跨段落内容的结合,或者问题 本身无解。自 SQuAD 1.0 发布以来,社区取得了长足的进步,最佳模 型已经与人类表现相媲美。以下是在 v1.1 测试集上评估的最佳模型的 ExactMatch (EM)。 16
17. 图表 3-15 SQuAD 最佳模型演进趋势 资料来源:中国信息通信研究院(2018 年) 近年来,中国企业也开始重视并积极举办和参加人工智能挑战赛。在 今年召开的 CVPR 大会上,百度 Apollo 和加州大学伯克利分校联合 举办了自动驾驶研讨会,并基于 ApolloScape 大规模数据集定义了多 项挑战任务,其中视觉领域独角兽企业旷视科技在 WAD 竞赛中战胜 DeepMind 荣获第一。另外,在视频行为识别挑战赛中,中国企业同样 表现不俗,包揽了前三名。除了 CVPR 挑战赛,在越来越多的国际顶级 挑战赛中,来自中国的参赛企业和团队表现地越来越好,屡屡夺冠,预 示着中国人工智能技术正在走向世界前列。 4 全球人工智能企业 4.1 企业结构 从全球范围来看,全球人工智能企业主要集中在 AI+(各个垂直领域)、 大数据和数据服务、视觉、智能机器人领域。其中,AI+ 企业主要集中 在商业(主要包含市场营销和客户管理领域)、医疗健康、金融领域。 从中国来看,各垂直领域的 AI 企业同样集中。在各类垂直行业中,人 工智能渗透较多的包括医疗健康、金融、商业、教育和安防等领域。其 中,医疗健康领域占比最大达到 22%,其次金融和智能商业领域占比 分别达到 14% 和 11%。 图表 4-1 全球人工智能企业结构 49% 资料来源:中国信息通信研究院(2018 年) 17
18. 图表 4-2 中国 AI+ 领域人工智能企业结构 商业` 教育` 安防` 资料来源:中国信息通信研究院(2018 年) 4.2 企业规模 根据中国信通院数据研究中心的全球 ICT 监测平台实时监测的数据, 截至 2018 年上半年,在全球范围内共监测到 4,998 家人工智能企业。 其中,美国人工智能企业数量 2,039 家位列全球第一,其次是中国(不 含港澳台地区)1,040 家,其后依次是英国 392 家、加拿大 287 家、印 度 152 家。除此之外,以色列、法国和德国人工智能企业的数量也超过 了 100 家。 图表 4-3 全球人工智能企业分布(单位:家) 资料来源:中国信息通信研究院(2018 年) 18
19. 从企业成立时间看,全球人工智能企业的创业潮集中在 2014 到 2016 年,其中不论是全球范围内还是中国,2015 年新增人工智能企业数量 都是最多的。2015 年期间,全球新成立人工智能企业数量达 847 家, 其中中国 238 家。从 2016 年开始,全球创业企业的新增数量开始减 少,创业步伐有所放缓。全球新增初创企业 738 家,到 2017 年这一数 字下降到 324 家。 图表 4-5 全球人工智能企业数量 TOP20 城市(单位:家) 图表 4-4 人工智能企业成立时间(单位:家) 资料来源:中国信息通信研究院(2018 年) 资料来源:中国信息通信研究院(2018 年) 在中国,人工智能企业主要集中北京、上海和广东三地,北京高居榜 首,上海和广东紧随其后。除此之外,浙江和江苏两省也聚集了较多的 人工智能企业。 4.3 企业区域 从城市维度看,全球人工智能企业数量排名 TOP20 的城市中,美国占 9 个,中国占 4 个,加拿大 3 个,英国、德国、法国和以色列各占 1 个。 其中,北京成为全球人工智能企业数量最多的城市,有 412 家企业。其 次是旧金山和伦敦,分别有 289 家和 275 家人工智能企业。上海、深 圳和杭州的人工智能企业数量也进入全球 Top20。 图表 4-6 中国主要省份人工智能企业数量(单位:家) 资料来源:中国信息通信研究院(2018 年) 19
20. 5 全球投融资 5.1 投融资分布 近五年全球人工智能行业投资热点集中在 AI+ (垂直行业)、视觉、大数据及数据服务和智 能机器人等领域。在各类 AI+ 垂直行业中,最 受资本青睐的领域有商业智能、医疗健康和 金融等领域。 逐季度投融资数据显示,医疗健康、视觉、商 业智能及智能机器人领域自 2017 年第二季度 以来持续保持较高的投资热度,尤其在第三 季度达到高峰,随后略有回落。而大数据及 数据服务领域作为人工智能领域融资的常青 树,与其他领域相比近年来持续吸引了较多 的资本投入,总体上看也是获投次数最多的 领域。 图表 5-1 全球人工智能投融资笔数分布 (2013-2018Q1) 53% 资料来源:中国信息通信研究院(2018 年) 图表 5-2 全球人工智能各领域投资热度分布 (2013-2018Q1) 资料来源:中国信息通信研究院(2018 年) 20
21. 21 对比中国、美国、英国、加拿大等主要国家在 AI 各领域的融资笔数构成,发现中国领域分 布更为均衡,而其他主要国家融资更偏重垂 直行业应用 (AI+)。 5.2 投融资规模 2013 年以来,全球人工智能领域投融资热情 持续高涨。2017 年全球人工智能投融资总规 模达到 395 亿美元,中国投融资规模达到 277 亿美元,占比 70%,成为 AI 领域全球吸 纳资本最多的国家。相比之下,美国在投融资 笔数上占比达 41%,超过中国,是全球投融资 最活跃的国家。 图表 5-3 各国人工智能投融资笔数分布 (2013-2018Q1) 资料来源:中国信息通信研究院(2018 年) 图表 5-4 全球(含中国)/中国 AI 投融资变化趋势 资料来源:中国信息通信研究院(2018 年) 21
22. 图表 5-5 全球 AI 投融资地域分布 (2013-2018Q1) 资料来源:中国信息通信研究院(2018 年) 5.3 全球投融资轮次分布 近五年,全球人工智能领域各轮次融资笔数 除 E、F 轮略有波动外,总体呈逐年增长趋势。 其中,A、B、C、D、E 轮融资笔数 2017 年同比 增速都超过 40%。 图表 5-6 全球人工智能各轮次投融资笔数 资料来源:中国信息通信研究院(2018 年) 22
23. 全球人工智能领域早期投资持续活跃,种子/天使轮、A 轮投资占 比最高,合计占比 70% 左右。随着人工智能产业与技术的发展和成 熟,B、C、D 轮融资占比逐年增加,2017 年已达到 20% 左右。 对比中国、美国、英国、加拿大和印度 5 国的种子轮/天使轮/A 轮的投 资笔数趋势,发现 2017 年各国的早期投资占比均有下降,中国更是从 2016 年开始就呈现下降趋势,且下降明显。这些趋势意味着中国的人 工智能产业经历了创业爆发阶段,开始走向更成熟的发展阶段。 图表 5-7 全球人工智能投融资笔数轮次占比 资料来源:中国信息通信研究院(2018 年) 图表 5-8 各国人工智能天使/种子/A 轮融资笔数合计占比 资料来源:中国信息通信研究院(2018 年) 23
24. 6 产业发展 6.1 产业发展技术 6.1.1 智能硬件 智能传感器与智能芯片是智能硬件的重要组成部分。如果说智能芯片 是人工智能的中枢大脑,那么智能传感器就属于分布着神经末梢的神 经元。与传统硬件不同的是,智能传感器是将传统传感器,微处理器及 相关电路一体化,形成的具有初级感知处理能力的相对独立的智能处 理单元。智能芯片具备高性能的并行计算能力,且同时支持主流人工神 经网络算法。目前,智能传感器主要包括有触觉、视觉、超声波、温度、 距离传感器等;智能芯片主要包括有 GPU、FPGA、ASIC 以及类脑芯片 等。 ResearchAndMarkets 报告显示:2017 年智能传感器全球市场价值为 269.06 亿美元,预计到 2023 年总市场规模达到 706.17 亿美元,预测 期 (2018-2023) 内复合年增长率 17.45%。全球人工智能芯片市场规模预 计到 2023 年将达到 108 亿美元,在预测期 (2017-2023) 内复合年增长 率 53.6%。《新一代人工智能发展规划》预计,到 2020 年,中国智能计 算芯片市场规模将达到 100 亿元。 全球智能硬件市场,霍尼韦尔、BOSCH、ABB 等国际巨头全面布局智 能传感器的多种产品类型;在中国,也涌现了汇顶科技的指纹传感器, 昆仑海岸的力传感器,但产品布局相对单一。智能芯片方面,在全球 有 NVIDIA 的 GPU、谷歌的 TPU、英特尔的 NNP 和 VPU、IBM 的 True North、ARM 的 DynamIQ、高通的骁龙系列、Imagination 的 GPU Power VR 等主流企业产品;在中国,有华为海思的麒麟系列、寒武纪 的 NPU、地平线的 BPU、西井科技的 deepsouth(深南)和 deepwel(l 深井)、云知声的 UniOne、阿里达摩院在研的 Ali-NPU 等。 图表 6-1 全球智能硬件领域典型企业 资料来源:中国信息通信研究院(2018 年) 24
25. 6.1.2 机器视觉技术 相对于传统视觉技术,人工智能赋能机器视觉技术,使其初步具备了 类似人类对图像特征分级识别的视觉感知与认知机理,其具有速度 快、精度高、准确性高等一系列优点。 从技术能力上看,其主要实现产业应用中对图像或视频内物体/场景识 别、分类、定位、检测、图像分割等功能的需求,因此被广泛应用于实 现视频监控、自动驾驶、车辆/人脸识别、医疗影像分析、机器人自主导 航、工业自动化系统、航空及遥感测量等领域。 MarketsandMarkets 报告显示:2017 年基于人工智能的计算机视觉全球市场规模为 23.7 亿 美元,预计 2023 年会达到 253.2 亿美元。预测期 (2018-2023) 内复合 年增长率 47.54%。根据前瞻产业研究院报告显示,2017 年中国计算机 视觉市场规模为 68 亿元,预计 2020 年市场规模达到 780 亿元,年均 复合增长率达 125.5%。 随着人工智能技术与实体产业的不断融合发展,计算机视觉算法的图 像识别能力越来越强,各国也陆续涌现出了一大批优秀的计算机视觉 公司。在美国,有亚马逊、谷歌、微软、Facebook 等一批跨国科技企业 呈现出从基础层、技术层到应用层的全产业布局的特征;也有一些初 创公司专注局部应用领域,诸如 Cape Analytics 根据住宅航拍照片实 现智能估值,Steam、Oculus Home 和 Viveport 成为三大主流 VR 内容 分发平台。在中国,一些计算机视觉顶级企业技术专家更多是名门之 后,相关产业也已有多年积累,例如商汤科技当前正在为各大智能手机 厂商提供 AI+ 拍摄、AR 特效与 AI 身份验证等功能服务;格灵深瞳同 时专注视觉算法技术和嵌入式硬件研发技术;Yi+ 更多的是为商业视 觉内容提供智能化分析与推荐服务,云从科技、旷视科技、依图科技等 企业也有不同布局。 图表 6-2 全球机器视觉领域典型企业 资料来源:中国信息通信研究院(2018 年) 25
26. 6.1.3 智能语音技术 智能语音技术是一种可以实现将文本或命令与语音信号相互智能转化 的技术,其主要包含语音识别与语音合成。语音识别就好比“机器的 听觉系统”,通过识别和理解,把语音信号转变为相应的文本或命令。 语音合成就好比“机器的发音系统”,让机器通过阅读相应的文本或命 令,将其转化为个性化的语音信号。智能语音技术因其可以实现人机语 音交互、语音控制、声纹识别等功能,被广泛应用于智能音箱、语音助 手等领域。 中商产业研究院数据显示:2017 年,全球智能语音市场规模为 110.3 亿 美元,同比增长 30%。2017 年中国智能语音市场规模达到 105.7 亿元, 与 2016 年相比增长 70%。随着智能语音应用产业的拓展,市场需求增 大,预计 2018 年中国智能语音市场规模将进一步增长,达到 159.7 亿 元。 目前,智能语音技术在用户终端上的应用最为火热。许多互联网公司 纷纷投入人力和财力展开对此方面的研究和应用,目的是通过语音交 互的新颖和便利模式迅速占领客户群。在美国,以苹果的 Siri,微软 PC 端的 Cortana,移动端的微软小冰,谷歌的 Google Now,Amazon 的 Echo 都是家喻户晓的产品应用;在中国,诸如科大讯飞、思必驰、云知 声,以及互联网巨头 BAT 等均深入布局其中。 图表 6-3 全球智能语音领域典型企业 资料来源:中国信息通信研究院(2018 年) 26
27. 6.1.4 自然语言处理 自然语言处理包含了多种多样的研究方向,其主要包括自然语言理解 和自然语言生成。通俗的说,前者是实现计算机“理解”自然语言文本 思想或意图;后者是实现计算机用自然语言文本“表述”思想或意图。 从应用上看,包括机器翻译、舆情监测、自动摘要、观点提取、字幕生 成、文本分类、问题回答 (Q&A)、文本语义比对等等。 MarketsandMarkets 数据显示:全球自然语言处理市场规模预计将 从 2016 年的 76.3 亿美元增长到 2021 年的 160.7 亿美元,复合年增长 率 16.1%。《中国人工智能发展报告 2018》报告显示:2017 年中国人工 智能市场规模达到 237 亿元,其中自然语言处理市场占比 21%,也就 是 49.77 亿元。目前,已经有许多相关的成熟技术应用产品。如美国 的亚马逊、脸书以及中国的今日头条等公司利用自然语言技术实现旗 下购物网站,社交平台或新闻平台的产品评论,社区评论和新闻文章 主题分类与情感分析等功能;谷歌、百度、有道等公司应用纯熟并在不 断智能升级的在线翻译服务;诸如日本的 Logbar,中国的科大讯飞与 搜狗等企业的随身多语言翻译机等。在基础平台方面,在美国有 Kore. ai、Linguamatics 等,在中国有百度云、腾讯文智、语言云等。舆情监 测系统方面应用,包括有美国的 Xalted 的 iAcuity,中国朝闻天下的 Wom-Monitor,创略科技的本果舆情等。 图表 6-4 全球自然语言处理领域典型企业 资料来源:中国信息通信研究院(2018 年) 27
28. 6.2 产业发展应用 6.2.1 AI+ 医疗 AI 技术赋能医疗健康领域,使得医疗机构和人员的工作效率得到显著 提高,医疗成本大幅降低,并且可以使人们做到科学有效的日常检测预 防,更好地管理自身健康。 根据信通院 ICT 监测平台数据显示:近几年,AI+ 医疗健康位列 AI+ 垂 直应用最热门的领域之一。从应用角度看,智能医疗主要包括医学研 究、制药研发、智能诊疗以及家庭健康管理等方面。从技术细分角度 看,主要包括使用机器学习技术实现药物性能、晶型预测、基因测序预 测等;使用智能语音与自然语言处理技术实现电子病历、智能问诊、导 诊等;使用机器视觉技术实现医学图像识别、病灶识别、皮肤病自检 等。据麦肯锡预测,到 2025 年,全球智能医疗行业规模将达到总 254 亿美元,约占全球人工智能市场总值的 1/5。中国正处于医疗人工智能 的风口,前瞻产业研究院数据显示,2017 年中国医疗人工智能市场规 模超过 130 亿元,并有望在 2018 年达到 200 亿元,医疗人工智能空间 广阔。 目前,在医学研究和制药研发领域,美国 BergHealth 与 Numerate 用 数据驱动药物发现,vion 和 HBI Solution 为医疗机构提供患者疾病 预测和风险分析;智能诊疗领域,IBM Watson 深度聚焦肿瘤领域,并 通过收购和合作不断积累医疗数据资源,扩展各领域生态能力。阿里 的“Doctor You”系列产品,腾讯的觅影,依图科技的“care.ai™”以 及 PereDoc 的智能影像辅助诊疗平台实现医学影像辅助诊疗,傅利 叶智能的 Fourier X1 实现了中国首款外骨骼机器人。家庭健康管理领 域,WellTok 更关注个人健康管理和生活习惯提升,AiCure 是致力于辅 助用户按时用药,碳云智能打造数字生命健康管理平台。 图表 6-5 全球智能医疗领域典型企业 资料来源:中国信息通信研究院(2018 年) 28
29. 6.2.2 AI+ 金融 AI 技术赋能金融领域,从应用角度看,主要包括智能投顾、征信风控、 金融搜索引擎、保险、身份验证和智能客服等。金融是最依赖数据的 行业之一,人工智能技术与金融行业相融合,通过基于大数据的人工 智能技术驱动金融科技智能化升级。在前台,可以用于为用户提供更 舒适、便利与安全的服务;在中台,可以为金融业务中的交易、授信与 分析等提供决策辅助功能;在后台,可以针对各类风险改进金融系统。 在后台,可以提高金融系统对各类风险的识别、预警与防控能力。总而 言之,人工智能技术将深度重构当前金融业生态格局,使金融服务(银 行、保险、理财、借贷、投资等方面)更加地人性化与智能化。 根据 PwC 2017 Global Digital IQ Survey 调查显示,全球金融服 务领域的信息利用率仅有 26%,在各行业属于偏低水平。根据 MarketsandMarkets 报告显示:人工智能在金融科技的全球市场规模 预计将从 2017 年的 13.38 亿美元增长到 2022 年的 73.06 亿美元,复 合年增长率 40.4%。《新一代人工智能发展白皮书 (2017)》预测,2020 年中国智能金融产业规模将达到 8 亿美元。 目前,智能投顾企业主要为一些证券、基金或资产管理牌照经营者转 型形成,如美国 Wealthfront、Betterment,中国的理财魔方、京东智 投等;在金融智能客服领域,Digital Genius、网易七鱼、智齿客服等企 业注重提升用户体验;在征信/风控领域,多以政府、企业或个人信息 等基础形成基于大数据智能分析的行业壁垒,如具有消费金融和移 动支付数据的美国金融科技公司 Zest Finance 与 Affirm,具有企业多 维实时动态与全量经营数据的征信平台的启信宝;其他企业应用,诸 如融 360、Data.GOV、DBpedia 等聚焦金融搜索引擎;商汤、云从、依 图、face++ 则依靠其业界领先的人脸识别的核心技术进入身份认证 市场。 图表 6-6 全球智能金融领域典型企业 资料来源:中国信息通信研究院(2018 年) 29
30. 6.2.3 AI+ 零售 AI 技术赋能零售行业,智能零售以大数据和智能技术驱动市场零售新 业态,优化从生产、流通到销售的全产业链资源配置与效率,从而实现 产业服务与效能的智能化升级。其商业化应用包括智能营销推荐、智能 支付系统、智能客服、无人仓/无人车、无人店、智能配送等等。 MarketandMarkets 报告显示:全球智能零售市场预计将从 2018 年的 130.7 亿美元增长到 2023 年的 385.1 亿美元,预测期 (2018-2023) 内复 合年增长率为 24.12%。在中国,国家统计局数据显示,2017 年底,中国 社会消费品零售总额达到 366,262 亿元,增长 10.2%。罗兰贝格预测,到 2030 年,人工智能技术将为中国零售行业带去约 4,200 亿元人民币的 降本与增益价值。 从目前看,全球智能零售行业参与者主要以电商行业巨头与创业公司为 主。在落地场景上,仍主要以销售端为主。比如无人零售实体店方面, 在美国有 Standard Cognition 无人便利店,以及亚马逊的 Amazon Go 等。在中国,有阿里巴巴的淘咖啡,以及京东 X 无人超市;同时也有深 兰科技、F5 未来商店、缤果盒子等著名创业公司的相关产品。在客户 服务机器人方面,中国有猎豹移动的豹小贩零售机器人,擎朗智能的 花生引领机器人,新松的松果 I 号促销导购机器人等都已在各落地场 景应用。智能零售供应链场景,美国的 UPS 在佛罗里达州测试了无人 机送货;沃尔玛的“自提塔”正在全美大范围铺设。在中国,美团点评 推出无人配送开放平台;京东正在打造的以无人配送站、无人仓“亚洲 一号”以及大型货运无人机“京鸿”等为一体的全生态智能零售物流 体系。 图表 6-7 全球智能零售领域典型企业 资料来源:中国信息通信研究院(2018 年) 30
31. 6.2.4 AI+ 教育 AI 技术赋能教育领域,注重学生个性化的教育,有助于教师因材施教, 提升教学与学习质量,促进教育均衡化、可负担化。目前,智能教育全 面覆盖“教、学、考、评、管”产业链条,并已在幼教、K12、高等教育、职 业教育、在线教育等各类细分赛道加速落地。从应用角度看,智能教育 可分为学习管理、学习评测、教学辅导、教学认知思考四个环节。从细 分领域看,其包括教育评测、拍照答题、智能教学、智能教育、智能阅 卷、AI 自适应学习等落地场景。 MarketsandMarkets 报告显示,2017 年,全球人工智能技术在教育行 业的市场规模为 3.731 亿美元,预计到 2023 年将达到 36.835 亿美 元,预测期 (2018-2023) 内的复合年增长率为 47.0%。Global market Insights 同样发布了一份最新研究报告,报告预测教育市场的人工智能 产业价值将在 2024 年超过 60 亿美元。其中,包括中国在内的亚太地 区智能教育市场的复合年增长率将达高于 51%,成为最赚钱的地区。 目前,在 AI 自适应学习领域,不管是美国 Knewton、英国的 Century Tech、澳大利亚的 Smart Sparrow 以及中国的乂学教育、好未来等公 司,都在利用 AI 教育平台帮助学生快速掌握知识点,改善学生学习 效果。在智能评测领域,中国的学霸君、科大讯飞等企业推出智能阅 卷系统;在教学辅导方面,中国的先声教育和流利说等企业推出的语 言辅导系统,美国的 Tabtor、Carnegie Learning 和 Front Row 等企 业推出智能导师系统模拟一对一辅导,形成接近专家辅导的效果,美 国 LightSail 与 Newsela 等企业针对学生阅读情况进行个性化智能推 荐,培养学生阅读能力和兴趣。 图表 6-8 全球智能教育领域典型企业 资料来源:中国信息通信研究院(2018 年) 31
32. 6.2.5 AI+ 家居 AI 技术赋能家居领域,助力家居生态从感知到认知发展,使家居生活 更安全、更舒适、更节能、更高效、更便捷。未来,智能家居将逐步实现 自适应学习和控制功能,以满足不同家庭的个性化需求。智能家居是 一个以 IoT 为基础的家居生态圈,其主要包括智能照明系统、智能能源 管理系统、智能视听系统、智能安防系统等。 Strategy Analytics 最新报告指出,2017 年全球智能家居市场规模达到 840 亿美元,较 2016 年的 720 亿美元增长 16%,预估 2018 年将达到 960 亿美元。据智研咨询数据显示,2017 年中国智能家居市场的规模 在 916.6 亿元,并有望实现在 2018 年扩大至 1,396 亿元。 近几年,智能家居在全球范围内呈现强劲的生命力。作为智能家居 的最大市场,美国注重以智能音箱为中控的家庭智能化,如亚马逊 Echo、Google Home 等产品销售火爆。在中国,一边市场上各大企业 纷纷发布各式智能音箱产品,如阿里的“天猫精灵智能音箱”,小米 的“小爱智能音箱”,讯飞与京东合作的“叮咚智能音箱”,百度的“小 度音箱智能音箱”,腾讯的“听听智能音箱”,Rokid 的“若琪智能音 箱”,喜马拉雅的“小雅智能音箱”等等。另一边,各大企业也在积极打 造以物联网平台赋予家居场景智慧化,诸如小米 MioT、华为 HiLink、海 尔 U+ 等。 图表 6-9 全球智能家居领域典型企业 资料来源:中国信息通信研究院(2018 年) 32
33. 6.2.6 AI+ 农业 AI 技术赋能农业领域,使得农业可以有效应对极端天气的影响,降低 资源消耗量,优化资源配置,降低成本,优化时间与资源配置,以获得 最大产量与效益。从应用角度看,智能农业主要包括农业机器人,精准 农业和无人机分析以及畜牧监测等。 MarketsandMarkets 报告显示,全球智慧农业市场规模在 2017 年 达到 67 亿美元。预计在 2018 年将达到 75.3 亿美元,到 2023 年达 到 135 亿美元,预测期 (2018-2023) 内的复合年增长率为 12.39%。其 中,2016 年人工智能技术在农业市场的价值为 4.322 亿美元,预计到 2025 年价值为 26.285 亿美元,预测期 (2017-2025) 内的复合年增长率 为 22.5%。 美国作为全球第一农业强国,一直引领智能农业产业发展。在精准农 业领域,Prospera、Arable 和 Trimble 等公司利用摄像头、传感器、 微气象数据或定位技术对农作物进行监控分析;在农业智能设备领 域,Blue River 公司创造了“生菜箱子”机器人,“可视化喷洒车”及无 人驾驶航空系统。与此同时,中国农业产业智能化也正在加速转型。例 如麦飞科技的智能农业监测无人机,合众思壮的“慧农”北斗导航农 机自动驾驶系统,以及佳格天地将 AI 技术大规模应用在了种田和养猪 场景等均是典型案例。同时,一些科技巨头也相继开始布局智能农业 领域。2018 年 4 月京东的“京东农场”首次亮相;6 月,阿里云的 ET 农 业大脑问世。 图表 6-10 全球智能农业领域典型企业 资料来源:中国信息通信研究院(2018 年) 33
34. 6.2.7 AI+ 制造 AI 技术赋能制造业领域,可以显著促进优化制造周期和效率,改善产 品质量,降低人工成本。智能制造产业链场景范围很广,其典型应用场 景包括有智能产品与装备;智能工厂、车间与产线;智能管理与服务;智 能供应链与物理;智能软件研发与集成;智能监控与决策等。 Market Research 数据显示,2017 年全球智能制造市场达到 2,028.2 亿美元,预计将在 2023 年达到约 4,790.1 亿美元,预测期 (2018-2023) 内复合年增长率约为 15.4%。前瞻产业研究院数据显示,2017 年,中国 智能制造行业的产值规模已达到 15,000 亿元左右。预计未来几年中国 智能制造行业将保持 11% 左右的年均复合增速,到 2023 年行业市场 规模将达到 2.81 万亿元,行业增长空间巨大。 近来年,智能制造已成为各国产业升级的主战场,一些发达国家在 这方面已远远走在前面。例如,德国菲尼克斯的智能车间,美国 C3 IoT 的 AWS 云生态系统,美国哈雷戴维森公司的智能制造单元等。在 智能设备监控领域,也有如德国的 KONUX、法国的 Scortex、日本的 BrainsTechnology 等公司布局。一些中国企业也在进行智能工厂的建 设,加大企业转型升级的力度。如埃斯顿在南京建立的工业机器人智 能工厂、广汽传祺在杭州的智能工厂、中车浦镇车辆的数字化工厂等 等。在传统家电制造业,美的、海尔、格力等企业,正在积极向智能制 造模式建设转型。 图表 6-11 全球智能制造领域典型企业 资料来源:中国信息通信研究院(2018 年) 34
35. 6.2.8 AI+ 网络安全 AI 技术赋能网络全领域,有助于厂商、企业,乃至个人有效提升应对越 来越多的网络欺诈和恶意攻击等网络安全问题的能力。人工智能在网 络防御领域具有一些独特优势,这也使其成为 AI 网络安全防护的突 破口。目前智能网络安全的主要应用包括:网络监控防范(包括包括实 时识别、响应和防御网络攻击、安全漏洞与系统故障预测、云安全保 障等);预防恶意软件和文件被执行;提高安全运营中心的运营效率; 网络流量异常检测;应用安全检测;网络风险评估等。 根据 Technavio 最新的市场研究报告显示:2017 年全球智能网络安 全市场规模 49.6 亿美元,预测全球基于人工智能的网络安全市场在 2018-2022 年期间的复合年增长率将超过 29%。 各国政府高度重视网络安全,例如美国的 IBM Corporation、 CrowdStrike,英国的 RepKnight 等公司通过提供网络保护平台, 实现阻止恶意软件、检测网络钓鱼与数据泄露等网络安全防护服 务。欺诈与风险检测是网络安全领域的另一个重要应用,美国的 DataVisor、Drawbridge,葡萄牙的 Feedzai 等公司均有相关业务布 局。近年来,中国智能网络安全企业涨势迅猛。其中,提供网络防御和 反病毒服务的有图灵网安、360、网易云等公司;提供数据监测、反欺 诈服务的有鹰眼数服、猛犸反欺诈、慧安金科、同盾科技等公司。 图表 6-12 全球智能网络安全领域典型企业 资料来源:中国信息通信研究院(2018 年) 35
36. 6.2.9 AI+ 人力资源 AI 技术赋能人力资源领域,有助于人力资源服务于管理过程的流程自 动化升级,大幅提高工作效率与合规性,减少人员招聘与管理成本及 个人偏见。其主要应用内容包括招聘前的人才渠道维护、人才预测分 析、职位匹配、简历筛选、AI 聊天支持等;招聘过程中的约面试、查结 果、办入职等;新入职时的员工培训、QA 互动问答、知识学习和职业 规划支持;入职后的员工行为与效率分析、薪酬分析、心理健康分析、 团队文化分析等。 Grand View Research 数据显示:2016 年全球人力 资源管理软件市场估值约 126 亿美元。预测到 2025 年将达到 300 亿 美元,预测期 (2017-2025) 内复合年增长率为 10.4%。中商产业研究院 数据显示:中国人力资源服务市场的规模由 2013 年约 1,584 亿元增 至 2017 年 3,436 亿元,复合年增长率为 21.9%,并预期于 2022 年增至 8,427 亿元。 国际上人力资源招聘领域对人工智能的应用非常重视。国际上人 力资源招聘领域对人工智能的应用非常重视,以美国为首,IBM 的 Watson 里面包含了人力资源的三个框架,通过模型深度学习寻找专业 人才并洞察竞争对手人才需求,评估职位体验和技能感知度。ADP 公 司、Workday 公司通过工作日人力资本管理,全面了解员工队伍。 Ultimate Software 提供从招聘到退休的一系列人力资源解决方案。日 本人力资源巨头 Recruit 是以人才评鉴技术闻名的企业,其商业模式 由 负责为求职者个人咨询的 Career Adviser (CA) 和担任招聘企业的 Recruit Adviser (RA) 两大部分组成。中国许多企业已经将 AI 技术运用 到人力资源实际工作当中。比如,竹间智能的 HR 助理机器人,辈出科 技的 HR 超级助理“小辈”,墨子 AI 研发的“MOBOT”可以帮助招聘人 员分担大部分工作。e 成科技利用 AI 提供科学判断决策依据,助力企 业人力资本全面增值。 图表 6-13 全球智能人力资源领域典型企业 资料来源:中国信息通信研究院(2018 年) 36
37. 6.2.10 AI+ 安防 AI 技术赋能安防领域,填补了传统安防在当下越发不能满足行业对于 安防系统准确度、广泛程度和效率的需求缺陷。智能安防是人工智能 最先大规模应用,并持续产生商业价值的领域,其在产品落地的功能 实现上,主要体现在目标跟踪检测与异常行为分析,视频质量诊断与 摘要分析,人脸识别与特征提取分析,车辆识别与特征提取分析等。 Mordor Intelligence 分析称 2017 全球视频监控系统市场规模 349.623 亿美元,预计 2023 年将达到 826.153 亿美元,预测期 (2018-2023) 内 的复合年增长率为 15.41%。中国《财经》数据显示,2017 年中国安防 产业的产值达到 4,500 亿人民币,但所有 AI 安防产品产值不到 20 亿,AI 在安防行业技术渗透率不到 1%。 智能安防系统的建立,离不开软件算法与硬件系统的集成。在系统硬 件方面,国际上有瑞典的视频处理芯片商 Axis Communications AB, 美国的安防硬件提供商 ADT、OPTEX 等;在中国,海康威视、大华股 份、东方网力等企业都在相关领域处于市场领先地位。在软件算法方 面,以色列的 Agent Video Intelligence,加拿大的 Genetec,美国的谷 歌、Facebook、微软,以及中国的商汤科技、旷视科技、依图科技、云从 科技等公司均具备优异的图像分析算法。 图表 6-14 全球智能安防领域典型企业 资料来源:中国信息通信研究院(2018 年) 37
38. 6.2.11 智能驾驶 AI 技术赋能传统驾驶领域,可以有效提高生产与交通效率,缓解劳动 力短缺,达到安全、环保、高效的目的,从而引领产业生态及商业模式 的全面升级与重塑。智能驾驶是个复杂的产业链,其涉及的领域包括 芯片、软件算法、高清地图、安全控制等等。 截止 2017 年底,中国人均汽车拥有量约 0.156 辆,不到美国的 1/5,市 场成长空间巨大,世界各个国家的政策和各大企业的产业布局都使得 智能驾驶成为热点研究领域。目前,业内普遍将自动驾驶汽车分为 L0 到 L5 级,L4 和 L5 级可统称为“无人驾驶”,当前自动驾驶商业技术基 本在 L2-L3 级水平。美国 IHS Automotive 报告预测,到 2025 年,全球 自动驾驶汽车销量将接近 60 万辆,2035 年将达到 2,100 万辆,预测 期 (2025-2035) 内市场将保持 48% 的年复合增长率。速途研究院报告 显示,在 2017 年中国智能驾驶市场规模已经达到了 681 亿,预计 2018 年将达到 893 亿元,年增长率 31.1%。 从全球来说,自动驾驶主要包括主机商(宝马、通用、奥迪等)、供应商 (奥托立夫的 Veoneer、博世等)、科技公司(Google 的 Waymo、百 度的 Apollo、以色列的 Mobileye 等)以及出行公司(图森未来、小马 智行、景驰科技等)。Mobileye、宝马、沃尔沃和福特都相继宣布,要在 2021 年至少实现 L4 级别的自动驾驶汽车商用落地。但受限于相关技术 成熟度、法律法规完善以及基础设施配套等因素,目前来看,还存在很多 不确定性,而一些复杂度较低,外部干扰因素少的相对封闭驾驶场景,被 认为是最有望率先实现落地的无人驾驶汽车场景。目前,已经量产商用 的有 Telsa Model 系列(L2-L3 级汽车),Audi a8(L3 级汽车)。2018 年 3 月,autowise.ai 宣布在上海试运营全球首个自动驾驶清洁车队;7 月, 百度宣布与金龙客车合作生产的全球首款 L4 级别量产自动驾驶巴士“ 阿波龙”量产下线。 图表 6-15 全球智能驾驶领域典型企业 资料来源:中国信息通信研究院(2018 年) 38
39. 6.2.12 智能机器人 AI 技术赋能机器人,使机器人具备了类人的感知、协同、决策与反馈能 力。从应用角度看,主要包括智能工业机器人、智能服务机器人和智能 特种机器人。当前主流的智能工业机器人一般具有打包、定位、分拣、 装配、检测等功能;智能服务机器人一般具有家庭伴侣、业务服务、健 康护理、零售贩卖、助残康复等功能;智能特种机器人一般具有侦察、 搜救、灭火、洗消、破拆等功能。 根据 IFR 发布数据显示,2017 年全球机器人市场规模已达到 500 亿 美元。根据来自《2018 年中国机器人产业分析报告》的数据,中国机器 人本体和系统集成市场已超过 1,200 亿元,同比增长 25.4%。其中,行 业、服务和特殊机器人市场已达到 435 亿元,预计到 2020 年将达到 719 亿元,在预测期 (2017-2020) 内复合年增长率 18.24%。国际机器人 领域四大巨头(ABB、Fanuc、Yaskawa、Kuka)早已在智能工业机器人 产业占据绝对市场份额。而智能服务机器人作为新兴行业,因其直接 面对消费端,市场需求更具多样化,市场竞争更具有区域化特征。诸如 iRobot 的家庭清洁机器人,乐高的教育编程机器人,CYBERDYNE 的医 疗辅助机器人,纳恩博的代步机器人,Roobo 的商业服务机器人分别 应用于家庭、教育、医疗、出行、商业等不同服务领域。在智能特种机 器人领域,有诸如 ReconRobotics 的侦查机器人、中信重工的消防灭火 机器人等。 图表 6-16 全球智能机器人领域典型企业 资料来源:中国信息通信研究院(2018 年) 39
40. Gartner 的调研报告 人工智能技术成熟度曲线,2018 年 人工智能几乎成为了家喻户晓的流行语。然 而,该技术目前还处于早期阶段:新思路层出 不穷,而一些现有想法却无法达到预期效果。 此技术成熟度曲线将帮助 CIO 和 IT 领导者跟 踪重要趋势和创新,以确定其人工智能计划 的范围、状态、价值和风险。 分析 您需要知道什么 现在是决定人工智能未来方向的关键时机。 全球只有 4% 的 CIO 表示正在实施人工智能 项目。关于人工智能的每一个决策都会影响 人工智能的长期发展方向。现实与虚幻共存 的人工智能即可以带来希望,又可以实现科 学幻想。人们实施人工智能的意愿越来越强 烈。“人工智能”一词稳居 gartner.com 的新 兴搜索、高增长搜索和最热门搜索的前十位。 许多行业中的数据和分析领导者正在寻求突 破,他们应该以此作为长远目标。然而,人工 智能的直接影响是在实际应用中。 技术成熟度曲线 人工智能的过度炒作俨然已成为一种社会经 济现象。媒体、政府、公司和个人对于人工智 能都有自己的观点,主要基于对人工智能的 模糊认识。此技术成熟度曲线中将人工智能 视为一种普遍范式,是对价值创造过程中不 同阶段的诸多创新的总称。随着早期实施者 数量的增加,“过高期望的峰值”的受关注度 日益增加,但生产实施方案却仍然很少。创新 萌芽期的一系列高承诺创新方案正在接近“ 过高期望的峰值”,受关注度日益增加,表明 人工智能技术成熟度曲线将会继续。此技术 成熟度曲线中的所有方案在达到高峰期前已 经过时,但并非所有方案都已过时,许多档案 会变为不同的方案,具体将取决于客户今天 做出的选择和决策。 为了实现短期目标并确立人工智能的长期愿 景,CIO、IT 领导者和人工智能领袖应该跟踪 重要人工智能趋势: • 受到以支持 VPA 的无线扬声器为代表的 Amazon Alexa、Google Assistant 和其他 全球成功案例的鼓舞,对话式人工智能提 上了许多公司的议程。为了开发聊天机器 人和语音支持策略,实施者应当关注虚拟 助手、聊天机器人、自然语言生成 (NLG)、 自然语言处理 (NLP) 和语音识别等达到高 峰期之前的时间。 • 在各种新工具和方法涌入市场的情况下, 机器学习和相关深度神经网络 (DNN)、集 成学习以及预测性和规范性分析,正成为 常见功能。DNN 仍然是实施者和科学家 关注的焦点,但关键在于找到要解决的正 确深度学习问题。同时,在著名的人工智能 研究者 Ali Rahimi 的 Test-of-Time award (时间检验奖)讲座中,他提出:“机器学 习是否已变成炼金术?”的问题,以呼吁在 机器学习领域中采取更加严谨的态度。 • 计算基础设施推动了人工智能的进步,并 正在适应人工智能。从而推进前沿人工智 能的发展。GPU 加速器、FPGA 加速器、深 度神经网络 ASIC 和神经形态硬件展示了 不同的计算想法,而且未来还将有更多方 法。CIO 和 IT 领导者应当在计算基础设施 策略中平衡使用案例驱动型功能的成本和 性能。 • 大量应用开发人员和软件工程师正投身 人工智能领域,他们中的大多数人甚至自 信满满地认为自己将在两到五年内成为主 要的人工智能实施者。虽然现在还为时尚 早,但 CIO 和 IT 领导者应该鼓励开发人员 尝试使用人工智能开发人员工具包和人工 智能 PaaS,并制定计划以提高开发人员的 技能,从而为其在人工智能战略中的新角 色做好准备。 新进成员 • 人工智能治理:今年,人们开始表现出对 人工智能的有效性、可解释性和意外偏差 的担忧。许多 Gartner 客户甚至希望了解 在启动人工智能计划前应如何管理人工智 能。 • 人工智能开发人员工具包:社会对人工智 能的需求是巨大的。但是与软件开发人员 相比,数据科学家数量却很少。各供应商 协作,通过在开发人员工具包中提供的熟 悉概念,使这个庞大的队伍能够执行基本 的人工智能开发功能。 • 知识图谱:内容和上下文在利用人工智能 技术提供洞察力方面的作用日益显著,以 及人工智能应用的最新知识图谱产品使知 识图谱浮出水面。 • 人工智能 PaaS:人工智能 PaaS 技术成 熟度曲线正在上升,领先的云服务提供商 利用人工智能 PaaS 作为其云端产品的卖 点,并作为吸引开发人员和数据科学家的 工具。 • 聊天机器人:聊天机器人在技术成熟度曲 线中的位置有所上升,并且在接下来几年 中有大幅上升,但是一旦达到泡沫化底谷 期,它们就会产生反弹。 • 支持 VPA 的无线扬声器:如果没有 Amazon Alexa、Google Assistant 和类似 服务,人工智能技术成熟度曲线将不完 整。虽然这些只是扬声器,但它们听起来 甚至看起来都很智能。 40
41. 41 • 智能应用:这些应用意味着将人工智能 嵌入企业应用,以及将人工智能封装在域 应用中的趋势。 • RPA 软件:RPA 已经加速上升为 Gartner. com 上最受欢迎搜索的前 10 名。技术成 熟度曲线的读者们应熟悉 RPA 功能,并了 解人工智能只是其中的一小部分。 名称变更 • 深度神经网络(以前称为“深度学 习”):两年内的第二次名称变更反映了 围绕这些算法和框架的巨大创新、颠覆和 争论。 图1 人工智能技术成熟度曲线,2018 年 资料来源:Gartne(r 2018 年 7 月) 41
42. 优先级矩阵 除三项创新外,此技术成熟度曲线上的其他 项目都具有高影响力或变革性。在不到五年 的时间里,超过一半的技术成熟度曲线项目 可达到实质生产的高峰期(20% 的市场渗透 率)。这些确实不负众望!高效益创新可提高 业务效率,但需要进行持续培养。转型创新 将带来变革,它们需要新技能,同时也会带来 高风险和高回报。对于风险承担,人工智能 技术本身会使风险“计算”过程更忠实、更准 确且更频繁,因此把步子放得更小,以免酿 成大错。 人工智能获得成功的关键是“狭义人工智能”, 即,不是通用人工智能,而是具有明确利益的 狭义使用案例。图 2 中的优先级可能有助于 CIO 和 IT 领导者确定与其计划相关的档案并 图2 人工智能优先级矩阵,2018 年 适当地履行其承诺。如果在实现时期望没有 夸大,则高峰期的创新已经非常有用。为了提 高效率,请从正接近于实质生产高峰期的方 案开始。 人工智能优先级矩阵,2018 年 好处 具有变革性 获得主流接受的年数 不到 2 年 2至 5年 5 至 10 年 语音识别 与人工智能相关的 C&SI 服务 聊天机器人 深度神经网络(深度学习) 智能应用 机器学习 虚拟助手 VPA 无线扬声器 认知计算 会话用户界面 神经形态硬件 NLP 超过 10 年 通用人工智能 无人驾驶车辆 高 集成学习 人工智能开发人员工具包 人工智能治理 GPU 加速器 商用 UAV(无人机) 人工智能 PaaS 机器人流程自动化软件 计算机视觉 增强现实 深度神经网络 ASIC 数字化伦理 自然语言生成 图形分析 预测分析 人在回路众包 知识图谱 规范性分析 智能机器人 中等 FPGA 加速器 知识管理工具 虚拟现实 低 截至 2018 年 7 月 ID: 357478 资料来源:Gartne(r 2018 年 7 月) affiliates. All rights4r2eserved. © 2018 Gartner, Inc.
43. 43 为了获得竞争优势,请从创新萌芽期的方案 开始,这些方案将快速通过技术成熟度曲 线,例如聊天机器人、自然语言生成、人工智 能相关 C&SI 服务和人工智能开发人员工具 包。 但是就人工智能而言,还为时尚早。此技术 成熟度曲线中的许多创新尚未得到充分认 识。例如,DNN(在当前人工智能技术成熟度 曲线中是起点)不透明、计算机视觉算法过 度拟合,以及自动驾驶车辆会导致确定问题 负责人的相关争论。因此,人工智能治理、数 字道德,以及人在回路吸引了更多人工智能组 织的关注,并且应该成为人工智能战略家的 关注焦点。 不在技术成熟度曲线上的条目 今年的技术成熟度曲线不包括由更高级概念 表示的低级别案例。包括: • 虚拟客户助理(虚拟助手创新方案的一 部分) • 认知专家顾问(认知计算创新方案的一部 分) • 3 级和 4 级车辆自主(自动驾驶车辆创新 方案的一部分) • 深层强化学习(深层神经网络 [深度学习] 创新方案的一部分) • 智能应用(智能应用创新方案的一部分) • 人工智能化 IT 运维 (AIOps) 平台(增强 型分析创新方案的一部分,包含在“分析 和商业智能的技术成熟度曲线”和“数据 科学和机器学习的技术成熟度曲线”中) 今年的技术成熟度曲线的其他变化如下: • 机器人:包括聊天机器人而非一般机器 人,以更准确地表示技术成熟度曲线。 • 算法市场:此技术成熟度曲线没有达到预 期。此方案已纳入 API 市场中,是“数据科 学和机器学习的技术成熟度曲线”中的创 新方案。 • 学习 BPO:虽然人工智能要求不断地学 习,并且会破除陈规,以支持需不断培养的 创造性任务,但学习 BPO 将成为许多技能 提升和训练方法之一。此创新方案仍保留 在“业务流程服务和外包的技术成熟度曲 线”中。 向上攀升 人工智能治理 分析师:Svetlana Sicular、Frank Buytendijk 定义:人工智能治理是在预测模型和算法的背 景下,创建策略、分配决策权,并确保组织对 在应用和使用人工智能过程中的风险和投资 决策负责的过程。人工智能治理是自适应数 据和分析治理功能的一部分。它涉及人工智能 的敏感性、预测性和概率。 定位和市场采用速度:直到最近,人工智能主 要都是科学家和研究人员从事的领域,而很 少关注人工智能对更广泛企业的实际影响。 人工智能现已到达实际企业应用的边界,数 据和分析领导者开始提出如何在开始实施人 工智能之前进行人工智能治理的问题。他们 询问如何平衡人工智能所承诺的业务价值与 正确监督、风险管理和投资管理的需求。到目 前为止,答案并不多,但企业从业者已经在建 立人工智能治理方面迈出了一步。新组织(如 AI Now Institute 和 Partnership on AI)正在涌 现,以防止与人工智能相关的偏差、歧视和其 他负面影响。 用户建议:人工智能治理基于三个基石:信任 度、透明度和多样性。其核心是建立在数据 和分析治理原则基础上,但人工智能治理的 根本区别在于人工智能的概率性质,以及人工 智能如何用于推动高级预测形式。基于人工 智能的系统(通常使用机器学习)具有紧急设 计,而经典信息系统具有成熟设计。数据和分 析治理将侧重于信任度,而分析治理则强调 透明度。人工智能治理将这些概念扩展到信 任度、透明度以及数据、算法和人工智能团队 人员的多样性。人工智能治理支持以多样性 来抵消偏差和预测错误。 数据和分析领导者应该: • 确保信任当前数据源以避免片面信息。 • 需要新的、不同的、甚至是相互矛盾的数 据与您已使用的数据相结合,以最大限度 降低人工智能偏差风险。 • 确定数据源和算法的透明度要求。 • 促进人工智能解决方案的透明度以及围绕 人工智能的沟通,以最大限度减少对人工 智能结果的不同解释。 • 多样化算法以满足人工智能要解决的问题 的复杂性要求。 • 质疑预期结果。如果结果完全符合预期, 那么您要解决的问题就太简单了。 • 创建反馈环路、带“断路器”和人为监督功 能的“护栏”,以防止人工智能错误。 43
44. • 通过建立组织角色和责任,最大限度地从 人工智能获益,首先以卓越中心为起点,以 便分享技能、资源和知识。 • 定义治理流程以评估业务回报,从而转向 另一个人工智能项目或迭代。不同的治理 方法:在某些情况下,完全没有或只有很 少的治理会加速初始创新,但这应该是您 的人工智能治理框架内的有意识决策。 业务影响:人工智能反映了它学到的知识:这 可能很酷,或者令人畏惧(或在偶然情况下既 酷又令人畏惧)。通常,人工智能团队将决定 学习什么、如何学习以及如何确保最佳结果。 治理的目标是确保此类决策可最大化价值并 最大程度降低风险。如果您可以证明输出结 果的有效性,则可以接受某些“黑匣子”模 型,而其他一些模型则需要透明度以满足法 规要求或保持组织声誉(例如,当涉及信用、 就业或住房等决策时)。人工智能的数据源 通常包含不完整或无意的偏差信息,这是导 致人工智能错误结果的主要原因。对人工智 能风险的认识目前仅限于媒体宣传(如假新 闻和无人驾驶汽车),而每个行业都可能遇到 自己的特定人工智能问题。遗憾的是,目前有 95% 的人都忽视人工智能治理,并未意识到 潜在的风险。 好处评级:高 市场渗透率:少于 1% 的目标受众 成熟度:初具雏形 通用人工智能 分析师:Tom Austin 定义:通用人工智能 (AGI),也称为“强人工智 能”和“通用机器智能”,可处理一系列广泛 的使用案例,前提是存在这种人工智能。尽管 它是科幻小说的热门主题,但情况并非如此。 当前的人工智能技术无法实现 AGI。它们看似 具有仿人学习、推理和适应能力,但是缺乏常 识、智慧以及进行自我维护和复制的广泛方 法。专用人工智能,即“弱人工智能”确实存 在,但仅适用于特定的狭义使用案例。 定位和市场采用速度:人工智能取得的实际 进步一直仅限于“弱人工智能”。因此,AGI 在 此技术成熟度曲线上的位置和采用速度保持 不变。(我们在 2017 年曾将此条目名称改为“ 通用机器智能”,以反映“AGI”一词的受欢迎 程度。) 无法证明当今的人工智能技术拥有与人类智 能相当的能力(缺少约定测试以证明此类智 能本身就是一个问题)。有时,我们也许可以 建造一台具有近似人类认知能力的机器,但 是要完成所需的研究和工程设计,可能还需 要数十年时间。 AGI 的主题经常出现在“认知计算”的讨论 中,“认知计算”一词对于不同的人意味着不 同的事物。对于某些人来说,它表示一系列 人工智能的能力;对于其他人来说,它是一种 在神经形态或其他高度并行的短传播路径处 理器中的特殊硬件。它还可以描述对信息和 通信技术的使用,以增强人类认知,这也是 Gartner 对该词的使用方式。 用户建议:专注于利用专用人工智能技术(包 括领先的和较旧的人工智能技术)的应用实 现的业务成果。 领先的人工智能技术将帮助实现目前认为 的“惊人创新”,包括各种深度学习工具和相 关的自然语言处理能力。这些创新正在做我们 以前认为技术无法做到的事情。但是,它们通 常是研究工具,只是刚从研究实验室中涌现 出来,方向尚且不明,而且其工程原理尚未被 人们充分理解。随着时间的推移,我们了解了 它们存在的限制,并制定了可行的工程指南。 随着惊叹情绪逐渐消退,倦怠之意渐起,我们 会转而将它们视为“过时创新”。 关注应用实现的业务成果,这些应用会利用 老化的创新(包括专家系统和其他人工智能 象征方法,以及更简单形式的机器学习)、惊 人创新(通常是功能更强大、人们不太了解的 技术),或者两者都会用到。此类应用示例包 括自动驾驶交通工具、智能顾问,以及专注于 各种目标(如改善财富管理)和职责(如销售 或预算管理)的虚拟助手。大多数企业在同时 使用惊人的和老化的创新。 专用 AI 将对业务和个人生活带来巨大的颠覆 性影响。但是,作为终端用户的组织应该忽视 AGI,除非 AGI 研究人员和倡导者展示出相关 的重大进展。在那之前,请忽视供应商关于其 产品具有 AGI 或人造人类智能特性的暗示, 这些通常都是程序员制造的假象。 业务影响:虽然研究将继续进行,但 AGI 不太 可能在未来 10 年内出现。当它最终出现时, 可能是许多专用人工智能技术组合而成的结 果。它带来的优势可能是巨大的。但是,其在 经济、社会和政治方面的某些影响将是颠覆 性的,而且可能并不全都会产生积极的作用。 44
45. 45 目前还没有任何系统供应商推出 AGI,但许多 公司都在从事基础研究。例如,谷歌公司旗下 的 DeepMind、OpenAI 和 Vicarious。 好处评级:具有变革性 市场渗透率:少于 1% 的目标受众 成熟度:初具雏形 人工智能开发人员工具包 分析师:Eric Hunter、Svetlana Sicular 定义:人工智能 (AI) 开发人员工具包是应 用和软件开发工具包 (SDK),它们使数据科 学平台、框架和分析库抽象化,以便软件工 程师能够提供支持人工智能的应用。它们涵 盖下列四个成熟类别:基于云的人工智能即 服务 (AIaaS)、虚拟助手工具包(例如 Apple Siri、Amazon Alexa 和 Google Assistant)、 设备开发套件和人工智能服务 SDK。软件工 程师使用它们将人工智能整合到新的或现有 的应用中。 定位和市场采用速度:在过去的 18 - 24 个月 中,供应商一直在积极提供面向开发人员的 人工智能工具包和 SDK。代表性产品包括: • 基于云的 AIaaS 平台(例如 Google AutoML、AWS SageMaker 和 Azure ML Studio) • 虚拟助手工具包(例如 Amazon Alexa Skills Kit、Apple SiriKit、百度 DuerOS 开 放平台、Google DialogFlow 和 Cortana Devices SDK) • 设备开发套件(例如 AWS DeepLens 和 Microsoft Vision AI) • 人工智能服务 SDK(例如 Apple CoreML 和 Google ML Kit)。 在所有类别中,供应商产品具有不同的部署注 意事项,并具有不同的功能覆盖范围差异,但 是我们希望将来具有更高的一致性。 与原生 PaaS 平台相比,基于云的 AIaaS 平台 可降低数据科学的复杂性,从而支持对开发 人员更友好的采用方式。供应商在数据准备、 特征工程、模型选择和训练、超参数调优和 模型部署阶段中的模型生命周期支持有着很 大差异。 人工智能开发人员工具包支持一组有限的本 机使用案例,例如图像识别(包括面部和地 标)、文本分析和图像标签。开发人员还可以 部署定制模型,并可选择在模型运行时从云服 务更新这些模型。尽管 Core ML 和 ML Kit 具 有独特模型格式,但有许多转换实用程序可用 于多种格式的模型,包括 ONNX 和 MXNet。 商业供应商还引入各种服务(例如 IBM 的 Watson Services for CoreML),以扩展人工智 能服务 SDK 支持。 设备开发套件提供定制硬件设备(如摄像头) 以及对开发人员友好的 API 和 SDK,以鼓励 平台开发人员采用。随着平台支持被纳入更 广泛的市场产品,直接的平台供应商套件产品 将减少。 用户建议:应用开发负责人必须评估人工智 能开发人员工具包并平衡其当前的优势和功 能。采用这些产品以将人工智能功能和特性整 合到应用的 IT 领导者应该: • 提取所采用的供应商产品,这些产品可尽 量减少可移植性约束条件和锁定情况。 • 避免将不成比例的投资或努力用于将已建 立的应用迁移到新平台以获得一小部分差 异化功能。 • 确保所部署功能与直接的最终用户利益保 持一致,而无需人工智能即可轻松实现。 • 了解此类产品无法使软件工程师取代经验 丰富的数据科学家。 • 利用已建立的信息管理最佳实践来实现数 据管理和隐私。 • 采用与更大范围的组织云和移动开发标准 及策略相一致的产品。 供应商正在市场上快速发布产品,以期吸引 新的开发社区。早期采用者应仔细评估所使 用的产品并进行压力测试,同时充分了解针对 每个特定功能的持续关注支持。 业务影响:CIO、应用开发领导者以及数据和 分析领导者应为软件开发人员做好准备,使 其成为关键的人工智能开发和实施队伍。人 工智能的需求很大,而且,有经验的数据科 学家无法独自满足其增长速度。Gartner 指 出,60% 的数据科学人才集中在全球 50 个城 市,这些城市中的雇主数量有限。 开发人员工具包采用率将继续增加。随着产 品不断成熟,Gartner 预计这些产品将: 45
46. • 通过轻量级运行时框架扩展对边缘和设 备导向型人工智能模型的支持 • 在未来的技术成熟度曲线中成长为不同的 类别 • 增强对特定业务垂直和消费者需求中更高 级别的专注人工智能使用案例的支持 • 继续减少软件工程师和公民数据科学家在 部署人工智能功能时面临的采用障碍 • 增加用户引力和粘性,扩展到更广泛的基 于供应商的云和平台产品,包括平台即服 务 (PaaS) 好处评级:高 市场渗透率:少于 1% 的目标受众 成熟度:新兴 供应商举例:亚马逊、苹果、百度、谷歌、IBM、 微软 知识图谱 分析师:Stephen Emmott、Svetlana Sicular、Alexander Linden 定义:知识图谱将信息(“知识”)编码为排列 在节点和链接(“边缘”)的网络(“图形”) 中的数据,而不是行列式表。节点可保存数据 或其标签;边缘将节点链接在一起,以表示它 们之间的关系。这生成了“三元组”(即节点边缘-节点或 Mary-manages-John 的序列), 它们可以在整个图谱的生命周期中容纳多个 不同数据架构,而无需重新设计。在编码后, 即可重新调用或合成信息以响应查询。 定位和市场采用速度:内容和上下文在通过 使用人工智能技术提供见解方面的作用日益 重要,使得知识图谱可突出谷歌的知识图谱 和微软知识图谱成为广受欢迎的知识图谱示 例,因为它有望使用缺少的数据来丰富您的 数据。专业供应商正向新市场提供基于图形 的产品,并且知名供应商正在其平台和产品中 使用该技术。 知识图谱非常适合存储使用自然语言处理 (NLP) 和相关文本分析技术从非结构化源(如 文档)分析过程中提取的数据。它们还能够存 储结构化数据,包括用于隐式提供结构和上 下文的元数据。出于此原因,图形可以支持: 数据存储、通过在数据中建立关系来结构化 和语境化,以及对其编码的信息进行处理以 支持各种使用案例。 用户建议:应用领导者应使用知识图谱来互连 不同的概念,并用缺少的信息丰富他们的数 据。通过使用图形分析,可以自动发现和利用 数字资产、数据源、流程、人员和交互之间的 动态有机关系。在这方面,一个关键点是实体 提取,即人或事件等实体,可通过在提取之前 分析非结构化数据来加以识别,并且在语境化 之后即在知识图谱中消除歧义。 知识图谱静默地产生“智能数据”,即人工智 能系统可以轻松读取和“理解”的数据。虽然 作为小众供应商的独立产品提供,但知识图 谱的优势通常通过其服务的更广泛平台和应 用来实现。应用领导者应评估供应商如何应 用知识图谱概念来确定供应商解决方案为其 数字业务平台带来的利益。 例如,微软和谷歌分别在其云办公环境中嵌 入了知识图谱(Office 365 和 G Suite)。通过 使用这些环境来捕获信号,其图表能够获取 有关应用使用情况的数据、实现员工之间的 工作关系,以及收集数字资产间的主题连接。 这可支持协作和共享、搜索和发现,以及通 过分析提取见解。其他平台和应用(如文本分 析程序和洞察引擎)还包括底层图形技术, 用于构建知识图谱和增强功能。相比之下,独 立产品是基于图形的应用,专门用于以基于 图形方法管理数据,以支持其他产品。请参 阅“Magic Quadrant for Data Management Solutions for Analytics(分析型数据管理解决 方案的魔力象限)”。 业务影响:组织可以从许多领域的知识图谱 中获得重要价值,以下是其中一些重要价值: • 协作/共享 — 相关联数据是经语境化的数 据,从而可通过隐式和间接连接助力其发 现和检索功能。 • 调查和审计 — 通过捕获和消除映射到现 实世界中实体的那些实体的能力,可以探 索关系以识别欺诈、供应链风险或协作模 式。 • 分析/报告 — 一旦以知识图谱形式对非结 构化数据进行结构化,便可以查询这些非 结构化数据,从而对其进行预处理以执行 分析。 46
47. 47 • 互操作性和自动化 — 通过对数据的自动 读取和“理解”,可支持不同企业应用的数 据集成和操作。 • 数据重用/跨行业协作 — 在概念上链接 数据和元数据,使其更易于共享,从而促 进其重用。 但是,现在判断知识图谱是否能实现更广泛 前景还为时过早。 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例: Facebook、 Google (Cloud Platform)、 Intelligent Views、 Maana、 Microsoft (Microsoft Graph)、 Mindbreeze、 Neo4j、 Semantic Web Company (PoolParty)、 TopQuadrant 神经形态硬件 分析师:Chirag Dekate、Martin Reynolds 定义:神经形态硬件包括在概念上受神经生 物学架构启发的半导体器件。神经形态处理 器采用非冯·诺伊曼 (non-von-Neumann) 架 构,并实现与传统处理器截然不同的执行模 型。它们的特点是处理元件简单,但互连性 非常高。 定位和市场采用速度:神经形态系统处于非 常早期的原型阶段。IBM 已向劳伦斯利弗莫 尔国家实验室 (Lawrence Livermore National Laboratory) 提供了一个基于 TrueNorth 的 系统。BrainChip 的 Spiking Neuron 自适应 处理器技术和 Hewlett Packard Enterprise 的 Labs Dot 产品属于其他早期版本,英特尔 的“Loihi”芯片可支持更广泛的人工智能工作 负载:相比于竞争对手的实施方案,Loihi 可 提供更高程度的连接。高通公司是神经形态 处理器的早期代表,现在已将其重点转向传 统处理器。 神经形态硬件部署过程中有以下三个主要障 碍: • GPU 比神经形态硅更易于访问和编程。 • 知识差距:神经形态硬件编程将需要使用 新的工具和训练方法。 • 可扩展性:互连所导致的复杂性使半导体 制造商创建可行神经形态设备的能力受到 挑战。 目前,这些项目并不是深度神经网络 (DNN) 的主流路径,但随着编程技术的突破性发 展,这种情况可能会发生改变。 用户建议:神经形态计算架构可为诸如深度 神经网络之类的使用案例提供极高性能,因 为它们能够以非常低的功率运行,并且可比当 今部署的基于 GPU 的 DNN 系统更快地进行 训练。此外,神经形态架构可支持在本机进行 图形分析。如今,大多数神经形态架构还未准 备好得到主流采用。但是,这些架构将在未 来五年内变得可行,并将带来新的机遇。I&O 领导者可通过以下方式做好关于神经形态计 算架构的准备: • 通过识别可以从神经形态计算中受益的重 要应用来创建路线图计划。 • 与神经形态计算领域的主要行业领导者合 作,开发概念验证项目。 • 确定需要培养以成功开发神经形态计划的 新技能组合。 业务影响:在推进 DNN 的过程中,神经形态 硬件面临一些最大障碍,但也具有获得最强 大成果的机会。如果不是神经形态硬件,就是 其他全新的硬件设计,未来十年硬件可能会 有重大飞跃。 神经形态系统可降低功率,并可以基于较小 的输入集运行。因此,它们可能首先会在边缘 设备中出现,用于处理图像和声音。这些设备 还可以在边缘执行较低级别的 DNN,从而减 少带宽和中央处理功能限制。 我们正处于极快的发展周期中,此周期由全 新硬件设计、突破性实用 DNN 算法和用于训 练这些系统的大量大数据支持。神经形态设 备可将 DNN 的范围进一步推向网络边缘,并 可加速网络内部的图像和声音识别等关键任 务。他们将需要在架构和实现方面取得重大 进展,以与其他 DNN 架构竞争。 好处评级:具有变革性 市场渗透率:少于 1% 的目标受众 成熟度:初具雏形 供应商举例:BrainChip、Hewlett Packard Enterprise、IBM、英特尔、美光 与人工智能相关的 C&SI 服务 分析师:Susan Tan 定义:人工智能 (AI) 相关的咨询和系统集成 (C&SI) 服务是智能自动化服务的一个子集,可 帮助客户了解使用案例、设计业务或 IT 流程、 选择技术、策划数据、构建和训练模型、部署 解决方案、评估和降低风险,以及调整人才组 合以成功整合智能解决方案。智能解决方案 必须涉及一种或多种先进技术,例如机器学 习、深度学习和自然语言处理。 47
48. 定位和市场采用速度:买家组织将邀请服务 提供商探索将人工智能纳入解决方案。这些 项目中的大多数(即 68%;基于对 24 家服务 提供商的调查)都在构思、探索和概念验证。 为了加速实现价值,服务提供商正在使用快 速的分阶段方法、平台和预建资产和/或预训 模型来提供智能解决方案。 市场正在兴起,许多领先的 SI 已经在与客户 合作开发智能解决方案,通常包括人工智能 和其他更成熟的技术。他们的成功经验证明, 使用人工智能可以实现针对性的业务成果, 例如提高生产力、提高一致性、降低错误率以 及提高客户保留率和收入,从而提高使用此 类服务的其他客户的信心,并提高未来两三 年中的采用率。 但是,在此阶段采用与人工智能相关的 C&SI 服务的组织面临下列障碍: • 该技术是新技术,在安全性、隐私、风险、 责任等方面的特性仍然未知。 • 对人工智能的能力、局限和影响的理解有 限。 • 缺乏启动人工智能计划和路线图的内部技 能和能力。 • 提供用于培训人工智能的即用型数据的可 用性、花费很长时间来准备训练人工智能 以及缺乏流程标准化和文档。 • 对如何将人工智能扩展和集成到现有系统 和工作流程的理解有限。 • 忧虑智能解决方案对工作和任务的影响。 由于内部能力有限,当组织准备应用人工智 能时,会大概率转为请服务提供商提供咨询 和实施。 用户建议:希望与人工智能相关 C&SI 服务 提供商合作的客户应当: • 使用“从小规模开始,实现利益,然后扩大 规模”的方法,重点关注狭义领域使用案 例以及相关业务成果,其中人工智能方法 可以提供高于传统技术所能实现的价值。 • 与服务提供商签订时间框架协议,以帮助 构建在单一知识领域中最小的可行产品或 自动执行已定义任务,从而更快地训练人 工智能并更快地获得收益。 • 避免需要经过多年训练和验证 的“Moonshot”项目,除非它可能会破坏 整个行业的或导致比例失调的竞争优势。 在这种情况下,请确保您拥有合同条款,以 防止服务提供商将此类知识产权 (IP) 泄露 给竞争对手,并确保您拥有最高级别的执 行承诺。 • 让服务提供商帮助您了解人工智能对贵组 织的流程和员工的影响,并采取措施降低 风险、实施变更管理并应用负责任的人工 智能道德规范,例如避免偏差和意外后果, 以及开发安全、透明并且可解释的人工智 能系统。 • 倾向于采用已投资于构建人工智能杠杆式 解决方案或预训解决方案(例如为您所在 行业提供人工智能的预测性维护)的服务 提供商。 • 确定合同中需要明确保护的数据和 IP,以 避免服务提供商在其解决方案中使用它 们。 • 确保服务提供商将适当的跨学科顾问组合 与相关经验(包括技术、领域和行业/流程 知识)相结合,同时认识到技术的创新性 意味着很少有人具有直接的人工智能解决 方案经验。 • 获取参考资料,并与他们讨论其实施方 案,以及未预料到的领域以避免重复发生 相同错误。 业务影响:与人工智能相关的 C&SI 服务可应 用于任何业务流程或模型。Gartner 最近的 一项研究发现,企业组织正在部署以下使用 案例: • 预测分析:通过采用将使用数据挖掘和跨 大量数据进行模式识别的学习系统,提供 洞察力、检测异常情况、提供个性化项目以 及预测可能的事件。 48
49. 49 • 使用人工智能和 RPA 的组合自动执行任务 并替代人类判断。业务流程优化使用案例 示例是使用可汇总合同数据的智能搜索, 智能技术会摄取结构化和非结构化数据、 提取需注意的合同和策略中的相关关键条 款、减少要读取的文本量,以及使员工能 够将时间用于满足相关条款。 • 使用文本或语音通过自然语言与用户进行 通信的聊天机器人或虚拟代理,可以快速 扩展呼叫中心,并通常以多种语言进行更 具吸引力的个性化对话。 • 具有嵌入式传感器和人工智能技术的产品 使它们更加智能,从而能够了解其所处环 境。 • 含人工智能技术的机器人设备(如无人驾 驶飞机和人工智能机器人)可以在危险或 偏远环境中执行任务,和/或从其环境和 经验中学习以更好地执行任务。 好处评级:具有变革性 市场渗透率:5% 至 20% 的目标受众 成熟度:新兴 供应商举例:Accenture、Atos、Deloitt e、EPAM、Fujitsu、IBM、Infosys、Luxoft Holding、Mindtree、PwC 人在回路众包 分析师:Svetlana Sicular、Gilbert van der Heiden 定义:人在回路众包结合人力和基于算法的 自动化来解决问题或执行任务,其中人力投 入可进一步改进自动化人工智能或数据管理 解决方案。 人在回路众包具有三个重要特征: 1 能够大规模接触预审合格人员。 2 能够聚集人群的力量,共同促进实现富有 意义的成果。 3 使参与者在无需作为全职员工的情况下完 成主要是以信息为中心的特定任务。 定位和市场采用速度:人在回路众包是从 委托解决问题到已知人员(内部或外包)的 重大转变。目前,学术界和市场领导者(谷 歌、Facebook、亚马逊、微软、IBM、eBay、百 度以及众多其他知名企业)经常会采用此方 法。在过去的一年中,采用速度大大加快,主 要是受到数据标签的机器学习要求以及训练 数据质量的推动。例如,不断发展的机器学习 业务使 CrowdFlower 对自己进行了重塑,如 图 8 中所示。数据科学问题解决方案也在增 加:Kaggle 报告称,2018 年会员增长加速。 虽然市场潜力很大,但人在回路众包面临着 许多采用障碍,其中包括对其优势的低认知 度,以及对质量、安全性和机密性的“感知” (而非真实)关注。随着整个人工智能市场的 成熟,采用率将增长,因为组织将意识到人在 回路众包是提高机器学习模型准确性的可行 (并且可能是最可靠的)解决方案。 用户建议:从事人工智能和机器学习领域的公 司应采用人在回路众包作为人工智能解决方 案的推动因素。与内部或传统外包功能相比, 这种方法可以产生更多流动成本,并且可以 更广泛地获得问题解决、模型训练、分类和验 证功能。 数据和分析领导者应在以下情况下使用人在 回路众包: • 难以描述自动化操作(大部分是针对数据 收集、验证和增强)的规则,例如给图像加 标签或以未指定来源的数据进行数据扩 充。人类可以找到恰当的信息,他们输入 的内容可作为训练数据集,以便实现算法 的进一步改善。 • 例如,在机器学习算法达到其精度极限时, 机器便无法高效地解决问题,这时人类可 以进一步改进输出(比如优化内容,检测 文本中的微妙差异,或验证信息检索和搜 索结果)。 • 完成任务或项目需要用到稀有技能(例如, 数据科学能力)。这类情况通常涉及激烈 的竞争,并且还需求助经认证的专家(例如 通过 Kaggle、Topcoder、Experfy、Aigency 或 Gigster)。这个方法的绝妙之处在于可 以自己选择参与者。稀有技能的另一个例 子是有关狭窄市场或特定利基市场的知 识,比如验证某个解决方案是否适用于具 有文化差异的不同地理区域。 • 传统解决方案需要完成太多的设置工作, 例如,通过一次作业为所有种类的移动设 备编写用户界面。 数据和分析领导者应留出时间来适应众包能 力。他们还应考虑潜在风险,包括与劳动相关 的法律影响、知识产权保护和质量不稳定。 49
50. 业务影响:人在回路众包的业务影响范围介 于中等影响到重大影响之间: • 中等是因为在某些情况下,组织已经能够 通过众包获取利基解决方案,从而实现成 本节约。 • 高是因为它可实现人工智能、机器学习及 出色的信息质量,而如果没有该创新方法, 这些都无法实现。 众多行业都将发现人在回路众包不可或缺。 对于有兴趣将人类智能应用于非结构化文 本、图像、音频和视频数据以实现人工智能、 机器学习和出色信息质量的分析团队,以及 那些期望获得一次性解决方案或数据科学 等稀有技能的个人,该方法将提供巨大的帮 助。需完成的任务可能包括算法训练数据调 节、元数据提取、校正、图像识别、内容创建 和分类、数据收集、产品类别划分、产品描述 优化、文本翻译、房地产照片创建以及音频 转录。 好处评级:高 市场渗透率:5% 至 20% 的目标受众 成熟度:未成熟 供应商举例:Alegion、Amazon Web Services、Experfy、Figure Eight、Kaggle、Play ment、Topcoder、TwentyBN 自然语言生成 分析师:Rita L. Sallam、Cindi Howson 定义:自然语言生成 (NLG) 可自动生成数据洞 察的自然语言描述。在分析上下文中,当用户 与数据交互以解释重要发现或者图表或仪表 板的含义时,叙述会动态变化。NLG 将自然语 言处理与机器学习和人工智能相结合,可动 态识别数据中最有用的洞察和上下文(趋势、 关系、相关性)。 定位和市场采用速度:文本分析侧重于获得分 析见解,而 NLG 可用于通过将分析输出与动 态选择驱动型描述相结合来合成文本内容。 虽然仍处于早期市场采用阶段,但 NLG 的运 用正在有效减少执行可重复分析过程所需的 时间和成本,例如运营和监管报告、金融服务 部门的收益报告、政府部门的福利报表和天 气预报以及广告部门的个性化信息。它还可 用于数据产品,如体育分析(个性化“梦幻足 球”分析和报告)、客户沟通以及营销和研究 信息服务。 NLG 与现代分析和商业智能 (BI) 的结合(可 用于创建分析内容,包括分析应用)是最有前 景的应用之一,可改进所有用户获得的分析 洞察。现代分析和 BI 平台在交互式仪表板和 情节提要中的数据可视化方面取得了重大进 展,并具有协作功能,可共享研究结果并进行 社交活动。但是,很多用户的分析技能级别 各有不同,无法正确解释可视化中的统计显 著关系并采取相应措施。此外,如果不使用 NLG,研究结果的注释和呈现过程会是手动 和静态的。 通过添加 NLG,这些增强型分析平台,例如 Salesforce 的平台 (Einstein Discovery) 和基 于搜索/自然语言查询的平台(ThoughtSpot 和 AnswerRocket),可自动生成数据研究结 果基于上下文的书面或口语叙述。该过程伴随 可视化、情节提要和批处理报告,可充分告知 用户最重要的和有指导意义的内容。BI 团队 现在还可以将独立 NLG 引擎(如 Automated Insights、Narrative Science 和 Yseop 的引 擎)与现代分析和 BI 或数据科学平台集成, 以便向从分析人员到信息使用者和公民数 据科学家的对象解释研究结果。Narrative Science、Automated Insights 和 Yseop 现 在都提供针对其平台的 API。Qlik、Microsoft (Power BI)、Tableau、Sisense、Information Builders 和 MicroStrategy 已经与这些 NLG 供应商中的一个或多个进行集成。其他合作 关系也正在发展形成。将 NLG 与分析和 BI 平 台以及虚拟个人助理(如亚马逊 Alexa、苹果 Siri 或 Google Assistant)集成,将进一步推 动 NLG 的采用。 要实现广泛采用,简单的配置和多语言支持 是必不可少的。我们预计,由于 NLG 对于将分 析扩展到更广泛受众的潜在积极影响,NLG 将成为 2019 年大多数现代分析和 BI 平台的 一项功能。我们已经预见这种情况,通过与 第三方 NLG 供应商集成或有机发展,大多 数现代分析和 BI 供应商正在提供或计划提 供 NLG。 用户建议:数据和分析领导者应该: • 将 NLG 与目前的现代分析和 BI 功能以及 数据科学计划相集成,或探索新兴的增强 型数据发现工具(这些工具将 NLG 与自动 数据准备和模式检测相结合)。 50
51. 51 • 通过分析是否符合业务成果的要求,评估 贵组织是否准备好为商业用户提供高级分 析功能。 • 关注现代分析和 BI、数据科学平台以及初 创公司的 NLG 功能和路线图。 • 了解解决方案的成熟度(尤其是数据集成 和准备工作要求方面)、平台的自主学习能 力、所需的前期设置和配置、支持的语言 范围、单个图表或跨仪表板的叙述程度, 以及研究结果和叙述的准确性。 • 了解多语言用户场景相关的潜在缺陷,因 为 NLG 需要为每种所用语言使用特定库。 此外,在行话、语气和专业本体方面需要 仔细考虑行业特定的使用案例。 • 认识到 NLG 可能会吸引那些要求其分析 和 BI 解决方案符合《美国残疾人法案》 (Americans with Disabilities Act) 以及其 他国家/地区类似要求的政府组织。 业务影响:NLG 支持许多可减少分析过程之 外的编写需求的使用案例(如财务报表、体育 分析或产品推荐)。 NLG 与自动模式/洞察检测和自助数据准备 的结合有可能会改善下一代增强型分析平台 的用户体验。它还可以将高级分析功能的优 势扩展到更广泛的业务用户和公民数据科学 家受众。 基于上下文的叙述将强化移动 BI 使用案例, 其中屏幕空间不足是信息消费中存在的主要 障碍。它还将扩展结合了 NLQ、聊天机器人和 通过虚拟个人助理实现的 NLG 的会话分析的 运用。此外,还将减少创建定期运营和监管批 处理报告所需的时间和成本。 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例:AnswerRocket、Arria NLG、Automated Insights、Marlabs、Narrative Science、Salesforce (BeyondCore) 、ThoughtSpot、Yseop 聊天机器人 分析师:Magnus Revang、Anthony Mullen、Brian Manusama 定义:聊天机器人是一种独立的会话界面,可 使用应用、消息传递平台、社交网络或聊天解 决方案进行对话。聊天机器人的复杂程度各 不相同,从基于决策树的简单营销噱头到基 于功能丰富的平台构建的实现。它们的范围总 是很有限。聊天机器人可以基于文本或基于语 音,也可以基于这两者。 定位和市场采用速度:在过去几年里,聊天机 器人的宣传确实在加剧。但是,仍然只有 4% 的企业部署了会话界面,其中包括聊天机器 人。不过,根据 Gartner 2018 年度 CIO 调查显 示,38% 的企业正在计划或积极尝试此部署。 这将使聊天机器人在接下来几年中获得巨大 增长,但是一旦它到达技术成熟度曲线的顶 峰,就会产生巨大的反弹。 作为企业软件前端的社交媒体、服务台、人力 资源或商业聊天机器人,以及用于自助服务的 聊天机器人都在快速增长。但是,尽管如此, 绝大多数聊天机器人都很简单,依赖于决策 树中的脚本响应和相对较少的意图。与聊天 机器人相关的是虚拟代理,其范围更广、复杂 程度更高,并且需要更多基础设施和人员来 维护,其目的在于与用户建立更长久的关系, 而不仅限于单次交互。用户将与数百个聊天 机器人交互,但很少与虚拟代理交互。 成功安装聊天机器人的企业已经在考虑管理 不同供应商的聊天机器人执行不同使用案例 的挑战。随着该领域变得成熟,更多企业可能 会寻求平台产品和中间件产品。该领域目前已 经过度饱和,充斥着各种公司和产品,其中绝 大多数都无法跟上创新步伐,因为诸如事实 提取和流程映射等决策树替代方案变得更加 普遍,语音和多模式也变得更加可行。通过留 意大型软件公司在该领域的投资、关注和研 究,我们正在寻求快速发展,力求在大约四年 内实现生产力的提高。 用户建议: • 聊天机器人的概念证明阶段已经拉开序 幕,现在仍是绝佳入场机会,但大门可能会 在 2018 年底关闭。随着技术的发展,这些 实验项目的经验将非常宝贵。 • 将供应商视为战术而非战略,认识到您很 可能会希望在两到三年后更换供应商。 51
52. • 专注于提供可支持多个聊天机器人的平台 的供应商 业务影响:聊天机器人是人工智能的代表, 它将影响当今人与人之间通信的所有领域。 客户服务是一个已经受到聊天机器人影响的 巨大领域。实际上,它将显著影响企业应用 的服务代理数量以及客户服务本身的执行方 式。聊天机器人作为应用界面,从“用户必须 学习界面”到“聊天机器人正在学习了解用户 诉求”的转变对于工作场所中的载入、训练、 生产力和效率具有重要意义。总而言之,聊天 机器人将对我们与技术的交互方式产生变革 性影响。 好处评级:具有变革性 市场渗透率:5% 至 20% 的目标受众 成熟度:未成熟 供应商举例:Amazon、Facebook、 谷歌、Gupshup、iFLYTEK、IBM、微 软、OneReach、Oracle、Rulai 处于顶峰期 人工智能 PaaS 分析师:Jim Hare、Bern Elliot 定义:云人工智能和机器学习平台服务统称 为人工智能平台即服务 (PaaS)。它们提供人工 智能模型构建工具、API 和相关中间件,可支 持构建/训练、部署和使用作为云服务在预构 建基础设施上运行的机器学习模型。这些模 型包括任何类型的视觉、语音和一般数据分 类和预测模型。 定位和市场采用速度:人工智能 PaaS 正在加 速发展,包括 Amazon Web Services (AWS)、 谷歌、IBM 和微软等领先的云服务提供商都 在努力成为首选平台。在过去的几年中,利用 云服务的人工智能应用持续受到市场欢迎, 得到了数据科学家和开发人员的青睐。人工 智能 PaaS 产品主要关注机器学习、自然语 言处理和计算机视觉这三个关键领域。人工 智能云方法开始扰乱更为成熟的本地数据 科学和机器学习平台市场,尤其是在组织试 验和构建人工智能原型时。可利用具有人工 智能优化芯片和大量数据存储的专用硬件实 例使得云成为组织构建和部署人工智能应用 的理想环境,而不会带来传统本地采购的风 险、成本和延迟。云服务提供商还提供打包 的 API 和工具,使开发人员可以更轻松地将人 工智能功能集成到现有应用中。使用云服务 可确保更快、更轻松地构建和部署人工智能 解决方案,这将使人工智能 PaaS 达到过高 期望的峰值。由于组织体验并了解了人工智 能 PaaS 产品的局限性,这将会导致一定程度 的泡沫化。 用户建议:负责采用人工智能技术的应用的 企业架构和技术创新领导者应当采取以下步 骤: • 考虑人工智能 PaaS 而非本地选项,可减 少封装的开销,并简化部署和弹性可扩展 性。 • 通过尝试不同的人工智能技术和 PaaS 提 供商,使用完全相同的数据集,然后选择 最符合您要求的技术和提供商,可以提高 人工智能战略的成功机会。 • 通过选择能够平衡数据科学、开发人员和 基础设施专业知识的人工智能云服务,提 高组织的人工智能项目成功率。 业务影响:人工智能 PaaS 产品专注于机器学 习、自然语言处理和计算机视觉这三个关键的 人工智能组合服务: • 机器学习:人工智能云服务提供商提供的 打包 ML 服务统一了端到端的 ML 工作流 程。它们通过提供对项目所有阶段的集成 访问来扩展隔离 ML 引擎的功能,这些阶 段包括从数据准备到托管训练中以及可 通过 API 访问的执行环境中的部署。对于 几乎没有数据科学专业知识的技术专业团 队,诸如自动算法选择和训练集创建等功 能将一定程度降低项目的复杂性,并利用 现有的运营云服务的专业知识。 • 自然语言处理:组织可以使用预训练的 NLP 系统为各种使用案例创建基于云的 聊天机器人。主要的人工智能 PaaS 供应 商会提供语言处理目录作为其会话平台的 一部分,可用于通过自然语言界面交付应 用。 • 计算机视觉:这使组织能够应用面部检 测、识别和分析来解锁新的基于图像的数 据源。预训练系统不需要数据科学专业知 识,并允许开发人员通过调用 API 获得独 特的全新洞察。 52
53. 53 上述云服务的组合将在短期内加速实现数字 业务技术平台的可行性。 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:未成熟 供应商举例:Amazon Web Services、谷歌 (Cloud AI)、IBM (IBM Cloud)、微软 (Azure AI Platform) 深度神经网络 ASIC 分析师:Chirag Dekate、Martin Reynolds、Alan Priestley 定义:深度神经网络 (DNN) 专用集成电路 (ASIC) 是一种具有特定目的的处理器,可加速 DNN 计算。 定位和市场采用速度:深度神经网络 (DNN) 是统计模型,用于检测和分类输入数据( 如声音和图像)或文本模式(如句子)中 的模式。DNN 系统有两个阶段。在训练阶 段,DNN 会遍历大型数据集并将其提取到一 个小的 DNN 参数集。在推断阶段,DNN 使 用此参数集对输入(如图像、语音或文本)进 行分类。目前,绝大多数训练和推断任务都 使用 GPU。在加速神经网络时,DNN ASIC 可 以提供比 CPU 或 GPU 更高的性能和更低的 功耗。 谷歌已大规模部署 DNN ASIC(也称为张量处 理单元 [TPU、TPU2、TPU3]),为其业务提供 语音和图像识别方面的推断。TPU2 和 TPU3 也加速了训练过程,这项任务以前委托给了 GPU。除了通过基于云的服务之外,谷歌不会 提供 TPU2。其他云供应商也纷纷效仿。 其他专用芯片即将问世。Graphcore 开发了 一种定制处理器,可为基于 DNN 的应用提供 极高性能,并计划在 2018 年推出新一代“巨 人”(Colossus) 处理器。他们的营销材料中表 明,与 GPU 相比,该处理器的性能提升了近 一个数量级,尽管性能改进比演示更快。英特 尔还在开发名为“Lake Crest”的 ASIC 代码, 该代码基于其在 2016 年从 Nervana Systems 获得的技术,针对 DNN 进行了优化。 用户建议:DNN ASIC 在性能和能耗方面的优 势非常明显。但是,DNN ASIC 的广泛使用将 需要神经网络架构的标准化和跨多种 DNN 框架的支持。通过选择可提供或支持最广泛 的 DNN 框架集以更快创造商业价值的 DNN ASIC,规划包含 DNN ASIC 的有效长期 DNN 策略。将基于 GPU 的解决方案与 ASIC 解决 方案的投资回报进行比较,并规划在使用专 用神经网络处理器实现更好的业务发展时停 用 GPU 解决方案。 业务影响:通过硬件加速,基于神经网络的系 统将能够通过更高的性价比来抓住更多业务 机会。可从 DNN 中受益的使用案例包括语音 转文本、图像识别和自然语言处理。 部署深度神经网络应用的 IT 领导者应当在规 划产品组合中纳入 DNN ASIC。我们预计这一 市场将很快成熟,可能在新系统的三年折旧 期内。 好处评级:高 市场渗透率:少于 1% 的目标受众 成熟度:未成熟 供应商举例:谷歌、Graphcore、英特尔 智能机器人 分析师:Annette Jump、Kanae Maita 定义:智能机器人是一种可在物理世界中自主 工作的机电形式因素,可在短期间隔中学习, 接受人类监督、训练和示范,在人类的管理下 工作。它们能够感知环境条件、识别和解决问 题。有的智能机器人可以使用语音语言与人类 互动,而有些则具有专门的功能形式,如仓库 机器人。有的智能机器人采用通用形式和/或 人形外观。由于具有发达的感官能力,智能机 器人可以与人类一起工作。 定位和市场采用速度:迄今为止,与工业机 器人(执行预定义、固定任务)相比,智能机器 人采用率明显较低,但它们在市场中获得了 极大的宣传,这也是为什么将智能机器人定 义为在达到过高期望的峰值。在过去 12 个月 里,我们看到一些成熟的机器人供应商正在 扩大他们的产品线,也看到一些新公司(尤其 是来自中国)进入市场。因此,这个市场变得 更加活跃,向新技术提供商和技术敞开了大 门,进入的壁垒略有下降。 随着供应商执行扩展产品计划,并在更广泛 的行业特定使用案例和企业规模范围内提供 解决方案,在未来几年内,围绕智能机器人的 大肆宣传和期望也将继续。由于过去数年中 几家主要供应商的行动,很快为智能机器人 打造了宣传效应: 53
54. • Amazon Robotics(以前也称为 Kiva Systems)在亚马逊仓库中部署了机器人。 • 谷歌收购了多家机器人技术公司。 • Rethink Robotics 推出了可与员工一起工作 的 Baxter 和 Sawyer。 • SoftBank Robotics 推出了 Pepper 人形机 器人,并创建了商业版 Pepper 机器人。 • 2018 年初,LG 推出了 CLOi,这是一系列用 于酒店、机场和超市的商业用途机器人。 此外,美国的多家酒店和新加坡的两家香 格里拉酒店现在都使用机器人来提供客房 服务。 用户建议:轻工业制造、分销、零售、酒店和 医疗保健机构的用户应当将智能机器人视为 其人力资源的替代和补充。启动旨在评估产 品能力和量化收益的试点项目。检查可部署 给智能机器人的当前业务和材料处理流程; 此外,考虑重新设计流程,以利用具有三到五 年路线图的智能机器人的优势进行大规模部 署。也可以在流程结束时对智能机器人进行 质量控制 (QC) 检查,拒绝存在故障的产品并 收集数据进行分析。 业务影响:智能机器人将在以资产为中心、以 产品为中心和以服务为中心的各个行业中发 挥其初始业务影响力。在这些行业中,它们能 够进行实际工作,具有更高可靠性、更低成 本、更高安全性和更高生产力。组织在更多 增值活动中协助、替换或重新部署其人员的 能力可以创造较大商业利益,有时甚至是转 型带来的商业利益。典型和潜在的使用案例 包括: • 医疗材料处理 • 有害废弃物处置 • 处方填写和交付 • 病患护理 • 直接材料处理 • 库存补货 • 产品装配 • 成品运输 • 产品选择和包装 • 电子商务订单履行 • 包裹快递 • 购物协助 • 客户服务 • 礼宾接待 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例:Aethon、Amazon Robotic s、ARxIUM、Google、iRobot、Panasoni c、Rethink Robotics、Savioke、SoftBank Robotics、Symbotic 会话用户界面 分析师:Magnus Revang、Van L. Baker 定义:会话U(I CUI)是一种高级设计模型,其 中用户和机器的互动主要通过用户的口头或 书面自然语言进行。这些互动通常是非正式 和双向互动,范围从简单话语到高复杂度互 动,随之而来的结果也很复杂。作为设计模 型,CUI 依赖于通过应用、相关服务或在会话 平台上实现。 定位和市场采用速度:在过去几年中,人们对 CUI 的关注呈爆炸式增长,聊天机器人、消息 传递平台和虚拟助手(尤其是诸如 Amazon Echo 和 Google Home 等家居智能音箱), 都在加剧宣传效应。根据 Gartner 2018 年度 CIO 调查显示,目前只有 4% 的企业在生产过 程中引入会话界面解决方案,而另外有 38% 的企业正在进行试验或规划。从规划和试验 阶段进入生产阶段的企业将大大推动预期的 增长。 CUI 的未来前景使得用户和界面之间的责任 发生巨大转变,从用户必须学习软件转变为 界面学习了解用户诉求。这一未来前景可保 证变革性影响,虽然目前的 CUI 远未实现该 前景。 自 2017 年以来,用于实现 CUI 的可用会话平 台数量呈爆炸式增长。这些工具使开发人员 更容易构建 CUI。因此,我们也已看到各种流 行应用中实现了 CU(I 作为 GUI 的替代),甚 至还在应用套件中实现了 CUI。我们希望应用 套件供应商能够先于其业务应用将 CUI 推向 市场,从而快速在多个消息传递平台上使数百 个不同聊天界面可供大型企业的员工使用。 这种使用聊天机器人模式充当会话界面向导 或礼宾接待员的新做法将在明年大受欢迎。 54
55. 55 大多数 CUI 实施仍然比较原始,因此无法响 应复杂的查询。最初,能力提升主要来自于自 然语言理解 (NLU) 和语音识别的改进,这将 使 CUI 离未来前景和宣传效果更进一步。围 绕上下文处理、用户识别和意图处理的其他 功能可能会在明年内实现,但仍然不足以避 免在两到三年内出现泡沫化阶段。只有到该 阶段,我们才能将在交互式对话中创建流程 和个性的设计方法标准化。 用户建议:CUI 将学习责任从用户转移到软 件,因此软件需要了解用户的诉求。对使用案 例的训练、载入和扩展而言影响是深远的。因 此,在接下来十年中,对读写能力相关的训练 和工具的需求将大大减少。针对 CUI 的规划 将成为主导模型。 但是,应当谨慎地实施 CUI。会话式界面可以 使机器更智能,并提高人们处理新情况的能 力(人员和机器协作将比单独工作更好),但 它们也会带来额外的负担。有些重复性技能 已经很成熟,可以轻而易举地执行,对于这些 技能来说,注入会话会降低性能,除非技术 能够识别重复模式,并使用单个用户生成的 命令调用例程过程的众多步骤。 避免将 CUI 前端改造到现有应用,除非能够 提高可用性和用户喜爱度。 准备好充当企业中的新角色。据 Gartner 发 现,市场中支持创建会话式体验的职位包括: 对话设计师、人工智能训练师、数字教练、人 声效果和人工智能交互设计师。 业务影响:CUI 是许多聊天机器人和虚拟助手 的交互模式,两者都对 CUI 影响力有着重大 贡献,尤其是在客户服务的高接触类通信领 域和数量巨大的问答型交互中。 除此之外,CUI 主要出现在新应用中。企业 IT 领导者应当关注(并偏向于)CUI,以提高员工 (和客户)的效率、削减运营费用及用于学习 神秘计算机语义的时间。 此外,还应进行一些改造。在接下来的五年 中,我们不希望大型企业投入大量资金来改 造现有记录系统,因为员工群体对于这些系 统有着丰富且稳定的经验,并且其功能集也众 所周知。但是,如果员工流动率高或功能集快 速变化,或者企业面临提供计算机读写能力 训练的持续负担,那么 IT 领导者就需要考虑 创建以人为本的前端,以便员工更容易适应和 游刃有余。 好处评级:具有变革性 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例:亚马逊、百度、Facebook、谷 歌、IBM、IPsoft、微软、Oracle、Salesforce、 SAP 智能应用 分析师:Jim Hare、Helen Poitevin 定义:智能应用是具有嵌入式或集成式人工 智能技术的企业应用,通过智能自动化和改 进的决策制定来支持或取代基于人工的手动 活动。 定位和市场采用速度:人工智能已成为下一 个主要战场。在未来几年内,每个应用和服 务都将在一定程度上引入人工智能。企业 应用供应商开始将人工智能技术嵌入其产 品中,并引入人工智能平台功能,从 ERP 到 CRM、HCM,再到劳动力生产力应用。人工智 能拥有变革组织的潜力,是数字业务的核心。 面向客户和后台的企业应用是转型工作的重 要组成部分,因为它们提供了大多数任务所 依赖的数字基础。人工智能将在许多常见应 用类别的背景下低调运行,同时产生全新的 应用类别。 大型供应商之间的人工智能“抢地”都是“豪 赌”,而想要获得优势的初创公司也想入场。 他们的目标都是通过智能自动化支持或取代 人工活动。例如,主要的企业软件供应商都 很重视销售、服务、营销、人力资源和 ERP,这 些领域都是特别有价值的应用人工智能技术 的领域。 智能应用将通过以下方式使用人工智能: 55
56. • 分析:人工智能可用于创建更具预测性和 规范性的分析,然后可以将其呈现给用户 以进行进一步评估,或插入到流程中以 推动自主行动。人工智能也可用于增强分 析。 • 流程:人工智能可以通过应用发展更智能 的操作。例如,您可以使用人工智能进行 智能发票核对或电子邮件文档分析,以改 善服务流程。将来,这些功能可以进一步 扩展,以识别工作模式,从中构建和执行流 程模型。 • 用户体验:用于创建 VPA 的自然语言处理 是人工智能对用户体验的一种应用。更多 示例包括面部识别和用于了解用户情绪、 背景或意图以及预测用户需求的其他人工 智能应用。 用户建议:企业应用领导者应当: • 通过添加更多智能自动化、动态工作流程 和指导决策,探索人工智能改变组织流程 和运营的方式。 • 向您的打包软件提供商提出问题,概述他 们将如何使用人工智能在新版本中增加高 级分析、智能流程和高级用户体验方面的 业务价值。 • 通过部署机器人过程自动化 (RPA),使员工 适应自动化和“机器人”的理念。 • 在未来两年内,在那些拥有重大机遇的领 域中试行计划,在这些领域,可以快速有 效地挖掘数据以发现潜在洞察,借此可以 加深对人工智能的理解和专业知识。在早 期成功经验的基础上,应用从任何失败中 汲取的教训。 • 随着越来越多的初创公司,甚至那些陈旧 的解决方案,都宣称人工智能为其解决方 案的一部分,请注意“人工智能粉饰”。询 问他们如何使用人工智能来提供高级分 析、智能流程和新用户体验。 • 优先投资作为单点解决方案提供的高度专 业化和特定领域的智能应用,可以帮助解 决专业领域的问题,如客户服务、人才招 募、协作、参与等。 业务影响:利用人工智能的智能企业应用可 以提供以下好处: • 通过运用自动化,如通过机器人、传感器 和机器学习,让工作人员专注于更多增值 活动,重塑任务的执行方式。 • 通过企业应用中提供的打包人工智能技 术,全面提升业务效率。 • 使组织能够从其资产中获得更好的绩效结 果。 例如,在人力资本管理 (HCM) 领域,HCM 应 用中越来越多地采用人工智能以匹配人才供 应和需求、预测招聘成功率或优化招聘营销。 预测因素包括特定候选人对工作的匹配度, 候选人探索新工作机会的可能性,以及通过 分析语音或视频访谈的行为概况。面向候选 人的聊天机器人在进一步实现该过程的自动 化方面变得越来越普遍,例如推荐申请的工 作和解答相关问题,或筛选初始候选人。 好处评级:具有变革性 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例:Google Docs、Microsoft Office 365、Oracle Applications、Salesforce Einstein、SAP Leonardo、ServiceNow、Workday 数字化伦理 分析师:Jim Hare、Frank Buytendijk、Lydia Clougherty Jones 定义:数字化伦理包括用于进行电子交互的 价值和道德原则体系,以及人员、企业、政府 和事物之间数据的使用和共享。数字化伦理 的范围很广,包括安全性、网络犯罪、隐私、 社交互动、治理、自由意志以及整个社会和 经济。 定位和市场采用速度:由于最近公布的负面报 道、公众讨论日益增多以及新的监管合规性( 包括数据隐私考虑因素)、数字化伦理的热度 节节攀升,即将到达过高期望的峰值。当前的 主题,如“人工智能”、“假新闻”和“数字社 会”,都是推动数字化伦理需求增加的动力。 诸如物联网、3D 打印、云、移动、社交和人工 智能等创新技术领域的发展速度,超过了企 业、政府和社会可以将其系统化进而加以理 解的速度。随着技术的运用导致道德和行为 之间产生一定的距离,意外后果发生的可能性 很高。对于商业和商业中使用的技术而言,道 德上不可知的立场是一个根本无法也不应维 持的立场。数字化伦理需要社会、经济、政治 和策略讨论、新型治理,以及新流程和技术来 控制新技术。 56
57. 57 用户建议:在处理不充分的数据方面,隐私规 则和数据保护提供了法定的最低要求。相反, 采取“关怀伦理学”的方法来应对商业世界 中的数字技术,在原则和后果之间加以协调。 关怀伦理的核心问题是,“即使他们是无意 的,我们如何对我们行为的后果承担责任?” (参见维基百科上的“关怀伦理学”)。在数 字世界中,关怀伦理学的概念不仅涉及人员, 还涉及企业甚至技术的行为方式。关怀伦理 学所教导的伦理是在面对您认为不合适的情 况时承担责任。呼吁针对以下行为应用“关 怀”伦理学: • 换位思考 — 站在他人的立场思考问题;培 养是非观念,而不只是害怕受到惩罚,或 是希望合法或保证客户忠诚度以进行产品 销售。 • 承担责任 — 承担责任对于在生态系统中 起带头作用,并成为客户或公民的接口至 关重要。在新兴的数字环境中,即使在法 律上不要求,也要对使用数字技术负责, 建立并提高信任度。 • 展示能力 — 培养能力和专业知识,以便能 够快速、充分地解决问题。不要只是承认 需要关注和承担责任,还需要能够完成。 • 促进信任 — 需要信任才能使其他三个行 动呼吁发挥作用。承担责任是件好事,但 如果您的利益相关者不相信您能做到,您 的产品将不被接受。 业务影响:按“道德发展”顺序列出的四个业 务影响领域是: • 服从合规性 — 保持在法律允许范围内。 • 降低风险 — 注意不要以可能扰乱利益相 关者的方式使用技术,或以其他方式造成 声誉或财务风险。 • 发挥作用 — 将技术的道德使用作为一种 让您在市场中脱颖而出的主张。例如,可以 用于良好举措或社会目的的数据。 • 遵循您的价值观 — 技术的使用与为客户、 其他利益相关者和您自己提供价值之间息 息相关。 主动加入到在线数据伦理的行业中来,以实 现 DataEthics 和 DataKind 等良好举措。 好处评级:高 市场渗透率:5% 至 20% 的目标受众 成熟度:未成熟 图形分析 分析师:Mark A. Beyer、Rita L. Sallam、Alexander Linden 定义:图形分析是一套分析技术,可用于探索 所关注实体之间的关系,如组织、人员和交易 等。图形分析通常通过针对商业用户消费的 可视化图形来描绘。图形分析由若干模型组 成,这些模型可确定数据点之间的“连通性” ,创建数据节点/集群及其分界点。节点进行显 式或隐式连接,并指示影响程度、互动频率 或概率。 定位和市场采用速度:图形分析正稳步攀升 至过高期望的峰值,这主要是由于缺乏广泛 意识。图形分析的采用率越来越高,在很大程 度上是因为需要在成倍增长的异构数据中发 现相关洞察,并且需要对其进行分析。一旦开 发和训练出高度复杂的模型,输出存储便会 更轻松,因为功能得以扩展,图形数据库的计 算能力及采用率增加,这为图形存储、操作和 分析提供了理想的框架。 分析专家开始宣称图形分析的专业性,而某 些传统分析供应商提供的功能可让用户构建 交互式网络图形,作为其产品的额外特性。 重要的是,运用图形分析对于开发知识图谱 是必要的,知识图谱是一种非常有用的图形 分析输出。图形分析的商业化进程目前仍处 于相当早期的阶段,新兴参与者数量还较少。 然而,在许多图形数据库中存储和处理数据 的独特方式,以及对图形特定知识相关的 新技能的需求,可能对采用率的增长造成阻 碍。例如,在资源描述框架 (RDF)、SPARQL 协 议和 RDF 查询语言 (SPARQL) 以及 Apache TinkerPop 或近期的开源 Cypher 等新兴语言 方面的知识和经验。 57
58. 用户建议:数据和分析领导者应当评估各种 机会,借机将图形分析融入其分析产品组合及 策略中。以此来处理不太适合传统 SQL 查询 和可视化的高价值使用案例(例如计算和可 视化最短路径,或网络中两个节点或所关注 实体之间的关系及影响力)。此外,他们还应 考虑使用图形分析来增强模式分析。 用户可以直接与图形元素交互以获得洞察, 并且还可以存储分析结果和输出,以在图形 数据库中重复使用。 图形分析可构成理想分析和展示框架的商业 场景包括: • 路径优化 • 市场篮子分析 • 欺诈检测 • 社交网络分析 • CRM 优化 • 智能定位 • 供应链监控 • 负载平衡 • 特殊形式的劳动力分析,比如企业社交图 和数字化工作场所图 • RFM 分析(近期时常包含对象、资产和条 件的相关网络的金钱价值) 此外还包括更专门化的应用,例如: • 执法调查 • 流行病学 • 基因组研究 • 反洗钱检测 业务影响:图形分析在评估和应对风险方面 非常有效,可帮助分析欺诈、路径优化、集 群、离群值检测、马尔可夫链、离散事件模拟 等。用于揭露欺诈和腐败的相同引擎也可用 于识别组织中的风险,并主动解答责任问题。 最近一个识别关系网络的例子是揭示巴拿马 文件的国际调查记者联盟 (ICIJ) 研究。关系分 析通常适合用于处理表格里各行各列中的结 构化静态数据。相反,图形分析是一种新型“ 透镜”,适合用于探索跨多元结构数据的实体 之间的间接流动关系。该方法可提供使用基 于 SQL 的关系分析难以获得的洞察。 图形分析处理是一项核心技术,堪称许多 其他先进技术的基础,例如虚拟个人助理、 智能顾问以及其他智能机器。Cambridge Semantics、Digital Reasoning、Ayasdi 和 Maana 等平台也使用图形分析来确定重要 发现。 图形分析可提升数据挖掘功能在现代商业智 能和分析平台中的潜在价值。完成图形处理 后,即可使用尺寸、颜色、形状和方向以可视 化方式展示关系和节点属性。 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例:Ayasdi、Cambridge Semantics、Centrifuge Systems、Databricks、Digital Reasoning、Emcien、Intel Saffron、Maana、P alantir、SynerScope 规范性分析 分析师:Peter Krensky、Carlie J. Idoine 定义:“规范性分析”这一术语系指一系列指 定首选行动方针来实现预定义目标的分析功 能。最常见的规范性分析示例包括诸如线性 规划的优化方法、预测性分析和规则组合、启 发法以及影响图等决策分析方法。规范性分 析与描述性分析、诊断性分析和预测性分析 的不同之处在于,输出是推荐操作,有时是自 动化操作。 定位和市场采用速度:尽管优化和决策分析 的概念已经存在数十年,但是它们现在又重 新出现了,并且在数据科学、更佳的算法、具 有成本效益的云计算能力和可用数据方面获 得了更广泛的认知和体验。此外,对提供可行 的前瞻性洞察(而非较为传统的被动报告)的 业务优先化的重视进一步推动了这一复苏趋 势。规范性分析通过建议实现明确目标的行 动方针,为用户制定决策提供助力。一些使用 案例已经非常成熟。其中包括供应链和物流 优化,或将预测值与业务规则相结合用于制 定信贷决策,以及数据库营销和客户流失管 理。但是还有许多新的使用案例不断涌现出 来。因此,该技术获得广泛认可和采用还为时 尚早,不过目前已经有越来越多的组织表现出 对规范性技术的兴趣。 58
59. 59 规范性分析通常会利用和扩展预测方法,因 此在已经构建预测功能的公司,其往往会得 到更广泛的采用。虽然规范性分析是一项必 要的能力,但是它并不会自动产生更佳的决 策。随着在分析解决方案、数据质量和技能 方面的改进,以及预测性分析的更广泛采用, 规范性分析将不断发展进步,在未来 5 到 10 年内达到实质生产的高峰期。 用户建议:数据和分析领导者应该: • 从业务问题或决策开始,需要进行复杂的 权衡,多重考虑和多重目标。 • 寻求提供特定垂直或功能性解决方案的 打包应用,以及具有所需技能的服务提供 商。 • 了解可用的规范性分析方法和决策模型的 广度,以及哪一项最契合特定业务问题和 技能的性质。 • 获得从高级主管到执行建议措施的一线工 作人员等利益相关者的认同,即愿意信赖 分析建议。 • 确保组织结构与治理使公司能够实施和 维护职能性以及跨职能规范性分析建议。 业务影响:规范性分析可应用于战略、战术和 运营决策,以降低风险和成本,最大程度地 提高利润,或更高效地分配稀缺或竞争性资 源。重要的是,规范性分析可部署用于改进绩 效,因为其可推荐能够以最佳方式管理冲突 限制和目标之间的权衡问题的行动方针。重 大的商业利益已屡见不鲜,这些利益通常通 过改进决策质量、降低成本或风险以及提高 效率或利润来实现。 常见的使用案例包括客户处理、贷款审批、索 赔分类,以及各种优化问题,如供应链或网络 优化及调度。此外,规范性分析还可作为规划 流程的业务差异指标,无论是财务或生产或 分销规划,让用户可以探索多个场景并对推荐 的行动方针进行比较。 尽管规范性分析在传统上已归类到战略和战 术时间范围,但是还有更高级的功能可支持 实时或近实时决策。这有助于实现某些运营 决策的自动化。 好处评级:高 市场渗透率:5% 至 20% 的目标受众 成熟度:新兴 供应商举例:AIMMS、Decision Lens、FICO、Gurobi Optimization、IBM、River Logic、SAS、Sparkling Logic、Veriluma 深度神经网络(深度学习) 分析师:Alexander Linden、Chirag Dekate 定义:深度神经网络 (DNN) 是大规模神经网 络,通常具有许多处理层。通过它们,计算机 可以处理比以前更复杂的数据,例如视频、图 像、语音和文本数据,从而支持人工智能 (AI) 的最新进展。 定位和市场采用速度:互联网巨头对其整个 业务部署基于 DNN 的系统。完善的 DNN 系 统包括亚马逊 Alexa 的语音转文本功能、谷 歌的搜索功能、图像识别和无人驾驶汽车,以 及 Facebook 的脸部标签技术。 然而,DNN 很难构建和训练。要获得始终如 一的良好结果,您需要大量的标签数据、数 据科学专业知识和专用硬件。大多数企业都 难以获得足够的标签数据以支持其 DNN 计 划。而且,由于 IT 和互联网巨头的积极招 募,数据科学专家也十分稀缺。此外,优化的 DNN 计算资源需要大量的资本支出。 使用最广泛的 DNN 是卷积神经网络 (CNN) 和递归神经网络 (RNN)。例如,CNN 被用于图 像分类和语音转文字。RNN 尤其适用于从语 音片段中提取含义。此外,超大规模数据中心 正在开发生成式对抗网络 (GAN),这种技术 在游戏场景中最有用,但毫无疑问,也将应用 于商业应用服务。 DNN 的成熟度水平与去年相比并无明显差 别。 用户建议:现代化计划的数据和分析领导者 应当: • 探索 DNN:这些技术可以帮助他们解决以 前难以处理的分类问题,尤其是与图像、 视频和语音有关的问题。 • 从云提供商的工具开始:尽可能先使用专 业云提供商提供的工具。他们在图像、语 音和面部分类系统以及培训和数据方面投 入了大量资源。其系统性能几乎超过您自 身建立和部署的所有系统。 59
60. • 培养和掌握技能:通过培训提升机器学习 专家的技能。加入学术团队。使用众包提 供商,如 Algorithmia、Experfy、Kaggle 和 TunedIT。虽然目前还难以与大型云计算公 司抗衡,但是有一大批拥有该领域成熟技 能的毕业生,因此吸纳人才将更加容易。 • 专注于将深度学习数据作为长期投 资:DNN 属于您的能力范畴,正确数据的 价值将随着时间增加。不要认为 DNN 会 通过无监督学习从任何类型的数据中获得 洞察。目前为止,大部分结果都是使用监 督学习来实现。 业务影响:DNN 为各行各业带来了具有变革 性和颠覆性的潜能。对于想要发挥这种潜能 的人,其面临的挑战是确定要解决的业务问 题,确保拥有足够的专家并能够使用高质量 的数据集。DNN 在检测欺诈、确定质量、预 测需求和涉及序列的其他分类问题方面(例 如,使用视频、音频或时间序列分析),表现 出了超越过去最先进算法的极高准确性。 DNN 的潜能依据便是其能够为高维复杂数据 生成粒度表示。例如,DNN 在解读医学影像 时可提供满意的结果,以便及早诊断出癌症; 帮助改善视障人士的视力;实现无人驾驶车 辆;为黑白照片着色;给照片添加缺失的元 素;识别并理解语音(这可及时让大多数设 备成为会话设备)。 很可能会在个人协助和监督等领域催生出全 新的产品类别。 好处评级:具有变革性 市场渗透率:5% 至 20% 的目标受众 成熟度:未成熟 供应商举例:亚马逊、百度、deepsense.ai、谷 歌、H2O.ai、英特尔、微软、NVIDIA、Skymind VPA 无线扬声器 分析师:Fernando Elizalde;Werner Goertz;Annette Jump 定义:Gartner 将支持 VPA 的无线扬声器 定义为支持云的远场语音捕获设备,将用 户连接到虚拟个人助理 (VPA) 服务,例如 Alexa、Google Assistant、Siri、Cortana 和微 信等。随着 2017 年触摸屏 VPA 扬声器的出 现,多模交互被引入 VPA 体验。我们的定义 是指独立产品,不包括 VPA 在照明设备、家 用电器或汽车等产品中的实施。 定位和市场采用速度:尽管 VPA 提供的会话 体验远称不上完美,但消费者对 VPA 扬声 器的采用率高于预期,这证明今年技术成熟 度曲线顶峰位置的上升是有道理的。微软的 Cortana 现已在 Harman Kardon 的设备中启 用,苹果也紧跟先驱亚马逊 Echo 和 Google Home 其后,开始发售其 HomePod 产品。 最初作为消费者和互联家庭产品销售,作为 一般信息来源,它管理互联家庭设备并播放 数字娱乐内容,现已开发出应用于酒店服务 等商业环境的新使用案例。VPA 发展为领域 专家(如数字医生、律师和保险代理人),将 开启其他使用案例和数字商业模式。2017 年 底,Alexa for Business 宣布推出进入托管企 业环境的 VPA 扬声器。 用户建议:技术服务提供商应当通过对其设 备和服务启用语音功能,充分利用 VPA 扬声 器的当前宣传,并加入一个或多个生态系统。 新的经常性收入流(例如,来自许可数字内容 或技能内购买的收入流)可以货币化,并且可 以利用消费者关系和亲和力。开发全新的 24 小时交互式用户体验,搭载免提、远场语音 和视频的设备进一步增加(且呈现全球性扩 展)。认识此类设备的共性及环境性,并提供 区别个人用户、尊重隐私和机密的使用价值, 特别注意企业环境中的机密。通过增加摄像 机和显示器提升可视化功能,从而改善家庭 购物等相关使用案例方面的消费者体验。继 续改善除早期采用者以外的用户体验,例如 语言支持和口音识别、相关性、设置、故障排 除和隐私问题解决。在过去的一年中,出现 了许多利用情绪侦测和情感分析的技能和使 用案例。可通过理解客户的情绪状态来促进 营销。 业务影响:VPA 扬声器及围绕其构建的生态 系统具有真正的变革性业务影响。VPA 扬声 器可能通过云集成互联家庭解决方案,成为 家中所有智能设备的控制中心。VPA 扬声器将 对电子商务体验,特别是重复购买体验产生 影响。将购物请求图像投射到连接的屏幕上 或者将屏幕添加到设备本身,有助于改善购物 体验并减少交易摩擦。这些设备内置扬声器 的质量以及通过在线服务和蓝牙播放器播放 音乐的功能轻松胜过无线音乐系统。 60
61. 61 VPA 扬声器的出现影响并加快了企业部门的 数字化商机,例如: • 客户门户和交互式语音响应 (IVR) 系统替 代品 • 家庭医疗保健,尤其是老年人护理 • 多因素身份验证 (MFA),用于构建访问权 限、资产管理和国土安全应用 好处评级:具有变革性 市场渗透率:1% 至 5% 的目标受众 成熟度:未成熟 供应商举例:Ainemo;亚马逊;苹 果;Centralite Systems;谷歌;联想;LG;索尼 机器学习 分析师:Shubhangi Vashisth、Alexander Linden、Carlie J. Idoine 定义:机器学习是一门技术学科,旨在利用可 以从数据中提取知识和模式的数学模型来 解决业务问题。该门学科主要有三个分支学 科,与提供的观察结果类型息息相关:监督 学习,其中观察结果包含输入/输出对(也称 为“标签数据”);无监督学习(其中忽略了 标签);以及强化学习(其中会对情况的好坏 加以评估)。 定位和市场采用速度:鉴于其对业务的广泛影 响,机器学习仍是最炙手可热的技术概念之 一。随着数据量不断增加,传统工程方法难以 处理的复杂问题越来越多,机器学习在这些 因素的推动下获得持续的大规模增长和广泛 采用。越来越多的组织正在探索机器学习的 使用案例,许多已经处于试验/POC 的初始阶 段。技术提供商正在为其软件添加嵌入式机 器学习功能。尽管人们对这项技术的兴趣日益 浓厚,但大多数组织仍在尝试其自身的机器 学习方法。对这些组织来说,找到实施机器学 习项目所需的相关角色和技能是一项挑战。 随着数据量和数据源的增加,系统的复杂性 也将增加。在这种情况下,传统的软件工程方 法会产生较差的结果。未来,如果没有机器学 习,许多行业将无法取得进展。 用户建议:对于数据和分析领导者: • 首先解决大家对预期成果达成共识的简 单业务问题,然后逐渐转向复杂的业务场 景。 • 如果您找到符合使用案例需求的应用,请 使用打包的应用。这些应用往往会提供极 佳的成本-时间-风险权衡方案,并显著降低 技能障碍。 • 培养所需的机器学习人才,并与高等院校 及思想领导者合作,紧跟数据科学快速发 展的步伐。创造有助于继续教育的环境, 明确表示这是一个学习过程,并且将会犯 错。 • 跟踪您已在进行的拥有强大机器学习组件 的计划,例如客户评分、数据库营销、客户 流失管理、质量控制和预测维护,以通过 广泛分享最佳实践,促进机器学习走向成 熟。关注您可以加入其中的其他机器学习 计划,以及同行的最新动态。能否解释算 法如何达到某种结果,也会影响机器学习 算法的选择。 • 组建一个(虚拟)团队,对机器学习使用案 例进行优先级排序,并制定管控流程以推 进最具价值的使用案例投入到生产中。 • 针对机器学习调整您的数据管理和信息治 理方法,将数据视为机器学习的助动剂。 数据是您独特的竞争优势,高质量数据对 于机器学习计划的成功至关重要。虽然基 本机器学习算法的选择相当有限,但算法 的变化和可用数据源非常多。 业务影响:机器学习为广泛的业务、消费者和 社交场景带来了改进,并推动实现了针对各 种业务问题的全新解决方案: • 自动化 • 药物研究 • 客户互动 • 供应链优化 • 预测维护 • 运营效能 • 劳动力效能 • 欺诈检测 • 资源优化 61
62. 机器学习的影响可分为显式或隐式两种。显 式影响源于机器学习计划。隐式影响起因于 您使用产品和解决方案时没有意识到它们包 含机器学习功能。 好处评级:具有变革性 市场渗透率:5% 至 20% 的目标受众 成熟度:未成熟 供应商举例:Alteryx、Amazon Web Services、Domino Data Lab、Google Cloud Platform、H2O.ai、IBM (SPSS)、KNIME、微软 (Azure 机器学习)、RapidMiner、SAS NLP 分析师:Bern Elliot、Erick Brethenoux 定义:自然语言处理 (NLP) 提供了人与系统之 间的直观沟通形式,也就是说,NLP 包括旨在 解析和解释(有时会生成)人类语言的计算语 言技术。NLP 技术用于处理自然语言的语用( 语境)、语义(含义)、语法(句法)和词汇(单 词)方面。语音部分通常通过语音处理技术 来处理,这些技术实质上是信号处理系统。 定位和市场采用速度:企业 NLP 的使用随着 功能的改进不断增加,此外,基于会话代理和 自动机器翻译的新使用案例也在增加。现有 的基于句法和语义的方法越来越多地使用深 度神经网络 (DNN) 方法来增强甚至取代。 显著的技术成果包括: • 改进自然语言句法分析(通过谷歌的 SyntaxNet,即用于 TensorFlow 的一种基 于 DNN 的开源自然语言句法分析框架)。 • 从一种口语实时翻译为另外一种(如微软 的 Skype 翻译)。 • 构建大规模知识图谱(谷歌、IBM 和微软 的工作说明了这一点)。 • 提供答案而不是页面链接列表(如谷歌的 信息卡)。 然而,人类语言非常复杂。虽然 NLP 解决方 案取得了进展,但仍有许多微秒之处和细微 差别需要人工干预才能获得合理的解释。这 些限制减缓了采用进程。例如,对话能力薄 弱,DNN 存在实验性和脆弱性,并且理解、推 断、语境和综合因素构成了重大挑战。此外, 许多 NLP 解决方案需要专家才能确保语法和 模型始终准确。 用户建议:NLP 为企业提供了改善运营和服 务的重大机遇。对很多企业而言,NLP 最强 大、最直接的使用案例涉及客户服务的改善( 影响成本、服务水平、客户满意度和追加销 售)和员工支持(包括使其实现更智能和高效 的工作)。 初始项目应当在开始时制定适度的目标,以彰 显成功。获得经验后,项目应当反复执行,并 且可以扩大范围。 目前,企业存在其他 NLP 机会,但尚不成熟, 或者需要付出更多努力才能提供一致的投资 回报。翻译或转录服务(例如用于会议或文 件)有机会改善运营和降低成本。然而,这些 基于 NLP 的解决方案不如类似的基于人类的 选项准确,在某些情况下可能会需要人类参 与。 随着企业对其 NLP 实施的增强,应探索新的 技能。例如,计算语言学家精通各种语言技术 的操作并了解自然沟通对用户的影响。鉴于 NLP 应用中越来越多地使用数据科学技术, 可能还需要提高数据科学家人才的技能。 最后,提供基于知识的整合、内容映射、搜索 增强和文本摘要功能的 NLP 解决方案的质量 将有所不同。因此,企业规划师在作出重大承 诺之前,应当先测试和验证这些解决方案的 有效性。如果企业将精力投入在专业语法方 面,应当注意这些语法与供应商解决方案的 兼容性。 业务影响:为获得明确的短期 ROI 并构建 NLP 领域内的企业知识和技能,规划师应利 用 NLP 应用,例如: • 虚拟助手和聊天机器人,用于提高交互性, 包括选定环境中的员工和客户服务。 62
63. 63 • 文本分析,用于在构建聊天机器人之前,提 取和总结文本报告的重点并预览最常见的 问题。 • 基本的转录和翻译服务。 • 语言生成应用,可生成表格数据的自然语 言描述,以便多数人更容易理解。 • 文档中的关键词标记功能,可以更轻松地 确定相关部分,或提取意图和实体等其他 信息。 • 内容检测服务,可检查用户生成的内容( 文字或图像),以标记可能令人反感的内 容或识别社交媒体中的虚假新闻。 • 情感分析,用于确定句子中表达的感觉和 观点,从消极到中立再到积极。 • 搜索改进,通过深入理解搜索查询的意图 并总结检索到的内容来实现。 好处评级:具有变革性 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例:Bitext、Clarabridge、CognitiveS cale、Digital Reasoning、谷歌、IBM Watson、 微软、Narrative Science、SAS、Yseop 机器人流程自动化软件 分析师:Cathy Tornbohm 定义:机器人流程自动化 (RPA) 结合了用户界 面识别技术和工作流程执行。它可以使用屏幕 和键盘来模拟人类的鼠标点击和击键,以驱动 应用并执行基于系统的工作。有时,还可以将 其设计为自动化应用到应用。虽然称作机器人 流程自动化,但此工具并非物理对象。它可以 与其他工具配合,例如 BPMS 或人工智能。机 器人流程自动化是一种需要结构化数据才能 工作的自动化类型。 定位和市场采用速度:RPA 概念在咨询、业务 流程外包 (BPO) 和共享服务中心方面宣传较 多,因为它可以在基于规则的任务、重复密钥 更新或数据整理方面影响对人类的取代。这 项工作经常被迁移到较便宜的近岸或离岸交 付地点。 用户建议:RPA 是一种“粘合”类型的技术, 可以让您将系统粘合在一起。为完成比自动化 工作更复杂的活动,您必须能够读取手写字 迹或组织非结构化数据,或者处理聊天机器 人执行的活动或机器学习活动。是否会向您 收取更多费用取决于 RPA 供应商或机器学习 供应商的产品。具有基于规则的手动流程(即 数据输入并未自动化)的用户应考虑找出 RPA 有意义的地方,以及他们的 BPO 和 IT 供应商 是否已构建 RPA 工具或正在其他帐户中试用 RPA。然后,可评估流程自动化技术,以确定其 是否可以编程并用于取代员工。如果用户当前 的 BPO 或咨询提供商未试用此类技术,符合 用户利益的做法是鼓励其提供商试用此类技 术或在内部探索运行试点。 签订新的劳动密集型 BPO 协议的用户应当考 虑 RPA,但应记住,仅凭这一点不构成一个完 整的解决方案。现有流程的自动化类似于以 前的“mess for less”概念(以更低的成本完 成您不愿意做的事情),通过简单地离岸外包 低效流程来实现。因此,用户应当寻找结合 流程改造和自动化的解决方案,尽可能减少 或消除任务和活动,并在可能的情况下进行 自动化。 RPA 的一个非难之处在于,它是一种临时解 决方案,不会实施直通系统。用户应当考虑 其他可能更适合作为长期解决方案的技术解 决方案。 迄今为止的概念试行和证据表明,可以快速 开发自动化功能并将工作从人工转移到软件。 找到相对快速的方法将人员从流程中移除有 很多优势,其中包括: • RPA 工具不会出现键控错误。 • 自动化工作带有时间戳,并且可跟踪和审 计。 • 只要 RPA 工具得到最佳利用,对于同等的 工作负载,RPA 软件的成本会低于员工。 • 自动化可能会减少对多语言功能的需求。 • RPA 工具可设计为全天候运行。 • 用户界面识别在 Citrix 环境中工作能力会 降低。 • RPA 有助于解决棘手的员工流失问题。 • RPA 有助于减轻大多数离岸地点的工资通 胀率的影响。 63
64. 使用自动化业务流程发现工具促进 RPA 自动 化机会的发现,并通知对现有脚本的更改/增 强,以涵盖更多异常情况。通过内容分析服 务(可能由机器学习驱动)补充 RPA,以扩展 RPA 工具可与之交互的内容/渠道类型。 业务影响:如果组织已经外包或离岸外包大 量基于人工的数据输入或数据整合工作,那 么 RPA 可以减少对尽可能多的人员的需求, 提高质量并降低整体的流程成本。RPA 允许 组织自动化手动工作,并寻找自动化工作以 实现业务成果的新方法。潜在的成本节约将 取决于组织有关尚未自动化的内容的 IT 遗留 应用。 好处评级:高 市场渗透率:5% 至 20% 的目标受众 成熟度:早期主流 供应商举例:Automation Anywhere、Blue Prism、Infosys、Kofax、Kryon Systems、NICE 、Pegasystems、Softomotive、UiPath 虚拟助手 分析师:Van L. Baker 定义:虚拟助手 (VA) 可帮助用户或企业完成 以前只能由人类完成的一系列任务。VA 使用 人工智能和机器学习(例如自然语言处理、预 测模型、推荐和个性化设置)来帮助人员或自 动执行任务。VA 会听取和观察行为,构建和 维护数据模型,以及预测和推荐行动。VA 可 以部署在多个使用案例中,包括虚拟个人助 理、虚拟客户助理和虚拟员工助理。 定位和市场采用速度:VA 领域越来越多地受 到对话界面的控制,例如 Apple Siri、Google Assistant、微软的 Cortana、IPsoft 的 Amelia、Nuance 的 Nina、亚马逊 Alexa 和 IBM 的 Watson Assistant。行为和事件触发器 将进一步增强 VA。亚马逊的 Echo 和 Google Home 等设备,再加上手机中的广泛部署,使 得 VA 在消费者心中占据重要地位。我们还 将继续看到创建更多面向业务的 VA,它们使 用 Dailogflow 企业版,Alexa for Business 和 Watson Assistant 等工具。随着用户越来越适 应它们,技术得到改进,以及各种实施方式的 增加,采用率也会提高: • 将类似 VA 的低调功能,例如具有推荐的 完成句子功能的 Gmail Smart Compose, 以及 Microsoft Graph 中可发现未知资源 的发现功能,嵌入现有产品中。 • 此外,还出现了特定于使用案例的 VA, 例如个人财务顾问、健康辅导师和日历代 理。 • 作为 VA 子设备的聊天机器人越来越多地 用于回答客户有关产品和服务的问题。 • VA 可以代表消费者、员工和企业执行操 作,但使用案例都基于不断改进且以语言 为中心的相同人工智能 (AI) 技术。 用户建议:应用开发领导者应制定具有语音和 文字支持的 VA 策略,因为 VA 会为企业的员 工及其客户带来重大裨益。 • 预计 VA 会随着人员和企业转向会话用 户界面而激增。个人可以使用几种不同的 VA,而企业则从一个部署迁移到多个 VA, 这些 VA 由专家聊天机器人组成,意图范 围狭窄,与主聊天机器人共同协作以协调 请求分类。 • 尚未开始部署 VA 以与客户和员工进行交 互的企业应当现在开始部署,因为客户和 员工越来越希望能够使用会话界面来解决 帮助台和客户服务台的问题。 • 首先采用云办公套件中出现的 VA,然后采 用 SaaS 产品,例如 SAP、ServiceNow 和 Salesforce 的产品,还有 Facebook 等消费 者应用环境。 • 寻找利用 VA 的机会,通过业务应用和移 动平台,在有针对性且定义明确的使用案 例中提高用户的工作效率。 • 结合分析来衡量 VA 对行为和表现的影 响。密切关注 VA 的使用,特别是在虚拟客 户助理 (VCA) 使用案例中,并实施一种 自动切换到人工代理以确保客户满意度的 架构。 • 在不同使用案例中使用 VA:包括客户支持 和参与,员工支持和启用,以及员工将个人 虚拟助手用于 HR 等服务。 业务影响: • VA 有可能改变用户行为以及客户和员工服 务的性质、工作方式和工作场所活动的组 织。 64
65. 65 • VA 提供商数量众多,但质量参差不齐,因 此我们希望提供商的格局能够快速转变。 • VA 可以使用提供商许可的工具和托管 人工智能服务来构建或使用专业服务创 建。VA 的性能取决于用于添加特定域信息 的数据集的质量,以及面向托管语言的人 工智能服务的质量。 • 安全性和个人信息的收集仍然令人关切, 但用户越来越适应其与 VA 的交互。嵌入 式 VA 将首先取得进展;但随着企业部署 该技术,员工和客户将广泛使用 VA。 • 随着它们逐渐成熟,VA 可以为用户执行操 作,从而随着时间的推移与用户形成一种 关系。VA 通过与用户保持一致,将理解流 程的责任从用户转移到了系统。 好处评级:具有变革性 市场渗透率:5% 至 20% 的目标受众 成熟度:未成熟 供应商举例:1-Page、亚马逊、苹果、谷 歌、IBM、IPsoft、微软、Nuance、甲骨 文、[24]7.ai 认知计算 分析师:Kenneth F. Brant 定义:认知计算是一种能够改善人类在各种 认知任务中的表现的技术。这些系统在对话 中是交互、迭代并且有状态的,可调用之前的 交互,与语境相关并能适应信息和/或目标变 化。我们将“认知计算”看作是如今市场上被 供应商过度使用的宣传术语,而并不认为这 种系统真的拥有认知功能;它们只是在模仿 和/或扩展人类的认知能力。 定位和市场采用速度:由于在最新一代的人工 智能市场中寻求差异化竞争优势的主流供应 商对这一术语的普遍推广,认知计算快速达到 了过高期望的峰值。某些种类的人工智能(如 无人驾驶车辆和虚拟客户助理等)可能取代人 类工作者,而认知计算可对这些人工智能进行 提升。除了代码系统以及组织和文化认同问题 外,该技术要实现普遍适用,还需解决难以根 据丰富的数据组装恰当的技术集和缺少训练 技能的问题。因此,尽管认知计算的宣传和期 望势头将持续攀升,但是等待它的还有期限 相当长的底谷期。我们期望未来五年内能够为 主流采用者解决这些障碍。这会实现,因为用 户需要解决方案来理解物联网 (IoT)、数字业 务开发和大数据中的模式,以及大型和初创 供应商的重大投资和创新。 用户建议:注意在其发展的这个阶段有关认知 计算的宣传,和通用人工智能一样,其期望被 过分夸大。 要知道认知计算并非单一技术,而是一类共 享增强人类认知的方法的广泛技术,其范围 包括: • 协助处理电子邮件和管理问题的虚拟助手 (VA) • 与专业知识工作者配合以解决范围非常狭 窄的问题并获得深入发现的认知专家顾问 (CEA) • 计算机视觉 (CV),提高人类感官能力的增 强现实 (AR) 系统 制定一个五年期技术采用计划,在其中针对 通过认知计算实现绩效改进,编写一份使命 宣言并明确相关目标及规划。务必包含整体 招聘目标、新政策考虑事宜和对员工的影响, 并提供充足的时间和资源,以便实施沟通和 变更管理计划。 抵御在此阶段选择“优胜者”的诱惑,并在多 个供应商中进行试验。 对认知计算采用计划运用“模式 2”开发、认 知工效学和设计思维。 业务影响:认知计算可为业务带来广泛而深 远的影响。例如,VA 在横向以及许多工作类 别(包括常规工作的执行者)中都会影响生产 力。同时,CEA 主要将影响银行、保险、医疗保 健和零售领域,以及狭小的非常规知识工作 领域的垂直使用案例。CV/AR 将在公用事业、 采矿、建设、制造、保养维修及检修职能领域 提升人类感知、决策和生产力。 您应当获得用来在基于认知计算的业务模型 和试验中进行验证和量化的某些商业效益, 其中包括: 65
66. • 销售费用、一般费用及管理费用 (SG&A) 的每美元输出增加 • 周期时间缩短 • 现场维护人员的生产力提高 • 由于决策不佳/过晚,风险和机会成本得 以降低 • 研发投资回报增加 • 员工安全性和满意度提高 好处评级:具有变革性 市场渗透率:1% 至 5% 的目标受众 成熟度:新兴 供应商举例:Accenture、CognitiveScale、De loitte、Digital Reasoning、谷歌、IBM、英特尔 Saffron、IPsoft、微软、SparkCognition 陷入底谷 FPGA 加速器 分析师:Chirag Dekate、Alan Priestley 定义:现场可编程门阵列 (FPGA) 加速器是一 种基于服务器的可重配置计算加速器,通过 实现可编程硬件级应用加速来提供极高的 性能。 定位和市场采用速度:FPGA 加速器具有大 量可编程逻辑模块、可重配置互连以及可配 置为加速特定算法功能的存储器子系统。因 此,FPGA 处理器能够卸载主系统处理器的 任务。FPGA 未使用过程语言编程。相反,它 们配置了与一般程序员不同的电路设计语 言。“VHDL”是一种大多数软件工程师都难以 学习的语言,因此 FPGA 编程难度很大。 在数据中心,FPGA 可用于一系列需要对大量 数据应用一致处理操作的使用案例,例如高 频交易 (HFT)、超大规模搜索和 DNA 测序。 例如,微软将 FPGA 用于搜索分析和网络,而 Edico Genome 基于 FPGA 的 DRAGEN Bio-IT 平台可实现高性能的基因组测序工作流程。 FPGA 通常使用 RTL 和 VHDL 等硬件编程语 言进行配置,这些语言非常复杂,难以使用, 这正是阻碍其广泛采用的原因。然而,主要 FPGA 供应商(英特尔和 Xilinx)正致力于利 用能够用以软件为中心的编程模型配置 FPGA 的库和工具集来解决此问题。在 OpenCL 等 新框架的帮助下,采用也变得越来越容易,因 为这些框架降低了使用 FPGA 的时间和技能 要求。深度学习(推断)等新兴工作负载吸引 着人们对 FPGA 的兴趣。英特尔将 FPGA 与 主流服务器 CPU 集成,并且更容易访问以 Amazon Web Services (AWS) 支持 FPGA 的 实例类型为典型的开发平台,这也推动了数据 中心对 FPGA 的采用。 如今,FPGA 在数据中心的最大发展机会在深 度学习工作负载的推断部分。鉴于这个新使用 案例和周边软件生态系统的不断发展,FPGA 加速器已转移到峰后位置 — 25%。 用户建议:相比同类商品技术,FPGA 加速器 可以在显著缩小的能耗范围内实现巨大的 性能提升。I&O 领导者需通过以下方式评估 FPGA 加速器的适用性: • 使用 FPGA 识别可能受到较深影响的应用 子集。 • 概述与技能组合和编程挑战相关的成本。 • 评估用于数据中心服务器部署且基于 FPGA 的硬件的可用性 — 基于 FPGA 的 PCIe 插入卡或带集成 FPGA 的处理器的服 务器。 • 利用基于云的 FPGA 服务加速发展。 在以下情况下,I&O 领导者应使用 FPGA 加 速器: • 存在有助于显著改变关键工作负载的预配 置解决方案(例如,金融交易分析和基因 组测序等)。 • 算法的发展需要进行频繁的硅级更新, 以供更广泛的应用所使用(例如微软的 Project Catapult)。 业务影响:FPGA 可以为越来越多的工作负载 提供极高的性能和功率效率。FPGA 非常适合 人工智能工作负载,因为它们在低精度(8 位 和 16 位)处理能力上表现出色,具有极高的 节能性。虽然限制 FPGA 广泛采用的可编程 性仍是一项重大挑战,但 I&O 领导者应评估 基于 FPGA 的解决方案在基因组测序、实时 交易、视频处理和深度学习(推断)方面的应 用。I&O 领导者可以利用基于云的基础架构 来配置 FPGA(例如,亚马逊弹性计算云服务 F1、微软 Azure 和百度云),从而进一步隔离 风险。 66
67. 67 好处评级:中 市场渗透率:少于 1% 的目标受众 成熟度:早期主流 供应商举例:Amazon Web Services、百 度、Bigstream、英特尔、微软 Azure、Xilinx (DeePhi Tech) 计算机视觉 分析师:Tuong Huy Nguyen、Brian Blau 定义:计算机视觉 (CV) 是一个涉及捕获、处 理和分析真实图像和视频,以便机器能够从 物理世界提取有意义的上下文信息的过程。 有许多不同的重要 CV 技术领域,包括机器 视觉、光学字符识别、图像识别、模式识别、 面部识别、边缘检测和运动检测。 定位和市场采用速度:建立用于解决视觉问 题的算法和模型已经存在了半个多世纪。深 度神经网络、大量数据的可用性以及大规模 并行处理器的融合,通过大幅推进计算机视 觉领域而焕然新生,从而实现 CV 模型的监 督和无监督学习、识别、分类、预测和操作。 例如,30 年前,目标分类是一项艰难的手动 任务。而过去 8 年里,ImageNet 挑战赛的结 果充分证明了该领域目前的进展。计算错误 率下降了 30% — 达到并偶尔超过人类识别 水平。反过来,这促进了亚马逊、百度、IBM、 微软和谷歌等(学术界之外的) CV“新玩 家”的崛起。采用率仍然有限,但由于多种原 因,人们的兴趣正快速高涨:(1) 使用 DNN 的 兴趣和宣传(尽管 CV 在许多情况下可以并将 继续使用几何和基于规则的系统)以及相关 人工智能宣传;(2) CV 广泛适用于众多领域, 例如机器人、无人驾驶汽车、无人机、增强现 实和虚拟现实;(3) 大多数企业都面临着如何 处理其正在收集的所有图像/视频数据以及 如何自动处理这些图像数据的挑战;(4) 计算 机视觉是物联网 (IoT) 的特殊使用案例和自然 扩展。外部传感器会扩展 IoT 的范围。 用户建议:技术创新领导者:利用计算机视觉 加强员工队伍并自动处理图像和视频数据。 例如,计算机视觉可用于自动化(如容器零件 抓取),也可用于残疾人辅助技术,并在需要 分析图像和视频的领域担任专家顾问。鉴于 持续存在的安全和隐私问题以及 GDPR 等法 规,您还需要评估与图像/视频数据的收集和 处理相关的法律责任风险。 业务影响:视觉支持设备将改变他们与环境 的交互方式。视觉是对其他传感器数据(例如 地理定位、惯性和音频)的完美补充。此外,它 还增强了人类与数字和物理世界的互动能力。 这引起了人们对这门学科的广泛兴趣,例如无 人驾驶车辆、机器人、无人机、增强现实、混合 现实和虚拟现实,以及安全和生物测定等方 面的应用。 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:未成熟 供应商举例:亚马逊、苹果、百 度、Clarifai、Facebook、谷歌、IBM、微软、腾 讯 预测分析 分析师:Peter Krensky、Alexander Linden、Carlie J. Idoine 定义:预测分析是一种高级分析,可对数据 或内容进行检查,以回答“将发生什么?”这 一问题,或更准确地说,回答“可能会发生什 么?”这一问题。该分析的特点就是包含多项 技术,如回归分析、多元统计、模式匹配、预 测建模和预测。 定位和市场采用速度:大家对预测分析的热 情不断激发更多人的兴趣,并驱使该技术在 各种成熟度级别实现更广泛的采用。然而, 最近与开源采用浪潮相关的幻灭期开始以过 度夸大的供应商承诺,和由于过度雄心勃勃 而导致失败的早期笔记本电脑项目的形式出 现。尽管如此,这项技术不太可能在泡沫化的 底谷期持续太长时间,因为预测分析的发展 速度和潜在价值会在不久的将来快速推动该 技术进入实质生产的高峰期。 从刚开始使用预测分析的组织到拥有成熟 数据科学实验室的企业,各组织都在大力传 播预测模型的价值和潜在影响。该技术受到 关注还包含以下原因:数据可用性提高、计 算处理成本降低(尤其是在云平台中),以及 实际使用案例得到可靠验证。预测模型不再 仅出自数据科学平台;预测分析正在嵌入比 以往任何时候都更多的业务应用中。客户在 gartner.com 上对“预测分析”的搜索继续呈 稳步上升趋势。 67
68. 用户建议:通过打包应用提供的预测分析的 易用性非常高。但是,并不是每个分析使用案 例都存在适合的打包应用。此外,打包应用通 常还无法提供足够的敏捷性、定制或竞争优 势。在这些情况下,建议组织通过外部服务提 供商,或结合使用开源技术和数据科学平台 的高技能内部员工,来构建解决方案。许多组 织越来越多地采用组合战术(构建、购买、外 包),某些供应商还拥有混合产品。最后,为 确保预测分析项目的成功,应重点关注部署 这些预测资产的操作方法。 业务影响:通过了解未来可能取得的成果,组 织能够主动地而非被动地制定更佳的决策并 预测威胁和机遇(例如,设备的预测维护、需 求预测、欺诈检测和动态定价)。人们对预测 分析的新使用案例和更多传统应用的兴趣和 投资正在持续增长(例如,客户流失管理、交 叉销售、购买倾向、数据库营销以及销售和财 务预测)。 好处评级:高 市场渗透率:20% 至 50% 的目标受众 成熟度:早期主流 供应商举例:Alteryx、H2O. ai、IBM、KNIME、MathWorks、微 软、RapidMiner、SAS 无人驾驶车辆 分析师:Carsten Isert 定义:自动或无人驾驶车辆可以使用各种车 载传感和定位技术(如激光雷达、雷达、摄像 头、GPS 和地图数据),并结合基于人工智能 的决策能力,导航和驱动某些部件或从起点 到指定目的地的整个距离,而无需人为干预。 虽然无人驾驶汽车目前获得了大部分的关注, 但该技术也可应用于非乘用车辆,进行货物 运输。 定位和市场采用速度:过去一年的许多迹 象表明自动驾驶已经进入泡沫化的底谷 期。2018 年初发生了几起自动驾驶车辆事故, 造成行人伤亡。此外,先前宣布的里程碑事件 已经过去,但效果与预先承诺并不相符。 但是自动驾驶也取得了一定进展。预计 2018 年将推出第一批商业服务。 汽车制造商和技术公司花费大量精力研发 自动驾驶车辆,这已经成为主流媒体的头版 专题,导致市场对该技术产生了不切实际的 过高期望。人工智能 (AI) 是实现自动驾驶的 关键技术,自动驾驶车辆的相关机器学习算 法也已在加速研发。实现自动驾驶的主要挑 战仍然集中在降低技术和工业化成本上,但 也越来越多地涉及到监管、法律和社会等因 素,例如运营许可、责任、保险和人际交互的 影响。 自动驾驶技术不仅对智能出行和物流具有破 坏性影响,对航运、采矿、农业、工业、安全和 军事行动也是如此。 传感、定位、成像、制导、测绘和通信技术的 不断进步正与人工智能算法和高性能计算能 力携手并进,让自动驾驶更接近现实。然而 2018 年仍然面临着高成本挑战和纷繁复杂的 局面,影响了可靠性和可承受性要求。 投资方面,2018 年的投资额尚不及 2017 年。 Waymo 计划在亚利桑那州进行商业发布,表 明起初自动驾驶车辆的具体使用和部署可能 会受限于个别国家、州和全球立法中的技术 创新速度(例如,校园环境或城市指定区域内 低速行驶,认证高速公路上高速行驶)。 总之,资金减少、行业专家讨论时收集到的事 故案例与证据,导致对自动驾驶的预期进入 底谷期。 用户建议:自动驾驶技术的应用分为三个发展 阶段,即自动驾驶辅助、半自动和全自动无人 驾驶车辆。三个阶段对技术精细度和可靠性 的要求越来越高,对人为驾驶干预的依赖越 来越少。汽车公司、服务提供商、政府和技术 供应商(例如,软件、硬件、传感器、地图数据 和网络提供商)应当合作进行联合研究和投 资,推动所需技术水平发展,制定自动驾驶汽 车的立法框架。 68
69. 69 此外,还应向所有消费者普及自动驾驶车辆 的好处。自动驾驶车辆技术可在大范围内使 用部署时,消费者教育对于确保市场需求满 足预期至关重要。过渡阶段的自动或半自动 驾驶车辆将与早期的非自动驾驶车辆共存, 因此必须重点关注过渡阶段。 自动驾驶车辆将对公共汽车、出租车和货车 驾驶员等工作产生破坏性影响。制定相关政 策和计划,为将受自动驾驶影响的员工提供 培训,帮助这些员工转到其他岗位。 业务影响:自动驾驶车辆的影响主要体现在 经济、商业和社会等方面。创新的驾驶辅助、 安全和便捷功能,可降低车辆油耗与改善交 通管理的优势,将有助于汽车和技术公司销 售自动驾驶车辆。非移动公司(如 Waymo 和 百度)的主要兴趣集中在将自动驾驶车辆转 变为移动计算系统,为数字内容的创造和消 费提供一个理想平台,包括基于位置的服务、 以车辆为中心的信息和通信技术。 自动驾驶车辆也是移动创新和新运输服务的 一部分,有可能打破既定的商业模式。例如, 自动驾驶车辆最终将转变为新的服务模式, 通过让无人驾驶车辆在需要时接载乘客,突 出按需移动获取车辆所有权。自动驾驶汽车 将带来巨大的社会效益,包括减少事故、伤 亡,改善交通管理,进一步可能会影响其他社 会经济趋势。例如,如果人们可以在乘坐自动 驾驶车辆时利用乘车时间工作或娱乐,那么 居住地与工作地的距离将不那么重要,这可 以减缓城市化进程。 自动驾驶进入泡沫化的底谷期时,对于市场新 进入者来说可能是个良机。 好处评级:具有变革性 市场渗透率:少于 1% 的目标受众 成熟度:新兴 供应商举例:奥迪、宝马、戴姆勒集团、福特 汽车、通用汽车、日产、特斯拉、优步、沃尔沃 汽车、Waymo 商用 UAV(无人机) 分析师:Aapo Markkanen 定义:商用无人机(UAV,也称无人机)是无人 驾驶的小型固定翼和多旋翼混合式直升机,由 地面上的人类飞行员远程控制或配备自主导 航功能。与消费型或军用无人机不同,商用无 人机用于商业目的。 定位和市场采用速度:2018 年,商用无人机进 入了泡沫化的底谷期。在技术层面,这种无人 机相对成熟,能够完成日益复杂的任务。但是 商用无人机的应用常常受到相关法规限制,禁 止了许多使用案例。大多数国家重点监控是 脱离人员视线范围 (BVLOS) 或进入空中禁区( 例如靠近机场)的飞行无人机。此外,垂直专 用的端到端无人机解决方案(包括设备、支持 软件和飞行操作)成本高,阻碍了最终用户的 大规模应用。Gartner 预计,假设监管条件和 某些技术要素继续按预期发展,商用 UAV 将 在两年内接近产业化的平稳期。特别是,自主 飞行将大大促进无人机的市场应用,但这需要 监管变革和技术进步。 用户建议:总体而言,企业无人机计划应当既 有短期目标,也有长期目标。因为商用 UAV 现 在已经可以带来巨大运营效益,但只要相关 航空法规变得更加宽松,商用 UAV 的潜力可 以在一夜之间迅猛增长。因此,考虑发展无人 机的组织不应仅仅依据现有技术进行规划, 还应考虑当地监管前景。有必要主动识别相 关监管变化并尽早加以利用。例如美国的低 空授权和通知能力 (LAANC) 计划,该计划旨 在加快在空中禁区内飞行的豁免批准。目前 的主要使用案例包括航拍、测绘和测量、体积 测量及遥测。以上所有使用案例都可以通过 使用权分析得到明显提升。因此作为 UAV 规 划的一部分,应用者还应考虑如何以最佳方 式利用采集到的数据。涉及物理任务的使用 案例(例如交付物品或修复资产)目前很大程 度上处于初级阶段,但预计未来两到三年内 将逐渐变得更加可行。然而依赖完成物理任 务的商用 UAV 应用比基于数据采集和分析的 应用需要更长的时间来实现其效益。 69
70. 业务影响:最重要的是,传统的劳动密集型 职业人群(例如测量员、检查员、驾驶员和摄 影师等)的工作环境通常有潜在危险,而商 用 UAV 可以增强他们的能力。无人机在通过 减少和/或重新部署工作人数来提高生产力的 同时,实现实时数据采集并提高员工安全。商 用 UAV 尤其能够增加农业、建筑、紧急服务、 采掘业、媒体娱乐、公用事业等垂直行业的价 值。在大多数垂直行业中,商用 UAV 的价值 在于降低运营支出,提高安全性,但在电影拍 摄、测量和物流等行业也能提供创收机会。 好处评级:高 市场渗透率:5% 至 20% 的目标受众 成熟度:未成熟 供应商举例:Boeing、Cyberhawk Innovations、DJI、Lockheed Martin、PrecisionHawk 增强现实 分析师:Tuong Huy Nguyen、Brian Blau 定义:增强现实 (AR) 是指对文本、图形、音频 信息的实时使用,以及与现实世界对象集成 的其他虚拟增强,使用头盔显示器或投影图 形叠加来呈现。正是这种“现实世界”元素将 AR 与虚拟现实区分开来。AR 旨在增强用户 与环境的交互而不是将其与环境分离。 定位和市场采用速度:这种科技最适合专用 的专业解决方案。因此其现状及主流应用时 间因垂直和行业而异。目前关注度最高的水 平任务是任务分项、视觉设计和视频指导,代 表了细分市场间的 AR 实施同类视角。 根据 Google Trends,尽管 AR 领域的高调 发展使行业内的兴趣和炒作持续发酵,但市 场兴趣仍然相对稳定。这些发展包括苹果公 司推出的 ARKit、谷歌推出的 ARCore 以及 Magic Leap 传闻已久的 HMD。 AR 目前面临着不相符的期望(供应商承诺的 解决方案超出当前能力)和糟糕的实施(例如, 一些解决方案没有沉浸式开发知识或工作流 程集成,或未映射到业务价值或需求)。 B2C 实施仍在努力向消费者展示其价值。取得更 多进展需要更好、更透明的硬件,更具吸引力 的使用案例。 根据 Gartner 查询和行业新闻,随着越来越 多的企业发现并注意到在工作流程中使用 AR 的价值,B2B AR 持续获得更多关注。HMD 销售反映了迅速发展的试点部署。HMD 硬件 的进步也将为 AR 提供更具吸引力的免提使 用案例。 用户建议:确定您的 AR 解决方案受众。面向 内部和外部的解决方案不可转换。将初始试 验限制为特定任务或目标。针对未增强的解 决方案设置基准,以了解风险和好处。选择提 供商之前,为您的 AR 实施设置业务目标、规 则要求和测量方式。只有明确了部署意图后, 丰富而强大的产品才能带来价值。对于面向 外部的实施,将 AR 作为您品牌和体验的延 伸。对于面向内部的实施,将 AR 作为增强员 工工作职能的工具。这包括按照移动工人的 需要提供情境特定的信息、减少工厂人数和维 护操作人员,或通过基于 AR 的培训和指导来 改善业务流程。 业务影响:利用设备传感器,AR 充当了用户 感官的数字延伸,作为人类与物理世界的接 口,提供了一个数字过滤器,通过有趣和/或可 操作的相关信息增强用户的环境。 AR 是连接数字世界和物理世界的桥梁。这对 面向内部和外部的解决方案都有影响。例如, 从内部来看,AR 可以通过加强培训、维护和 协作来提供价值。从外部来看,AR 有助于品 牌商、零售商和营销商将实体营销活动与其 数字资产无缝结合。 因此,AR 广泛适用于不同市场,包括游戏、工 业设计、数字商务、营销、采矿、工程、建筑、 能源和公用事业、汽车、物流、制造、医疗保 健、教育、客户支持和现场服务等。 70
71. 71 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:未成熟 供应商举例:Blippar、Catchoom、DAQRI、谷 歌、微软、Ubimax、Upskill、Wikitude 知识管理工具 分析师:Rich Doheny、Kenneth Gonzalez 定义:基础架构和运营 (I&O) 领导者利用知 识管理 (KM) 工具创建、修改、访问 IT 知识 库。KM 工具通常链接到支持自助服务的门 户,以便最终用户可以自助访问相关的知识资 产。这些产品被定义为能够联合、存储和访问 有关 IT 和非 IT 服务的信息。KM 工具可作为 独立选项或更广泛的 IT 服务管理 (ITSM) 工 具的集成组件提供。 定位和市场采用速度:KM 为许多 IT 组织带 来巨大的未开发潜力,可以优化、提高效率并 实现 ITSM 的规模经济。如果正确实施,KM 可以大幅度提高 I&O 效率和业务用户的自助 服务。此外,KM 还能提供一个重要组件,使 未来的自动化成为示教新兴科技(包括聊天 机器人和虚拟支持代理)的信息库。许多中 级和高级 ITSM 供应商正在增强其产品在 KM 领域的能力。因此,针对 ITSM 使用案例的独 立工具市场已经开始整合。 KM 工具在 IT 组织中变得越来越普遍, Gartner 预计市场渗透率在 20% 到 50% 之间。由于文化 问题、行为挑战以及对基础 KM 实践的成功实 施缺乏了解,许多组织都难以实现投资回报率 (ROI) 和真正价值。 用户建议:无论是通过独立选项还是 ITSM 套 件的一部分,知识管理工具都应当是 I&O 战略 不可或缺的组成部分。整合对于实现知识库 的好处很有必要,买方应当评估哪个平台最符 合他们的需求。不要过分强调工具的成功潜 力。工具可以支持流程,但前提是工具与您目 前拥有的流程、程序和策略一样优秀。正式的 知识管理治理机制对于确保内容审查、更新 和纠正持续进行至关重要。 业务影响:虽然良好的知识库通常用于事件处 理、请求实现、培训、影响评估和自助服务实 施,但如果实现最优利用,可以在 I&O 中显著 提高效率。知识工具可以降低支持成本,释放 IT 服务台和其他资源,以将其部署在其他地 方。KM 的有效使用还可以从定性角度、提高 客户满意度和整体客户感知方面获得回报。 好处评级:中 市场渗透率:20% 至 50% 的目标受众 成熟度:未成熟 供应商举例:ComAround、Upland Software 稳步爬升 虚拟现实 分析师:Brian Blau 定义:虚拟现实 (VR) 提供计算机生成的 3D 环境,围绕用户并以自然的方式响应个人的 动作,通常通过沉浸式头盔显示器 (HMD) 实 现。手势识别或手持式控制器提供手部和身 体跟踪,并且可以结合触觉(或触敏)反馈。 基于房间的系统可在大面积移动时提供 3D 体验,也可与多个参与者一起使用。 定位和市场采用速度:沉浸式 VR 应用比其他 图形模拟更为先进,5 到 10 年的实质生产的 高峰期与公众认知一致,接触这种技术并整 体应用主要发生在消费者市场,但在商用方面 也在不断增长。 VR 通常用 HMD 进行体验。2018 年市 场上众所周知的设备有 Oculus Rift 和 Oculus Go、Sony PlayStation VR、HTC VIVE、Samsung Gear VR 和 Google Daydream。对于企业使用,VR 已经足够成 熟,但仍需谨慎,因为设备运行时,VR 的成功 使用取决于设备质量和用户体验。大多数 VR 用户通过玩视频游戏或观看视频来参与,观 看视频时,可将其设置为 360 度环绕式全景, 也可以仅设置为电视和电影内容。VR HMD 部 署虽然发展缓慢但正在不断增长。VR 的新领 域包括零售和电子商务,以及升级版 HMD 的 质量和系统易用性。 71
72. 用户建议:虚拟现实可用于各种商业场景: • 复杂的模拟和培训应用 • 军事模拟和训练,如飞行模拟器 • 远程医疗等场景中的远端临场 • 设备操作员培训 • 娱乐和社交体验,例如视频游戏或 360 度 环绕视频或互动电影 • 产品营销,扩展到品牌交互或产品设计 • 结构走查和科学可视化,如基因组作图 • 建模,如石油工业中的地质模型 虽然 VR 非常复杂,效益很高,但定制水平成 本非常高昂。HMD 技术的最新进展可能有助 于解除这些障碍,因此开发人员应专注于构 建有效的高质量体验。由于个人和社交网络 技术的使用增加,人工智能脚本、对象元数 据和社交身份数据的标准更加普及,有助于 开发人员将 VR 变得更加个性化和智能化。云 图形处理和移动视频游戏等技术以及宽带接 入的普及,将使应用开发人员能够更轻松地 将 VR 集成到他们的产品中。 VR 开发人员应当考虑集中于沉浸式视频游 戏开发、互动电影和新故事体验、直播活动 和以业务为中心的场景,其中高级可视化和 HMD 比基于平面屏幕的系统提供更高的视 觉保真度和个性化体验,使任务或客户交互 点受益。 业务影响:VR 可以支持各种模拟和培训应 用,包括排练和事件响应。VR 还可以通过沉 浸式协作缩短设计周期,增强科学可视化、教 育和娱乐的用户界面体验。企业将受益于 VR 的沉浸式界面、帮助创造任务高效率或降低 与新产品设计相关的成本,或通过先进的图 形可视化和模拟技术增强对信息的理解。 好处评级:中 市场渗透率:1% 至 5% 的目标受众 成熟度:未成熟 供应商举例:谷歌、HTC、NextVR、Oculus VR、三星电子、索尼、Valve、WorldViz 进入高峰期 GPU 加速器 分析师:Chirag Dekate、Martin Reynolds、Alan Priestley 定义:GPU 加速计算是指使用图形处理单元 (GPU) 与 CPU 加速工作负荷中高度并行的计 算密集型部分。 定位和市场采用速度:GPU 是高度并行的浮 点处理器,专为图形和可视化工作负荷而设 计。过去十年中,NVIDIA 和其他公司已经为 GPU 增加了可编程功能,使应用能够访问深 部快速浮点资源。GPU 还具有超高带宽的内 存子系统。对于许多高度并行、重复、计算密 集型应用,这些功能可显著提高性能。 计算密集型应用现已可以使用 GPU,包括分 子动力学、计算流体动力学、财务建模和地 理空间应用。编程 GPU 可能具有一定的挑战 性,因为执行顺序和代码优化至关重要。但是 NVIDIA 的 CUDA 等工具包可以大幅降低编程 挑战。GPU 计算在稳步爬升的光明期稳步前 进,产生新使用案例并推动了深度神经网络 (DNN) 发展。 我们预计 DNN 技术在大型云提供商的开放 框架支持下将会快速成熟。这些框架包括 TensorFlow、Torch、Caffe、Apache MXNet 和 Microsoft Cognitive Toolkit。 72
73. 73 用户建议:GPU 加速计算可为高性能计算 (HPC) 和 DNN 培训中的高度并行计算密集型 工作负荷提供极高性能。GPU 计算也可用作 云服务,对于利用率低但完成紧迫性高的应 用而言较为经济。云 GPU 将超级计算的平衡 从本地部署转移到云端。 I&O 领导者可以通过以下方式使用 GPU 解决 方案加速兼容的应用: • 选择能提供最成熟的软件堆栈的 GPU 计 算平台。 • 通过为概念验证 (POC) 和原型阶段评估云 托管 GPU 环境来优化基础架构成本。 当应用需要极高的性能并具有高度计算并行 性时(例如,许多高性能计算和深度学习应用 等),I&O 领导者应当使用 GPU 加速器。 业务影响:高性能计算和深度学习对许多数 字业务战略至关重要。对于这种快速增长的 工作负载,基于仅 CPU 方法的传统企业生态 系统远远不够。利用成熟的 GPU 技术,为特 定的 HPC 应用和深度学习基础架构提供支 持。CUDA 等框架很大程度上解决了 GPU 加 速计算中的可编程性挑战。I&O 领导者可以 使用云托管 GPU 环境来进行测试和评估,最 大限度降低风险。 好处评级:高 市场渗透率:1% 至 5% 的目标受众 成熟度:成熟主流 供应商举例:AMD、Cray、Dell、Hewlett Packard Enterprise、IBM、Lenovo、NVIDIA、S upermicro 集成学习 分析师:Peter Krensky、Alexander Linden 定义:集成学习技术系指机器学习算法,其中 可创建一系列预测模型,模型输出结合成为 整个集合的单一输出。该方法在很大程度上 利用了“群体智慧”原则,其中,意见或模型 输出的多样化是关键。最知名的装填、推进和 堆集技术模式包括随机森林和梯度推进。这 些技术通常可以非常高的准确性来解决监督 学习问题。 定位和市场采用速度:集成学习技术的应用仍 处于缓慢增长状态。各大数据科学供应商都 在其产品组合中提供该技术。集成学习已成 为数据科学家和公民数据科学家广泛采用的 方法。随着集成技术在数据科学团队中得到 更加广泛的使用,该技术将会在未来 12 个月 内达到实质生产的高峰期。 用户建议:甚至对于技能水平中等的数据科学 专业人员,集成技术也可相对轻松地应用于具 有高精度要求的场景。它们通常能够将错误率 减少 5% 至 30%,这可对建模指标带来实质性 的影响。集成学习对于难以识别最佳模型的新 颖项目尤其重要。然而,部署集成技术可能给 目前的基础设施带来计算负担。 集成技术在受管制的行业可能不是一个合适 的选择,在这些行业,预测模型必须做到完全 可以解释和透明。 数据和分析领导者应了解集成学习的优缺 点: 优点: • 是提高模型准确度的可靠方法,使模型适 合大多数使用案例。 • 使模型更强大和稳定。 • 可用于获取数据中的线性和非线性关系。 缺点: • 在性能方面可能较为耗时,并且通常不适 合实时应用。 • 选择用于创建集合的模型是一项技术活, 可能需耗费一些时间才能掌握这项技能。 73
74. 业务影响:几乎每个预测性分析使用案例和 机器学习任务都可从集成技术应用中获益。 应用技术的成功案例令集成学习在预测准确 性方面名声大噪。集成方法频繁部署于各类 分析竞赛中,例如 KDD Cup(国际知识发现 和数据挖掘竞赛)和 Kaggle 竞赛,并且表现 相当出色。 数据和分析领导者应询问他们的数据科学团 队,如何以及何时部署集成技术。这些技术 可以很好地抵御离群值和过拟合的影响。基 于集成方法的预测可用作排序得分或理解为 回归函数,尤其为金融服务和营销应用中的 各种任务提供帮助,在这些任务中,需要预测 客户行为。 集成技术能够就模型提供宝贵的全新观点, 并对已经处于生产环节的现有模型进行验 证。集成学习也是一种成熟的创意工具,适用 于从事业务探索和高级原型使用案例的数据 科学团队。 好处评级:高 市场渗透率:20% 至 50% 的目标受众 成熟度:早期主流 供应商举例:Alteryx、DataRobot、H2O. ai、IBM、KNIME、微软、RapidMiner、SAP、SAS 语音识别 分析师:Anthony Mullen 定义:语音识别技术将人类语音翻译成文字 以供进一步处理。 定位和市场采用速度:语音识别性能在过去 三年中迅速提高。IBM、微软、谷歌、亚马逊和 百度等重量级企业在 2016 年 - 2017 年都取 得了快速的科技进步,声称其性能与人工转 录相同或更好。 语音识别服务不断升级,特别是在开发人员 和过程支持方面,例如,2018 年谷歌通过提 供多种机器学习模型来满足不同的使用案例 情境(例如,电话、语音命令、视频等),改进 标点符号,使转录内容更具可读性。 随着算法进步,硬件不断发展,企业采用聊 天机器人和虚拟助手等会话代理,消费者采 用智能手机、游戏机上的语音交互,尤其是 Amazon Echo 和 Google Home 等虚拟个人 语音助理,推动了语音转文字的应用发展。互 联家庭、汽车领域以及边缘设备上运行的嵌 入式解决方案都在越来越多地使用语音转文 字技术,无需云来创建新的使用场景。 用户建议:从人机界面的角度来看,语音识别 适用于以下用户: • 有兴趣或有需求的用户,例如受伤或身体 残疾的用户。 • “手忙,眼忙”的用户,需要在进行其他任 务时通过语音(即仓库、工厂、医院、车间、 汽车或家庭)输入数据或控制系统。 • 需要持续、大量或重复输入的用户,例如办 公室、医疗和法律听写,特别是在可利用语 音快捷方式插入常用重复文字段落的应用 中。 74
75. 75 • 具备领域知识而非系统知识的用户,即通 过自然语音而非专有系统命令和接口来表 达交互。 语音识别技术应用的典型使用案例场景包 括: • 支持用户。消费性电子产品提供商应当考 虑在应用、智能手机、智能家居和汽车中 使用语音识别服务,使用许可技术在线/离 线为自己的设备工作,或者使用云服务来 丰富其设备和服务的体验与存在。 • 支持消费者。电话和联络中心应用的语 音识别使企业能够实现呼叫中心功能自动 化,如旅行预订、订单状态检查、票务、股 票交易、呼叫路由、查号服务、自动话务员 和姓名拨号。其他应用包括使用语音转文 字技术进行营销和商业交互。 • 支持员工。现有的企业应用开发人员应当 考虑使用语音识别和自然语言输入来简化 UI,提高生产力。从会议室支持、转录、销 售支持、语音访问,到分析和报告到免提 仓储和虚拟员工助理 (VEA) 使用案例,工 作场所中的语音转文字的使用案例越来越 多。此外,还有法律需要,例如 GDPR、合 规和编辑要求企业能够获得语音呼叫的文 字记录。 该领域的供应商通常可以大致分为两个阵营, 即通用平台和提供托管服务的专业平台。通用 平台倾向于涵盖多种语言并将通用语音作为 目标。专业平台提供量身定制的解决方案,旨 在将自定义词典及语义工具与 DNN 模型配合 使用,为特定业务环境和辞典提供出色服务, 减少歧义。 为大多数组织进行语音转文字工作不仅仅需 要激活现成的解决方案。各组织应当规划长 期的人员参与,以监控、培训和提高绩效,尤 其是围绕专有业务术语、方言和嘈杂/复杂环 境建模。 业务影响:与自然语言处理链的其他元素不 同,语音转文字(以及文字转语音)可被视为 一种独立的商品,其模块可以插入各种自然语 言工作流程中。 技术取得一系列突破之后,虽然发展速度有 所降低,但在基于边缘的语音转文字、使用语 义和 DNN 技术的混合模型以及 GPU/TPU 硬 件等领域仍然存在有规律的创新和改进。这 些收益主要是由深度学习推动。采用卷积神 经网络 (CNN)、长期短期记忆 (LSTM)、递归神 经网络 (RNN) 等技术。此外,使用链接时序分 类 (CTC) 损失的端到端神经架构(由百度支 持)正在改善培训模型的时间。 谷歌、苹果和微软等科技巨头也从消费者的 选择加入计划中收集了大量的培训数据,这 种持续循环的培训数据和改进的算法将使语 音转文字问题成为未来两年要重点解决的问 题。对于希望将此技术深入到其业务中的组 织而言,专为垂直行业设计定制语言模型的专 业供应商将变得至关重要。 好处评级:具有变革性 市场渗透率:超过 50% 的目标受众 成熟度:成熟主流 供应商举例:亚马逊、百度、谷歌、科大讯 飞、IBM、智能语音、微软、NICE、Nuance 75
76. 附录 图 3. 2017 年智能机器技术成熟度曲线 资料来源:Gartne(r 2017 年 7 月) 76
77. 77 技术成熟度曲线阶段、好处评级和成熟度 表 1. 技术成熟度曲线阶段 阶段 创新萌芽期 期望膨胀的顶峰期 泡沫化的底谷期 稳步爬升的光明期 实质生产的高峰期 获得主流采用的预期年数 资料来源:Gartne(r 2018 年 7 月) 定义 突破、公众展示、产品发布或其他活动引起了媒体和行业的极大关注。 在这一过度热情和不切实际预测的阶段,技术领导者大力推进的一些列宣传活 动将带来某些成功,但随着技术被推到极限,更多的会是失败。唯一盈利的企 业将会是会议主办机构和杂志出版商。 由于技术不符合过于膨胀的期望,其将快速过时。除了一些警示故事,媒体的 兴趣消失殆尽。 日趋多样化的组织集中试验并付出辛勤的努力,促使人们对技术的适用性、风 险和好处有了真正的了解。现成的商业方法和工具简化了发展过程。 技术的实际好处得到证实和认可。随着第二代和第三代工具和技术的出现,它 们的稳定性日益提高。越来越多的组织对风险降低感到满意;采用率快速增长 的阶段由此开始。约 20% 的技术的目标受众已采用相应技术,或者正在采用进 入该阶段的技术。 技术达到实质生产的高峰期所需的时间。 77
78. 表 2. 好处评级 好处评级 具有变革性 高 中 低 资料来源:Gartne(r 2018 年 7 月) 定义 催生在各行各业运营业务的全新方式,使行业动向产生巨大的转变 催生执行横向或纵向流程的全新方式,使企业的收入大幅增加或成本显著降低 使既定流程实现渐进式改进,增加企业的收入或降低成本 略微改进了流程(例如,用户体验改进),难以增加收入或降低成本 表 3. 成熟度 成熟度 初具雏形 新兴 未成熟 早期主流 状态 • 在实验室中 • 由供应商实现商业化 • 由行业领导者试验和部署 • 发展技术能力并提升对流程的了解 • 吸引早期采用者以外的对象 • 技术可靠 • 供应商、技术和采用率快速提升 成熟主流 • 技术强大稳定 • 供应商或技术没有多少进步 遗留问题 • 不适应新的发展 • 迁移成本限制更换 过时 • 很少使用 资料来源:Gartne(r 2018 年 7 月) 产品/供应商 •无 • 第一代 • 价格较高 • 涉及较多的定制 • 第二代 • 定制功能较少 • 第三代 • 更多创新的方法 • 几家主要的供应商 • 专注于维护收入 • 仅限二手/转售市场 78
79. 依据 该备注的依据源自: • “预测:全球人工智能的商业价值,2017 年 - 2025 年” • Gartner 2018 年 CIO 调查采访了 3,138 人。 • Gartner 2018 年人工智能消费者认知采访了 4,019 人。 • Gartner 搜索分析。 • Gartner 客户端查询分析。 资料来源:Gartner Research Note G00357478,S. Sicular、K. Brant,2018 年 7 月 24 日 79
80. 人工智能赋能新时代 80