锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

(转)高盛报告:人工智能、机器学习和数据将推动未来生产力的发展

时间:2022-11-18 02:30:00 fti传感器tesco顶驱传感器

人工智能、机器学习和数据将促进未来生产力的发展

http://note.youdao.com/share/index.html?id=9874d468e9dece80bcc23819232438fd&type=note&from=timeline&isappinstalled=0#/

人工智能是信息时代的尖端技术。在最新的创新介绍系列文件中,我们研究了如何将机器学习和深度学习的进步与更强大的计算和不断扩大的数据库相结合,为跨行业公司带来人工智能的变化。人工智能服务的发展可能会开拓新的市场,破坏云计算的竞争环境。 我们相信,如何更好地利用人工智能将成为公司未来几年竞争优势的决定性因素,并将带来生产力的复苏。

目录

投资组合经理总结………………………………………………3
人工智能是什么?…………………………………………….. 8
价值创造的关键驱动力………………………………………10
未来促进生产力……14
人工智能与生产力的悖论:采访Jan Hatzius…..17
生态\云服务\开源人工智能投资周期的受益者.. 20
农业………………………. 43
金融………………………..53
医疗保健…………………63
能源………………………. 82
推动者…………………….90
附录………………………. 97

投资组合经理总结
人工智能(AI)它是信息时代的先进技术。从人类告诉计算机如何操作到学习如何独立操作是计算机操作领域的一个巨大飞跃,对每个行业都具有重要意义。虽然这些投资和新技术现在可能被视为人工智能冬季前最新一轮的承诺和失望,但它们至少将留下机器学习生产的有形经济效益。
与此同时,人工智能和自动驾驶已经上升到流行文化甚至政治话题的前沿,但我们过去一年的研究让我们相信,这不是一个错误的开始,而是一个拐点。本报告将深入探讨这一拐点,从明显的越来越快的计算和数据爆炸到更微妙的深度学习,显著提高专业硬件和开源的兴起。
更令人兴奋的人工智能拐点之一是,现实世界的使用案例随处可见。深度学习不断提高计算机视觉和自然语言处理技术,大大提高苹果Siri,亚马逊的Alexa人工智能不仅仅是谷歌图像识别的技术。大数据集与强大技术的结合创造了价值,也获得了竞争优势。
例如,图像识别技术可以提高癌症诊断的准确性。农民和种子生产者可以利用深度学习技术提高作物产量。对药物发现进行深入学习。勘探效率和设备可用性在能源领域逐步提高。在金融服务中,通过打开新的数据集,成本降低,收入增加,分析速度比以前快。人工智能运用良好,处于非常早期的阶段。通过基于云服务的必要技术,我们相信创新浪潮的创新将滚滚而来,在各行各业创造新的赢家和输家。
人工智能的广泛适用性也得出结论,它是一种针式移动技术,为全球经济和生产力提供驱动力,结束美国生产率增长的停滞期。根据高盛首席经济学家的说法,Jan Hatzius目前,我们的框架停滞在资本深化及其对美国生产力的影响上。我们认为,人工智能技术驱动的生产力提高将类似于20世纪90年代,推动企业投资更多的资本和劳动密集型项目,加快发展,提高盈利能力,扩大股权估值。
启示
虽然我们看到人工智能影响了每个公司、行业和细分经济的时间,但对投资者的启示最为明显。
生产力。人工智能和机器学习可能会引发循环生产率增长,有利于经济增长、企业利润、资本回报和资产估值。根据高盛首席经济学家的说法,Jan Hatzius原则上,人工智能似乎更准确地捕获数据,降低高附加值生产类型的成本和劳动力投创新浪潮相比,它降低了高附加值生产类型的成本和劳动力投资。例如,统计学家在商业部门为了节约成本而创新iPhone更好地捕获应用程序的多样性和可用性。在商业部,人工智能对成本结构有着深远的影响。我相信它将被统计学家接受,并将显示在整体生产力数据中。
先进的技术。人工智能的速度和机器学习的价值可能会扭转在构建数据中心和网络时更便宜的商品硬件的趋势。我们认为,这可能会大大改变硬件、软件和服务支出的市场份额。例如,在标准数据中心的瞬时计算中运行AWS工作负荷只需0.0065 美元每小时优化人工智能GPU成本为0.每小时900美元。
竞争优势。我们看到了人工智能和机器学习重组各行业竞争秩序的潜力。管理团队未能向受益于战略情报、生产收入和创造资本效率的竞争对手投资和传递这些技术风险。在第41页的插曲中,我们将研究如何在医疗保健、能源、零售、金融和农业领域发展这些竞争优势。
创建新公司。在过去10年人工智能和机器学习领域成立的企业中,我们确定了150多家私营公司(附录69-75)。虽然我们相信人工智能的大部分价值将积累在大公司的资源、数据和投资能力上,但我们希望风险资本家、企业家和技术专家将继续推动新公司的建立,反过来,推动实质性创新和价值创造至少是并购,尽管我们当然不排除人工智能谷歌Facebook”的出现。
在以下内容中,我们深入探讨了人工智能技术、历史、机器学习生态系统以及这些技术在行业和领先公司的应用。
人工智能是什么?
人工智能是一种科学和工程,使智能机器和计算机程序能够以通常需要人类智能的方式学习和解决问题。通常,这些包括自然语言处理和翻译、视觉感知、模式识别和决策,但应用程序的数量和复杂性正在迅速扩大。
在本报告中,我们将大部分分析集中在机器学习作为人工智能的一个分支,以及作为机器学习的一个分支的深度学习。我们强调了两点:
1.简单地说,机器学习是一种从例子和经验(即数据集)中学习的算法,而不是依赖于硬编码和预定义规则。换句话说,开发人员没有告诉程序如何区分苹果和橙子,算法被数据训练,并学习如何区分苹果和橙子。
2.深度学习的主要进展是当前AI拐点背后的驱动力之一。深度学习是机器学习的子集。在大多数传统的机器学习方法中,特征(即可预测的输入或属性)是由人设计的。特征工程是需要大量专业知识的瓶颈。在无监督的深度学习中,重要的特征不是由人类定义的,而是由算法学习和创建的。
很明显,我们并没有专注于真实、强大或通常的人工智能,以复制独立的人类智能,这通常是人工智能流行和流行的文化解释。虽然谷歌有一些潜在的突破,比如谷歌DeepMind的alphago该系统不仅击败了围棋世界冠军,而且使用了无人下棋的方式。我们专注于经济实体发展领域更直接的人工智能。
为什么人工智能发展在加速?
深度学习能力的重大飞跃一直是人工智能拐点背后的催化剂之一。神经网络和深度学习背后的技术框架已经存在了几十年,但在过去的五到十年里,有三件事发生了变化。
1.数据。越来越多的连接设备、机器和系统在世界各地创造了巨大的非结构化数据增长。随着数据量的增加,神经网络变得更加有效,这意味着机器学习可以解决数据量的增加。移动、物联网和成熟的低成本数据存储和处理技术(通常在云中)创造了数量、规模和结构的大规模增长。例如,特斯拉已经收集了7.8万英里的驾驶数据和另一辆每10小时100万英里通过它连接的汽车,蟑螂合唱团016美元14亿美元收购)有一个平台通信多个汽车制造商和电信公司。Verizon该公司在8月份也有类似的投资,宣布将收购Fleetmatics,车辆远程传感器通过无线网络云软件连接越来越快。5G只会加快数据的生成和发送。2020年前,年度数据生成有望达到44泽字节(万亿GB),根据IDC五年多的复合增长率达到141%,这表明我们正在应用这些技术。
图1:预计2020年前年度数据生成将达到44泽字节(万亿GB)

2.硬件更快。图形处理单元(GPU)低成本计算能力的再利用,特别是通过云服务,建立神经网络模型,大大提高了速度和精度,可以产生神经网络的结果。GPU并行系统结构更快地训练了机器学习系统和传统的中央处理单元(CPU)基于数据中心架构。使用图形芯片的网络可以使迭代更快,在更短的时间内进行更准确的训练。与此同时,微软和百度等专业硅的发展,正在使用现场可编程门阵列,训练有素的深度学习系统允许更快的推断。更广泛地说,自1993年以来,超级计算机的原始计算能力呈指数级增长(图2)。2016,一个高端的NVIDIA游戏中显卡PC拥有足够的计算能力已被列为2002年前世界上最强大的超级计算机。
图2:自1993年以来,超级计算机的原始计算能力呈指数级增长

业绩成本也大幅下降。NVIDIA的GPU(GTX 1080)提供9tflops大约700美元,这意味着它的每一个GFLOPS价格在8美分左右。1961年结合足够了IBM 从20世纪20年代到提供单一的服务GFLOPS需要超过9兆美元(通胀调整)。
图3:随着时间的推移,各单位计算的价格急剧下降

3.更好更广泛的可用算法。为了支持深度学习用例,更好的输入(计算和数据)驱动更多的算法研发。伯克利咖啡、谷歌等开源框架tensorflow,和火炬(用于脸谱网)允许开发者通过测试基础库复合个人贡献。拿TensorFlow例如,不到一年就成了GitHub最大最活跃的开发商合作网站。虽然并非所有的人工智能都发生在广泛可用的开源框架下(苹果在这一领域的秘密是众所周知的),但它们的可用性肯定加速了更先进的开源工具的发展。
看看周边
虽然本报告的重点是人工智能,以及公司如何发展这条路,但重要的是要意识到人工智能已经影响了我们的生活。
在线搜索。就在一年前,谷歌透露,它已经开始了大量的搜索rankbrain,谷歌搜索算法中最重要的三个信号之一是人工智能系统,它与链接和内容一起。
推荐引擎。Netflix、Amazon潘多拉利用人工智能推荐电影、优秀产品和歌曲播放。5月,亚马逊开放源代码DSSTNE,深度可伸缩的稀疏张量网络引擎,简称“命运”,它使用生产产品的建议,以便它可以超越语言理解和目标识别。
面部识别(facenet)和脸谱网(DeepFace)投入巨资开发必要的技术,确定近100%的准确性来识别照片中的面孔。1月份,苹果进一步收购Emotient,人工智能开始读取面部表情来判断情绪状态。显然,这些技术远远超过标记照片。
虽然有无数个人助理消费者的例子,比如苹果的Siri,信贷和保险风险评分,甚至天气预报,在接下来的内容中我们考察企业利用这些技术来加速增长,降低成本以及控制风险。这些技术和应用的速度本身也在发展,充其量是一个快照的时间,为公司和投资者在他们的竞争者中一路领先提供了方向。

什么是人工智能?
人工智能是描述计算机模拟智能行为的科学。它需要使计算机表现出人的行为特征,包括知识,推理,常识,学习和决策。
什么是机器学习?机器学习是人工智能的一个分支,它使计算机能够从数据中学习而不需要显式编程。为了提供简单的背景,一台计算机可以以编程来识别照片中的火车,但如果它看到只有一个对象的照片,类似火车(如博物馆内建一个旧火车,玩具火车),一台机器可能会错误地识别它作为一列火车。在这种情况下,机器学习将使计算机学习一大组火车的例子和对象,使其能够更好地识别实际列车(从而实现人工智能水平)。
机器学习有许多现实世界的应用。例如,Netflix使用机器学习算法来生成个性化的建议,为用户提供基于其海量用户行为数据,Zendesk使用客户交互数据来预测客户可能满意的倾向。
什么是神经网络?人工智能/机器学习的背景下的神经网络描述了一种类型的计算机体系结构,人工智能/机器学习程序可以建立在模拟人类大脑的结构上。它由连接在一起的节点组成,可以解决更复杂的问题并学习,就像人脑中的神经元一样。
图4:神经网络
多个隐藏层将是深度学习的特点

什么是深度学习?深度学习是一种机器学习,需要训练一个层次结构的“深层”的大型神经网络,每个层解决问题的不同方面,使系统能够解决更复杂的问题。使用上面给出的火车例子,深学习系统将包含不同层级,每一层标识不同的列车特性。例如,底层将识别对象是否有窗口。如果答案是肯定的,下一层将寻找轮子。下一步将寻找矩形车,等等,直到层集体确定图片作为火车或拒绝假设。深度学习作为一种提高机器学习能力的方法已经越来越受欢迎,技术的进步开始允许大神经网络的训练。
什么是监督学习?什么是无监督学习?监督和无监督学习是机器学习的两种类型。在监督学习中,系统给出了一组“正确答案”的例子,根据这些例子,系统将根据正确的答案学习并正确地预测输出。监督学习的实际应用包括垃圾邮件检测(例如,系统可能有一堆标记为“垃圾邮件”的电子邮件,学会正确地识别垃圾邮件)和手写识别。在无监督学习中系统没有给出正确的答案,但有未标记的例子,留在自己的发现模式。一个例子包括将客户按一定的特征(例如购买频率)进行分组基于从一组大客户数据发现的模式。
机器学习有哪几种?
l 分类。将电子邮件分类为垃圾邮件,识别欺诈,面部识别,语音识别等。
l 聚类。比较图像,文本或语音找到类似的项目,确定集群的异常行为。
l 预测。基于Web活动和其他元数据预测客户或员工流失的可能性;基于可穿戴数据预测健康问题。
什么是一般的,强大的或真正的人工智能?一般的,强大的,或真正的人工智能的术语用于机器智能,充分复制人类的智慧,包括自主学习和决策。虽然全脑仿真技术服务于通常意义的人工智能目标,所需的计算能力的金额仍然远远超出了目前的技术,这使一般的人工智能在很大程度上仍然停留在理论阶段。

价值创造的关键驱动力
我们相信,人工智能主题相关的利润池创建(和销毁)分析最好首先通过四个关键输入:人才,数据,基础设施和硅。这些投入也有双重障碍。
人才
人工智能(特别是深度学习)很难。我们与风投和公司在空间里的对话,造成了大型互联网和云计算厂商中的人才短缺和人才之间的竞争,如图5。人工智能人才有极大的需求,并购化仍然获得必需的人才的一种常用手段。随着技术和工具的成熟,人才可能成为一个瓶颈。然而,我们相信人才将迁移到有趣的,差异化的数据集。由于这一点,我们相信大差异化的数据集是最有可能的驱动增长和利润提高,我们迈入了以人工智能为中心的世界。
图5:并购推动人工智能人才稀缺化

数据
数据是人工智能的关键输入。深入学习的有效性与较大的数据集特别相关,较大的数据集防止模型变得过度拟合。例如,麻省医院放射科和哈佛医学院的研究人员使用卷积神经网络来识别CT图像,根据训练数据大小评估神经网络的准确性。随着训练规模越来越大,精度提高(图6)。
图6:医学成像(部分身体图像识别)
培训规模与精度相关:0=最不准确,100=最准确

现在大多数学习是监督或半监督,这意味着所有或一些用于训练模型的数据必须被人所标记。无监督机器学习是目前人工智能的“圣杯”,因为原始的未标记数据可以用来训练模型。广泛采用深度学习可能会与大数据集的增长(这是发生在移动和物联网)和无监督机器学习的进展相挂钩。然而,我们相信大分化的数据集(电子健康记录,组学数据、地质数据、气象数据等)将有可能成为下一个十年的利润池创建的一个核心驱动力。
信息量在全球范围内预计将以36%的年复合成长率增长,根据IDC的预测到2020将达到44泽字节(440亿GB)。越来越多的连接设备(消费者和工业),机到机通信和远程传感器的结合,用来创建大数据集,从而理解和训练自适应算法。数据的可用性在过去十年也急剧增加,普查,劳动,天气,甚至基因组等大量数据在线免费。
我们也看到卫星图像的可用性,这需要大量的计算和充分分析。美国地质调查局Landsat 7卫星和Landsat 8卫星每8天勘测整个地球图像,美国地质调查局让这些图像免费,即使压缩后超高清晰度的图像也大约有1GB那么大。其他公司,如轨道洞察在聚合图像数据,并在多个行业创造商业解决方案。
基础配件
硬件和基础软件对人工智能而言是必要的。我们认为支持人工智能的基础配件将迅速商品化。这种观点是基于以下两点提出的:1)云计算供应商很好地拓展他们的产品,以进入人工智能基础配件领域,2)开源(TensorFlow、、火花,等等)已经成为人工智能软件创新的主要驱动力。为了鼓励人工智能,我们相信大型云厂商将继续增强开放源代码基础配件的能力,限制潜在的利润池创建。
图7:互联网巨头(如谷歌)正在通过开源技术推动人工智能(如Tensorflow)


深度学习的GPU再利用已经成为我们当前的“人工智能的春天”的关键驱动因素。在人工智能/机器学习生态系统,有两个主要的应用程序,确定每个需要不同资源设置的神经网络的性能。首先是一个训练算法的构造和使用。训练算法利用一个大的(通常是更大的,更好的)数据集发现相关性,并建立一个模型,给定一个新的输入就可以确定输出的概率。培训是资源密集型的,最现代化的培训是基于GPU的供电系统的。
训练的模型和算法的使用称为推理。推理需要极少的计算能力,通常通过更小的,增量的数据输入集。而一些GPU优化推理(例如NVIDIA的P4系列和M4系列)给出推理的单一目的性,专业的硅因专门的应用程序而开发,称为FPGAs(现场可编程门阵列)和ASIC(专用集成电路)。这种集成电路最初是为原型的CPU开发的,但越来越多地用于人工智能推理。谷歌的张量处理单元,是一个ASIC专用的人工智能和机器学习的例子。微软也一直使用FPGA芯片推理。英特尔2015年收购FPGA的制造商——Altera公司,2020年之前,三分之一的数据中心可以利用FPGA做专业用途。赛灵思率先在上世纪80年代商业使用FPGA,指出了云计算和大数据中心是公司增长和前进的重要途径,也宣布了与百度的战略客户关系。数据中心中在Xilinx公司的目前收入中约占5%。
图8:人工智能变革:1950年-现在

推动生产力的未来
在过去十年的缓慢增长和上世纪90年代中后期显著增长后,美国的劳动生产率增长近年来停滞。我们相信,机器学习和人工智能的发展已经戏剧性地改变了全球产业的潜在生产力,在某种程度上类似于上世纪90年代的互联网技术大范围运用的影响。
在所有行业中,我们看到了自动化让劳动小时约减少了0.5% - 1.5%,人工智能/机器学习技术提高了效率,2025年前能达到+ 51-154个基点的生产率增长。我们希望A人工智能/机器学习随着时间的推移提高生产力的分子和分母,我们认为最重要的早期影响是低工资的自动化工作–驱动类似水平的产出增长的自动化向较少的劳动时间发展。人工智能/机器学习驱动改善97个基点就意味着2025年技术对生产力增长的贡献为1.61%,或者比 1995-2004年高11个基点(图9、10)。
图9:生产力分析
百万美元,假定名义名义GDP增长超过2019

科技和生产力增长
上世纪90年代的科技繁荣让我们看到了生产力的两个主要组成部分的异常扩增,资本深化以及多因素生产率(MFP),与上升的股票估值密切相关。
资本深化。高盛经济学家Jan Hatzius提供了最近的反周期趋势资本深化(每劳动小时的资本存量),历史上往往在扩张时期没有资本存量的时候劳动时间增加(见Jan的报告:“生产率悖论v2.0重游”,发表于 2016年2月9日)。在上世纪九十年代,资本深化明显增加,突出了典型的资本投资增加超过经济增长的劳动力市场。
多因素生产率(MFP)。2013年3月,由David Byrne等人进行的联邦储备研究表明,上世纪九十年代技术同时扩散到IT生产和一般业务流程有助于创造三倍的增长(每劳动时间的产出),从1995年到2004年期间IT生产部门贡献了最多的年平均增长达49%的年生产率增长(图10)。
图10:90年代后期:生产部门贡献了近一半的生产力增长
失去价值,在科技繁荣中增长

千年停滞。在过去十年中,与IT应用(计算机硬件,软件和电信)相关的资本深化增长停滞不前。相对于更广泛的市场资本,IT资本对这一组成部分的总体增长的贡献比在科技热潮期间甚至在之前的平均贡献更小。总劳动时间一直在增加,但资本强度对生产力的贡献大大低于20世纪90年代。引入越来越复杂的消费性机器学习和人工智能可能是使资本强度回到之前的催化剂,在我们看来,显著提高劳动生产率,类似于我们在20世纪90年代看到的循环。
我们在MFP方面更加乐观。 高盛经济学家已经强调(生产力悖论v2.0重新审视2016年9月2日),ICT价格的向上偏差和对未货币化产出(免费在线内容,后端流程等)的投入增加,增加了对实际GDP和生产率增长的低估。脸谱网和谷歌这样的互联网巨头的演变表明:复杂的投入劳动力和资本不一定转化为标准生产力指标中传统消费品的货币化。
人工智能/机器学习诱导生产力从而可能影响投资
我们认为,人工智能/机器学习提高生产力的潜在影响之一可能是公司分配资本的方式的转变。 自2011年中期以来,股息和股票回购的增长已显著超过资本支出增长,因为管理团队对基建项目投资仍处于经济衰退之后的不情愿的态度。

生产力的提高有可能重振管理的信心,鼓励公司类似于20世纪90年代那样投资生产资本,其中由我们的高盛资本开支跟踪器衡量的年度资本开支增长一直超过由耶鲁教授罗伯特•希勒教授的标准普尔500分析得到的年分红增长(图11)。我们进一步相信,投资者会在生产力提高的情况下重视这种转变。在资本支出投资和相关生产率增长期间,经周期调整的市盈率经历了显著的通货膨胀,而目前的估值刚刚达到了衰退前的水平(图12)。

人工智能和生产力的悖论:专访Jan Hatzius
高盛互联网研究分析师Health Terry和首席经济学家Jan Hatzius讨论了人工智能和机器学习对提高滞后劳动生产率的作用。
Health Terry:在过去的十年中,什么导致了生产力增长的不足?
Jan Hatzius:一个好的起点是20世纪90年代,在那时我们有一个相当规模的的生产力加速,主要是技术驱动。科技部门的规模越来越大,科技产出增长速度非常快,这足以使经济整体加速增长。最近,或在过去的10年左右,我们已经看到了生产增长率又一次减速,低至20世纪70年代和80年代的水平,甚至可能更低。
我认为不止一个驱动力,但我认为有三个因素阻碍了生产力增长。一个是周期性的影响。我们在经济衰退中仍有一些后遗症,资本积累速度相对缓慢,投资水平相对较低,就业增长相对较快。由于生产力是衡量每工作小时的产出,当劳动力市场正在迅速提高你可以有较低的生产率时意味着有点反常。
另一个因素可能是技术进步的总体速度有所放缓。我们有理由相信,上世纪90年代,随着互联网的引入,技术进步的时间相对比较快,我认为现在有点慢了,这也是有根据的。
第三点是,在过去十年中发生的技术进步,如以移动和消费者为中心的技术,是在数量上统计人员难以捕捉到的。原因是,在过去十年左右的时间里许多新技术的质量改进是很难定量的。统计学家们并没有在许多处于前沿的领域进行显著的质量改进。
所以我会指出三点。有周期性的影响,还可能是一些技术进步放缓,此外极有可能在生产力统计时候的测量误差增加。
Terry:回首20世纪90年代的生产力繁荣,技术发挥了什么作用?
Hatzius:推动这一切的主要是通用技术,如半导体和计算机,它们比20世纪70年代或20世纪80年代所占的经济份额大得多,因为那时候技术进步非常迅速,统计学家们很好地测量了这些技术。在上世纪90年代,统计学家们做了很多努力来较快地捕捉质量提高;处理器的速度,更大的内存,电脑硬件更好的属性,这导致在技术部门测量的贡献大幅增加。技术部门从上世纪90年代早期开始加速生产增长,持续到新世纪头十年中期。
Terry:我们已经在过去的10到15年里看到了很多技术的发展。为什么没有产生像iPhone、脸谱网和云计算这样的技术对生产力类似的影响?
Hatzius:我们没有一个完整的答案,但我认为答案的一个重要部分是衡量质量改善的统计能力的提升,新产品对经济统计的影响是有限的。衡量名义GDP比较容易,基本上就是增加收入的问题。几乎所有的东西都有测量误差,但是我没有真正一级关注,因为在衡量名义GDP方面,测量变得越来越差。通过采用调整后的物价指数来紧缩把名义GDP转换成实际GDP是很难的。你看,例如,在软件行业,如果你相信官方的数字,用1000美元的经费能买到的现在的软件和上世纪90年代能买到的一样。软件行业的货币没有升值。这很难令人相信。甚至都通不过气味测试。由于捕获这些质量改进存在困难,事实上,技术部门由通用硬件越来越多地转向专用硬件,软件和数码产品也会导致低估和估算误差。
Terry:人工智能和机器学习等技术的发展对生产力有什么影响?
Hatzius:原则上,它似乎在某种程度上比统计数据更好地捕捉到上一波创新,人工智能降低了成本,减少了劳动力投入到高附加值生产的需要。在商业部门的成本节约创新是统计学家设立起来为了更好地捕获信息,例如增加的应用程序的多样性和可用性的iPhone。在人工智能对商业部门的成本结构有广泛影响的程度上,我有理由相信,它将被统计学家所接受,并且会出现在整体生产力数据中。我只想警告一点,那就是美国的经济非常大。即使在一个经济部门中很重要,甚至是压倒性的力量,在你划分18万亿美元(这是美国名义GDP水平)时通常看起来不那么重要,所以百分比贡献可能不从底层的角度来思考。但原则上,这是可以产生显著影响的事情。
Terry:你谈到了对成本的影响,那怎么影响定价? 这是否会成为我们在某些经济部门看到的更广泛的通货紧缩力量的贡献者?
Hatzius:我当然认为,在生产力提高方面,第一阶段的影响往往是降低成本和降低价格。保持一切不变的意思是降低整体经济的通货膨胀。通常这不是你想保持一切不变的正确假设。有经济决策者和有联邦储备委员会,如果影响很大,那么美联储将采取更容易的货币政策,使得不再在受人工智能影响的地区工作的人在别处能找到工作。美联储这样做可能有非通货膨胀的运行空间。从长远来看,我们一般不认为成本节约的创新会导致失业率上升或通胀大幅下降。在短期内可能是后果,但在长期来看,当政策作出反应时,经济最终会出现类似的失业和通货膨胀水平。
Terry:这些主题出现:人工智能工作或机器人接管劳动,你认为在一段时间内是不合法吗?
Hatzius:这些恐惧已经存在多年了,我认为我们可以说的一点是,到目前为止,他们还没有真正得到证实。如果我们回到19世纪初,人们担心机械化的纺纱机,这种想法会使大量的人失去工作。 在短期内,这种中断可以产生重大影响。历史上的技术进步导致了更高的失业率。但情况并非如此。我最好的猜测不是最终会有更高的失业率,因为最终人们会找到需要人类和人类劳动的东西。我的预期是,这可能是动荡的影响,但我不认为这会让我们失业率更高。
Terry:在过去十年中,我们看到企业利润越来越多地归于回购和股利,超过了资本投资。 从宏观经济的角度来看,是否存在一个阈值,生产率需要推动投资和资本吗?
Hatzius:投资和生产力是联系在一起的,因果关系是双向的。 近年来,我们的投资水平相对较低,主要是周期性原因,因为经济仍然有大量的剩余产能,在大衰退后资本存量不足。 没有强大的经济激励来投资新产业。 我认为在慢慢修复,我们已经看到投资率在上升。在未来几年中,商业投资对生产率增长的贡献比2010年和2011年有所增加。另一个方面,生产率增长是投资的主要驱动因素, 这取决于在前沿领域中的新发现。如果保持下去,那么还将有一个激励性的投资。
Terry:当我们看到生产率在历史上有所增长时,通常如何影响企业利润? 当公司寻求竞争优势或者我们实际上看到盈利能力的持续增长时,成本是否只转移到收益表的另一部分?
Hatzius:我对历史证据的看法是,最初生产率提高回落到公司的最低水平,但因为更多的参与者最终这些高回报遭到淘汰。 它可以持续一段时间,但在长期,如果市场机制运作,它将被竞争淘汰。
Terry:在我们看到技术驱动的改进和效率的程度上,你倾向于认为资产估值有什么影响? 在90年代,我们看到了一个与你正在谈论的生产力相关的市场反应,这样的东西有可能重复,让我们看到这种生产力改善人工智能和机器学习?
Hatzius:就整体经济而言,我认为如果你有证据表明生产力持续再加速,而且如果你发现近年来出现的许多恐惧,是由于于这种生产率的低速增长速度,我想你可能会看到股票价值的重估。
特别是,保持一切相同,我们发现生产率增长更快的时期也意味着资产估值更高的时期。 如果我们看看20世纪90年代,情况确实如此。发展到这个时期的尽头确实会有大泡沫,后果相当痛苦。这些事情可能是暂时的,但我认为我们通常会看到重估。

生态系统:云服务,开源是未来人工智能投资周期的主要受益者
我们相信,利用人工智能技术的能力将成为决定未来几年在所有主要行业的竞争优势的主要因素之一。虽然该战略会因公司规模和行业而不同,管理团队不专注于在人工智能领先,受益于产品创新和劳动效率,资本杠杆风险不作考虑。因此,我们认为,企业需要投资这些新技术以保持竞争力,将拉动对人工智能的人才、服务和硬件需求的增长。
作为对比,上世纪90年代的科技驱动的生产力繁荣推动了相应的繁荣。在技术上增加资本支出使得业务增加来衡量这笔资本支出。软件、硬件和网络公司不可避免地进行行业整合。下图突出显示软件行业的这个模式。通货膨胀调整后的市值在2亿美元到50亿美元间的公公软件公司的数量在1995-1999年期间增长了近两倍,在新世纪头个十年中期巩固之前。
图13:在快速增长的同时实现生态系统生产力的繁荣

图14:风险资本投资在这十年有曲折变化

我们看到潜在的与即将到来的人工智能驱动生产力的周期相关的热潮,随着企业投资人工智能,价值创造在跨软件,硬件,数据和服务供应商实现。正如图14强调的一样,VC资金进入人工智能相关的初创企业在这十年有较大的变化。企业人工智能投资未来繁荣的潜力也开始推动整合。特别是云平台已经在智能人才投入巨资,与谷歌、亚马逊、微软和Salesforce自2014年来联合进行17个 人工智能相关收购(图5)。
我们在与历史技术时期比较中也看到了一些人工智能和机器学习技术的发展的好处。在过去的50年主要技术周期中,计算(穆尔定律)是抑制剂和进步的推动者。例如,在系统架构中,我们目击了从大型机系统开始的演变之后,就将其转交给了客户端服务器模型,并且最近已经开始被云/移动模式取代的时代。这种演变的驱动因素是计算以及存储容量的提高,它的每个转变都伴随着应用程序的变化,包括各种新的编程语言的出现和演变(见图表15)和可能的应用类型。在上下文中,AI概念已经存在了几十年,比如20世纪60年代出现的概念神经网络,虽然它的计算能力不足以允许直到最近几年的任何实际使用情况。我们相信我们在早期的AI平台,类似于初始商业化的大型机在20世纪50年代和智能手机和21世纪的云的商业化。还有平台曲线弯曲成(我们认为发生的)一个爆炸应用程序,工具和服务启动器的情况,我们将在下面更详细地讨论。
图15:AI进展可以与系统中的历史技术演变相比较,虽然我们相信还在早期发展和采纳阶段,但是架构和编程语言的采用已经初见端倪。

推动者正在沿着三个平面发展:DIY,服务和AI-aaS
如下面章节所述,我们开始看到领导者和投资出现在这三个平面:
1.自我实现 - 具有才能和差异化数据的企业可能在机器学习能力上大量投资。 为了支持这些努力,我们正在目睹一个新的“AI堆栈”的出现。 AI堆栈具有类似的组件:历史计算堆栈:硅,存储,基础设施软件,数据处理引擎,编程语言和工具。 因为通过下面,我们将发现AI堆栈的输入主要是开源(来自提供者)的组合,如Databricks,Cloudera,Hortonworks和Skymind)和服务提供云平台如微软,谷歌,亚马逊和百度。
2.咨询服务 - 许多组织将有独特的数据库为内部使用,以及为客户和合作伙伴构建AI服务。 因为AI人才是目前稀缺的资源,专业服务提供商正在出现以帮助弥合差距。 IBM,结合垂直和域特定服务专业知识以及其沃森集团内的技术专长。早期的领导者在这个市场。 较新的模型也正在出现。 Kaggle,作为示例,连接组织与成千上万的数据科学家,以帮助解决人工智能的相关问题。
3. AI-a-a-service(AI-aaS) - 在我们称为AI-aaS的类别里,我们看到很大的潜力和最新的市场创造。 AI-aaS很可能在多个方面有所发展,但核心思想是:深度学习系统,许多企业将改为接受经过培训的深度学习系统而不是培训自己。 AI-aaS的一个例子是用图像和谷歌API启动Clarifai。由于谷歌的大集合的图像和AI人才,公司不太可能能够训练图像识别模型比Google更准确。相反,开发人员使用图像应用程序中的识别将每次调用Vision API图像在应用程序中需要识别。类似的AI-aaS产品可能是由具有独特水平的SaaS供应商(如Salesforce.com)开发数据集(如销售数据),面向数据和人才的创业公司是稀缺的(医学成像是一个例子),和有公司可能对供应商,客户或合作伙伴有价值的差异化数据。
DIY:云平台和开源可能是人工智能的精选
机器学习(特别是深度学习)仍然处于创新者或者说是早期,市场的采用者细分市场与人工智能的快速进展相比。 基于与公司和VC在空间讨论,我们认为人工智能/机器学习被大量使用,由互联网公司,以行业为中心的服务提供商(如Broad研究所)和更大的财富500强组织的尾巴(新兴用例突出显示在我们的工业小插曲)。
今天采用方面的最大障碍是数据和人才。但是,随着企业的到来,更好地通过物联网的数据收集和内部生成机器,以及客户数据和外部数据服务提供商的数量增长,数据采用障碍可能变得不那么令人生畏。 另外,作为人工智能/机器学习,学习技能差距扩大,大学毕业生结合相关技能,通过人工智能/机器学习,人工智能/机器学习咨询公司的培训,以及使过程自动化的更好的工具,可能出现填补空白。这是网络,是我们相信大多数大型企业(或较小的,以数据为中心的企业)可能最终至少进行实验人工智能和深度学习。
由于在空间创新的步伐和技术发展的前景还不甚明朗,机器学习的渠道仍然非常分散。然而,新兴的“AI堆栈”与大型机,客户端服务器和当前时代分析中的分析具有相似之处和开发堆栈。正如下面“堆栈演化”图中所强调的那样栈的组件从工具到语言,到存储仍然存在于当下。
AI堆栈和现有技术变化之间的主要区别在于:大部分机器学习的渠道严重依赖由云平台供应商提供的开源技术和服务。 这种转变的驱动力是多重的,但包括按需计算和存储处理大量数据。微软,亚马逊和谷歌等云服务提供商的投资机器学习服务,以大开源为标准的开源,企业买家为了避免供应商定并降低成本。
编码的演变以及它如何翻译成AI
Blue =专有供应商,Orange =开源,Green =云服务(注意:一些供应商,如IBM和Microsoft包括专有和云服务

GPU重用的深度学习是我们当前“AI春天”的主要驱动因素之一。在人工智能/机器学习生态系统中,有两个主要应用程序确定神经网络的性能,每个神经网络需要不同的资源设置。 第一个是构建和使用训练算法。 训练算法利用大的(通常是更大,更好的)数据集来找到相关性并建立一个模型,该模型可以在给定新输入的情况下确定输出的概率。培训是非常资源密集型的,大多数现代培训是在GPU供电的系统上完成的。
一旦他们已经被训练,使用模型和算法被称为推断。推断需要少得多的计算能力,并且通常梳理通过更小的增量数据输入集。给定推断的单一目的性质,专门为该应用开发专用硅,称为FPGA(现场可编程门阵列)和ASIC(专用集成电路)。这种类型的集成电路最初是为原型CPU开发的,但是越来越多地被用于人工智能的推理。Google的Tensor处理单元是专为人工智能和机器学习专门构建的ASIC的一个示例。 微软也一直在使用FPGA芯片进行推理。 I英特尔于2015年收购了FPGA制造商Altera,因为到2020年,三分之一的数据中心可以利用FPGA实现特殊用途。
公司看点:NVIDIA,Xilinx,Google,Intel(通过Nervana)

鉴于在内部和内部建立真正的AI或ML能力的成本 ,以及来自公共云提供商的改进选项,我们认为相对较少的企业将选择构建内部部署解决方案。这为Databricks(在云中提供Spark以及支持机器学习过程的一些工具)以及主要云平台提供商等提供商创建了一个开放环境。
来自主要平台提供商的产品具有可比性,但存在一些关键差异,一个解决方案或另一个更适用于特定的使用情况。尽管有许多供应商提供基于GPU的云产品,但我们的分析集中在那些具有最大扩展能力的产品,以及那些在与用户的对话中被频繁引用的产品。除了下面讨论的内容,Nvidia还列出了其GPU云计算合作伙伴:Aliyun,Outscale,Peer 1 Hosting,Penguin Computing,RapidSwitch,Rescale和IBM SoftLayer。
亚马逊AWS。亚马逊的P2似乎(至少是在纸上)最主要的公共云提供商提供的最强大的基于GPU的实例。 最大的包括64个CPU核心,16个Tesla K80 GPU,732 GiB内存,预留实例价格为6.80美元/小时。P2.16xlarge包括我们可以找到的最近的竞争对手提供的4倍的GPU。除了原始实例,AWS还提供Amazon Machine Learning,一种用于生成ML模型并在云中执行训练和推理功能的托管服务。亚马逊ML包括AWS集成,数据可视化,模型评估和解释工具,建模API,常用用例的预构建算法,数据转换和用于批处理和实时预测的API。
微软Azure。微软推出了新的N系列作为其最强大的基于GPU的实例。虽然目前只提供预览,广告内容包括24核,4 Nvidia Tesla K80 GPU,224 GB的内存和1.4TB SSD磁盘。定价范围大致取决于所选择的操作系统,从2.25美金每小时的Linux到11.66美金每小时的SQL Server。 Azure机器学习也被作为Cortana智力的保护下的管理服务营销套件,具有类似于AWS的功能和工具。
Google云端平台(GCP)。Google目前正在针对Cloud ML产品推出测试版。 尽管技术规格不像Azure或AWS中的实例那样容易公布,但我们的客户对话表明Google的平台(如果不是特别是Cloud ML实例)是高度先进的,为机器学习和人工智能使用提供了一个引人注目的平台。 Google利用其与DeepMind合作的技术及其在TensorFlow中的专业技术,提供全面的横向解决方案,如图像识别和翻译解决方案。
阿里巴巴。2016年1月,阿里巴巴的AliCloud宣布与Nvidia合作,推出中国第一个GPU加速的基于云的平台。更多详细信息缺乏,虽然公司和Nvidia都承认这种伙伴关系,并将使用Nvidia的Tesla K80 GPU。
图16:多个云供应商已经针对使用GPU加速的机器学习应用程序引入了实例
来自Amazon AWS和Microsoft Azure的人工智能/机器学习优化实例的技术规格和定价

特别是对于深度学习,大量的数据提高了机器学习模型的性能。许多行业的数据增长已经达到了拐点。 例如,在计算生物学中,今天的可用数据量据Broad研究所估计为200帕比特以上,并且比消费者网络数据增长得更快。 Petabyte规模数据通常在以下两种环境之一中进行评分:Hadoop集群(在HDFS中)或云对象存储服务(如Amazon S3)。诸如戴尔EMC部门(例如Isilon)等供应商的横向扩展存储解决方案也可能在某些环境中使用。但是,我们认为开源或基于云的存储服务可能会捕获创建的大量增量数据。 这主要是由于这些选项相对于本地专有备选方案的低成本以及在云中灵活地扩展和缩小使用的能力。
公司看点:Cloudera,Hortonworks,MapR,亚马逊(S3),谷歌(谷歌云存储),微软,IBM(云对象存储),戴尔/ EMC(Isilon,云对象存储)

消息,流处理和数据转换是机器学习管道的关键组件。训练模型时,在准备并馈送到神经网络或其他机器学习框架之前,将数据流传输到存储系统中。一旦创建了模型,来自传感器,网络或其他来源的“实时”数据被流式传输并准备好由模型进行分析,然后实时分析数据(图17)。历史上,ETL供应商(例如Informatica和IBM)和消息传递供应商(例如TIBCO)是流和流处理技术的提供者。 在过去五年里,情况发生了变化。在我们研究期间观察到的大多数机器学习环境中,开源解决方案(如Kafka,Storm和Spark)得到了大量使用。此外,还使用了诸如Amazon Kinesis和Google Pub/Sub之类的消息传递服务。
即使对于神经网络,数据需要准备。 例如,图像和文本被标准化为相同的大小和颜色(图像)或格式(文本)。 对于这些任务,可以编写自定义代码,或者可以使用Skyminds的DataVec等工具。
公司看点:Confluent(卡夫卡)、Databricks(Spark),Cloudera(火花流),Hortonworks(风暴,Spark Streaming)、亚马逊(运动),谷歌(云DataFlow)、Skymind(datavec),IBM(流)、微软(Azure数据流)。
图17:机器学习在生产中各种开源技术和云技术的应用管道

数据库/数据处理市场历来是最大和最有利可图的软件之一。例如,2015年,Gartner估计数据库市场规模为359亿美元。标准普尔(OCL)中规模最大的公司之一(市值大于1600亿美元)从其数据库产品中获得了大部分利润。在人工智能中,正在使用一组新的技术。首先,神经网络已经成为关键的数据处理技术。正如我们在“什么是人工智能”部分中解释的,神经网络通过节点处理输入数据以创建输出。例如,输入可能是电子邮件或图像,输出可能是“垃圾邮件”或“cat”。 到目前为止,神经网络的创建主要是通过使用各种框架(如Google TensorFlow或Caffe)的定制开发。云服务,如谷歌云机器学习也涌现,使开发人员和数据科学家能够在云中构建神经网络。
Spark作为处理技术的使用是我们与风险投资公司和公司讨论中的一个常见主题。Spark仍然是增长最快的开源项目之一(目前拥有超过10万个Github的明星),并且已经收到了来自IBM,Cloudera,Hortonworks和Databricks(其中有大部分是项目提交者)的大量投资。
公司看点:Cloudera(Spark)、Hortonworks(Spark),Databricks(Databricks),谷歌(谷歌云机学习),微软(Azure机器学习),Amazon(亚马逊机器学习),IBM(沃森)

人工智能和机器学习仍处于早期阶段。 这意味着定制开发仍然是创建生产应用程序和工作流的主要途径。机器学习和数据科学的语言是Python和R. Python还没有被货币化。在R生态系统中,微软(收购了Revolution Analytics)和RStudio(开源提供商)是主要的供应商。
图18:机器学习管道的主要开源项目
支持公司和适用性风险投资适用的项目

在分析的历史中,出现了工具,使企业能够从数据中提取价值,而不依赖于定制开发。 高级统计工具(如SAS研究所和SPSS),BI解决方案(如Microstrategy和Business Objects),报告解决方案(例如Crystal Reports)以及最近的数据可视化提供商(如Tableau)已经通过提高业务分析师的生产力, 供支持商业用途的数据科学家使用。
机器学习工具开始出现,加速了数据科学家的生产力。一个例子是微软的Azure机器学习解决方案,它为数据科学家创建一个拖放界面来创建机器学习工作流程。来自SAS的数据科学家关注的工具还提供工具,以支持开发和部署各种机器学习库。
公司看点:SAS(SAS Enterprise Miner)、画面、微软(Azure机器学习),亚马逊(亚马逊机器学习),谷歌(云机学习),Databricks。
咨询服务:货币化的技能差距
正如我们在本报告中提到的,人才仍然是机器学习采用的主要障碍之一。这创造了系统集成商的重大机会,如IBM、埃森哲和德勤。应用机器学习也提供了传统的技术供应商和大型咨询企业的机会(如IBM或者Teradata),去更有效地利用开源技术(通过咨询解决方案)。
在下面的图19中,我们描绘了机器学习人才的竞争。IBM,华为,埃森哲和德勤是最积极地雇用机器学习人才的公司。值得注意的是,由于机器学习人才仍然稀缺,较小的初创咨询公司很可能实现规模化。 在云计算中出现了类似的模式,出现了较小的咨询公司,如Appirio,Bluewolf和Fruition Partners(最终被大型IT咨询提供商收购)。
图19:IT服务提供商的机器学习招聘
LinkedIn招聘与“机器学习”

其他业务模式也正在出现,以缩小技能差距。 作为一个例子,Kaggle通过托管比赛来实现机器学习。数据科学家可以赢得奖金,练习“真实世界”数据集,构建机器学习组合。企业能够获得人才来解决问题,而不必大量投资于机器学习团队。
AI-aas:可能是创造新市场的最大驱动力
虽然我们预计许多公司将投资于DIY的人工智能,创造增长,我们看到在AI-aaS最有活力和新业务创造的潜力。 因为大型,独特的数据集是相对有限的,稀缺的人工智能人才可能合并到这样的数据集,在我们看来,这似乎不太可能,大量的企业在五年内建立自己的神经网络。 我们认为更可能的情况是,大量的AI服务提供商出现:1)可以访问唯一的数据集; 2)由于访问独特的数据集,吸引了创造人工智能服务增值服务所必需的人才。
AI-aaS产品通常通过API提供。 最基本的例子是一个开发者想要添加图像识别功能到其应用程序。开发者不是通过水平AI-aaS提供者(例如Clarifai,Google或Microsoft)访问Image API,而是获取大量数据集的图像并训练模型。当在应用中使用语音识别时,对云中的API进行调用,并且通过训练的机器学习模型来对图像进行分类。
图20:ai-as-a-service(AI-AAS)景观
机器学习API正在开发以解决水平和垂直用例

我们看到AI-aaS的市场至少沿着三个方面发展,如下面强调的和上面的图表20所示。
广泛的水平AI-aaS(图像,语音,文本等)
谷歌和微软都提供用于语音,翻译和图片识别的API,每月每千次API调用只需0.25美元(图21)。开发人员可以利用这些API将AI功能嵌入到他们的应用程序中。对于核心水平AI(如NLP和图像识别),我们认为大型云平台提供商处于最佳位置,因为他们拥有大数据集,能够实现更准确的AI服务,并能够根据实际消费者数十亿用户来优化其结果。
公司看点:谷歌,微软手表,脸谱网,IBM,Amazon,Clarifai,it.ai,Valossa
图21:水平AI-AAS产品的供给定价
云平台的AI AAS产品样本

狭义的AI-AAS(客户流失,员工保留等)
对于更重要的水平,如CRM(领先评分),人力资源(人才保留)和制造(预测性维护),我们认为SaaS供应商定位良好,因为SaaS供应商可以获得大量的差异化数据。Workday,Salesforce.com,Zendesk,Oracle,SAP和IBM是最终可以竞争狭义AI-aaS用例的供应商。我们谈到的大多数SaaS供应商都投资于数据基准测试和分析产品,认为他们的数据是长期进入的壁垒。
Salesforce已经成为机器学习人才最积极的收购者,在过去18个月发生4项人工智能相关收购(图5)。
公司看点:IBM、SAP、Oracle、Salesforce、Workday,Zendesk,HubSpot,Shopify,Ultimate Software,ServiceNow
垂直特异AI-AAS(医疗成像,欺诈预测,天气预报等)
垂直特定的AI即服务可能推动更多的多样性。大型行业巨头可以汇总数据,构建机器学习模型,并向合作伙伴,客户和供应商销售模型。初创公司可以在特定用例的垂直领域(如医疗成像)构建独特的数据集,并使医院网络能够访问API。零售或广告领域的行业联盟可以汇集数据,以更好地与更大的竞争对手竞争(例如,零售商可以汇集数据,更好地与亚马逊的推荐引擎竞争)。
IBM一直是医疗保健领域开发垂直特定AI-aaS能力的早期领导者。在过去两年里,IBM已经花费超过40亿美元收购了一些医疗保健技术和数据公司。 这些收购的结果是大量的医疗保健数据(IBM在其健康云中有超过3亿患者记录)。 通过这些医疗保健数据(以及通过合作伙伴收集的其他数据)及其收集的沃森技术,IBM开始提供针对肿瘤学,临床试验和基因组学使用案例的服务。 在医疗保健垂直行业,其他创业公司也采用类似的方法(如下面的图22所示)来解决医学成像,药物发现和诊断中的难点。
图22:医疗保健中的垂直AI-aaS

中国人工智能的现状
据艾瑞咨询,该国的人工智能市场估计将从2015年的12亿人民币增长到2020年的91亿人民币。 2015年,中国的人工智能(AI)大约流入了14亿元人民币(同比增长76%)。
在政府政策方面,中国国家发展和改革委员会(国家发展和改革委员会)与其他相关政府机构一起,于2016年5月18日发布了“互联网+人工智能”三年实施方案。实施计划阐述了六个支持人工智能发展的具体领域,包括资本融资,系统标准化,知识产权保护,人力资本开发,国际合作和实施安排。该计划的目标是到2018年在中国建立基础设施和创新平台,行业系统,创新服务体系和人工智能的基本行业标准化。发改委预计,中国人工智能行业将与国际发展同步,引领全球市场人工智能技术的应用。
中国已经采取了重大举措,提及“深度学习”或“深层神经网络”的期刊文章数量,中国在2014年超过了美国(图23)。中国的人工智能研究能力也令人印象深刻(图24),因为具有世界领先的语音和视觉识别技术。2015年11月由百度开发的Deep Speech 2能够达到97%的准确性,被MIT Tech Review评为2016年前十大突破性技术之一。此外,早在2014年,香港中文大学开发的DeepID在LFW(野生标签面孔)中的面部识别准确度达到了99.15%。
图23:提到“深度学习”或“深层神经网络”的期刊论文

图表24:引用“深度学习”或“深层神经网络”至少一次的期刊论文

中国互联网巨头百度、阿里巴巴和腾讯(BAT)是中国人工智能市场中的领先者,而数百家初创企业也在渗透该行业,并在各种AI领域和应用领域建立服务模式。目前,在中国人工智能领域涵盖:
1)基本服务,如数据资源和计算平台;
2)硬件产品,如工业机器人和服务机器人;
3)智能服务,如智能客户服务和商业智能;
4)技术能力,如视觉识别和机器学习。
根据艾瑞咨询,语音和视觉识别目前分别贡献了中国人工智能市场总量的60%和12.5%。 在中国的人工智能相关公司中,71%专注于开发应用程序。 其余的55%正在研究计算机视觉,13%在自然语言处理,9%在基础机器学习。
在我们看来,在人工智能前沿的关键参与者可能继续在美国和中国。

机器人:用户界面的未来
机器人是潜在的范式转移。在以机器人为中心的世界中,用户体验从基于点击的转换到对话(文本或语音),以及从网络或面向消息或面向语音平台的交互转换。换句话说,用户不需要打开三个不同的应用程序来预订旅行,购买衣服和参与客户服务,而是可以同时通过信使参与与提供帮助的机器人的交谈。因此,我们看到电子商务,客户支持,员工工作流程和生产力方受到广泛影响。
过去12-18个月的一个关键驱动因素是大型云和互联网公司创建和开源机器学习框架。2015年下半年,谷歌公司推出了TensorFlow,一个机器学习算法库,亚马逊和微软也一直活跃,发布云服务来支持自己的机器学习项目。我们预计这种趋向民主化的机器学习将继续促进智能机器人的发展,因为主要参与者(亚马逊,谷歌,苹果,微软)期望在他们各自的生态系统整合对话界面(Alexa,谷歌助理,Siri,Cortana)。 继今年三星收购Viv之后,我们预计将在三星的设备和智能手机生态系统中进一步整合基于Viv AI的数字助理。
自然语言处理(NLP)。机器人的承诺是植根于他们的智能和过程自然语言的潜力。因此,机器人兴趣的兴起与机器学习的兴趣和创新的兴起与自然语言处理(NLP)的人工智能领域的技术,或计算机理解,操纵和从语言的意义的推导相关。与类似于基于硬编码规则集构建的CTRL + F函数操作的字处理器相反,NLP利用机器学习算法来基于大量训练数据来学习规则,然后可以将其应用于新的文本集。机器学习的核心原则适用于NLP系统所获取的数据越多,其应用程序就越准确和更广泛。
虽然NLP的早期应用已经用于文本挖掘(例如,法律文件,保险政策和社交媒体的分析)和自动问答应用中,但是神经网络和深度学习模型的进步正在允许NLP系统变得越来越聪明并且管理困扰人类语言的歧义。谷歌在TensorFlow,SyntaxNet中实现的NLP的开源基础利用神经网络来消除左到右处理中的模糊性,只有在发现了其他更高等级的假设时才丢弃潜在的假设。因此,根据谷歌的说法,SyntaxNet模型是一些在TensorFlow框架内曾经训练过的最复杂的模型。
消息平台。 机器人的兴起与诸如Facebook Messenger,WhatsApp以及企业中的Slack和HipChat等消息应用的快速增长同步。消息应用程序提供了一种媒介,通过它,机器人可以与iOS,Android和网络上的用户进行交互。此外,更大的消息应用正在发展成支持多种交互类型的平台。在Slack上,企业用户可能与团队合作,监控应用程序,创建待办事项列表或从同一接口监控费用。在Facebook Messenger上,用户可以与朋友聊天,提出品牌的支持问题,或从同一界面叫Uber。
最近的聊天机器人收购或亚马逊(Angel.ai CEO)和Google(API.ai)的部分收购,每一个都专注于会话界面技术,突出了公司和投资者在聊天和自然语言过程能力的联合中看到的机会 。根据Pitchbook的数据,自2013年以来,私人消息公司在人工智能/ 机器学习,电子商务,SaaS和网络安全方面投入约120亿美元的累计风险投资资金,而在8年前则约为20亿美元。
图25:跨信息风控基金(百万美元)

在一些受益者正在出现的情况下机器人激增。 第一组受益者是消息平台——脸谱网,Slack,微信等。机器人增加了参与度,并创造了在这些平台上推动商业的机会。第二类是硬件和基础设施提供商,其范围从GPU提供商(NVIDIA)到开源供应商,数据平台供应商和云服务提供商,如亚马逊,谷歌和微软,亚马逊处于一个独特的位置,因为它的能力可以满足电子商务需求。 其他正在利用BOT功能的软件提供商包括Zendesk和Salesforce.com等软件提供商,他们将机器人视为自动化企业客户服务的潜在手段。
图26:Slack,FB Messenger用户的增长
企业和消费者信息平台的兴起

个人数字助理:许多公司已经使用复杂的算法,机器学习和大数据软件来创建基于过去一段时间的行为和客户数据的推荐引擎。这些引擎影响购买行为,但是大部分相同的技术被用于个人数字助理的工程中,或者具有基于语音命令来完成或自动化简单任务的能力的机器人。
使用语音识别软件将推荐引擎的复杂预测和推断功能合并,产生了苹果的Siri,亚马逊的Alexa,谷歌助手和微软的Cortana。利用机器学习和云基础设施,这些应用程序在收集关于用户的更多信息时改进:语音模式,兴趣,人口统计,消费习惯,日程,职业,喜欢和不喜欢。大多数(如果不是全部)这些信息通常可以通过软件监控一个人使用智能手机或连接设备(Amazon Echo,Google Home)来收集。随着这些数字个人助理访问更多的数据,分析应该允许他们区分来自不同用户的类似请求,变得越来越个性化。例如,指令“给我看最好的相机”对不同的消费者可能意味着不同的东西。与用户数据相结合的强大的分析引擎可以帮助确定用户是否喜欢最便宜的摄像机,最高评价的摄像机,或者等于对于该个人“最佳”的特征的某种其他组合。
我们看到数据聚合和分析的持续创新推动了人工智能数字助理的改进。我们还期望像亚马逊和谷歌这样的系列创新者继续消除购买过程中的摩擦点(Echo,Echo Dot),并进一步完善日常任务(谷歌首页)。

用例

农业
到2025年市场值将达到200亿美元
我们认为,机器学习有可能增加作物产量,减少化肥和灌溉成本,同时有助于早期发现作物/牲畜疾病,降低与收获后分拣相关的劳动力成本,提高市场产品和蛋白质的质量。当我们看到用于收集土壤,天气,航空/卫星图像,甚至听觉数据的传感器的扩散,我们认为,从深度学习算法对这些PB级数据集产生的洞察将提前告知(有时)种植时间,灌溉,施肥和家畜护理,并导致在农业范围内增加土地,设备和人类生产力。如果数字农业中使用的所有已识别的技术将被优化或完全由机器学习/人工智能提供,我们假设该价值创造的25%累积到机器学习/人工智能链中的供应商,这意味着TAM为600亿美元,到2050年将会有一个1.2万亿美元的农作物市场。假设在该时间段内TEM线性

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章