锐单电子商城，一站式电子元器件采购平台！

电话：400-990-0325

押注AI大装置，商汤的“月亮与六便士”

时间：2022-12-14 09:00:00 agi碰撞传感器

导读：商汤AI解决大装置有两个主要功能：AI落地长尾问题，批量构建大参数模型。

当AI技术广泛渗透到各行各业和日常生活中，AI越来越被祛魅化。

AI到处都是，但远没有达到无所不能的阶段，有时很愚蠢。公众更愿意接受真正的生活变化，而不太关心通用人工智能（AGI, Artificial General Intelligence）等待太遥远的概念。

在过去的两年里，从国外火到国内的通用大型模型已经成为全球AI龙头企业有着相同的发展方向。这些大模型不仅试图解决小样本长尾应用等实际问题，还引发了业界的关注AGI重新讨论。商汤推出的AI大装置也不例外。

不久前在2021WAIC商汤科技联合创始人、首席执行官徐力(世界人工智能会议上首次分享了商汤新人工智能基础设施——SenseCore商汤AI大装置的全貌。商汤内部，AI大型设备被定位为商汤长期核心竞争力、公司持续经营、实现更大规模转型的护城河。

商汤AI将大装置描述为：将算力、算法、平台这三大最重要内核要素打通为“三位一体”的AI实现基础设施AI技术不断赋能企业服务、城市管理和个人生活三大落地方向，进一步推动更高效、更低成本AI产能创新升级。

从长远来看，通往通用人工智能的道路，AI大装置可能是探路石。但更重要的是，AI大装置可以解决AI落地长尾问题，大参数模型批量建设，平台型深化AI公司护城河。

押注AI大装置，商汤的“月亮与六便士”

趋势:万亿参数来袭，大模型有大智慧

AI大型装置的名称来自于高能物理中的粒子碰撞机，它通过随机两束粒子流的高速碰撞来理解量子粒子的新规律和新粒子。粒子碰撞的结果是不可预测的，但只有通过不断的探索和尝试，才能找到一些可以解释物理世界的规律。

徐李说，同样，在探索人工智能可能性的过程中，许多小样本的问题在开始时是无法解决的。只有通过尝试不同和更大的大模型泛化能力，然后蒸馏到小样本和零样本。

AI大型设备的逻辑类似于业内热门的通用大型模型。虽然业内对通用大型模型仍有很多争论，但它基本上已经走上了更大模型实现更准确的小样本应用的道路。

2020年5月OpenAI有1750亿参数的推出GPT-3.它利用几乎所有来自互联网的可用数据进行训练，成为迄今为止最好的自然语言处理模型。更重要的是，GPT-3证明了小样本自然语言处理任务将更准确地完成扩展文本量(数据)、参数扩展(模型大小)和训练计算量的增加。

仅仅一年时间，大模型的参数就进入了万亿时代。谷歌于2021年1月推出.6万亿参数大模型Switch Transformer。6月，国内智源研究院发布1.全球最大的预训练模参数预训练模型悟道2.与此同时，阿里巴巴也发布了万亿巨型模型M6。

2017年，商汤开始探索大参数深度网络AI大装置投入研究。其AI大型设备分为三层结构和九个模块。第一层是计算能力层，包括计算训练芯片，AI数据中心（AIDC），底层传感器。第二层是平台层，包括数据平台和深度学习训练框架 SenseParrots、深入学习推理部署引擎 SensePPL、模型生产平台。第三层是算法层，包括创新算法模型和算法开源计划 OpenMMLab。

AI大装置可以看作是商汤最先进的算法、计算能力和系统的集大成者。目前，商汤智算中心投资56亿元（AIDC）计划总算能达到374 Petaflops（1 Petaflop计划在2021年底交付，相当于每秒1000万次浮点运算。商汤算法工具箱已有1.7万个算法模型。除了工具箱，商汤还会有一部分SOTA整合开源到算法OpenMMLab体系中，在GitHub已收获3.7万颗星。

脚：批量产出AI长尾应用

为什么推出商汤？AI大装置？

首先，非常务实，AI大装置直指AI大规模着陆的主要障碍是堆人工和项目系统的算法开发模式，效率低，周期长，成本高。AI通过通用大模型和小样本单场景的细分优化，大型装置将更快地批量生产海量长尾应用。

在本届WAIC在演讲中，徐丽将物理世界的数字化转型分为场景数据、元素结构和过程交互三个环节。他认为元素结构化是AI卡壳需要大规模落地卡壳的地方AI赋能环节。

80%的结构化应用程序是低频和长尾场景。如果没有通用的人工智能，它们只能在单个项目中投入大量的人力，而且它们本质上不能很好地解决小数据和小样本的问题。此外，如果技术上仍然关注单一的问题过程，在许多通用场景中很难具有良好的泛化能力，导致性能不稳定。徐李说。

与身份识别、安全、交通、城市管理等头部相比AI还有大量的低频但重要的长尾场景需要智能转换。例如，自动扶梯安全管理、垃圾暴露、城市火灾、坠物等，有些甚至是小样本、零样本场景。

以更常见的自动扶梯安全为例，商汤通过物理检测、行为识别、密度分析等 AI 该技术将结构化处理可能导致安全问题的异常因素，如跌倒、逆行、推轮椅和拉行李箱，从发现异常到推送报告，再到帮助人工解决问题AI。例如，自动识别大型行李、婴儿车等安全隐患，并进行语音劝阻；当乘客摔倒时，自动降低自动扶梯的运行速度等。在整个过程中，大部分工作都可以实现AI需要人工干预才能解决问题。

再比如冬奥会场馆，AI大型设备可以快速完成场景数据（数字双胞胎）、元素结构和过程交互（运动员运动轨迹分析等），也可以基于混合现实技术实现观众互动。

商汤认为，基于泛化能力的复用，AI大型设备可以降低人工智能生产要素的价格，促进物理世界的全面数字化转型。

其次，AI大型设备的另一个重要作用是批量生产通用大型模型。目前，在参数量级大幅提升后，下一步是验证更垂直的场景和行业。每个领域都能有足够的数据输入然后使用吗？AI徐力说：大装置碰撞产生结果？

远方:用机器猜想开启人类创新的新范式

图灵奖得主，关系数据库的鼻祖吉姆·格雷曾将人类的科学研究分为四类范式（Paradigm，必须遵循的规范或每个人都在使用的常规)依次是:实验归纳、模型推演、模拟模拟和数据密集型科学发现。

这四种范式都是基于人类现有的认知来总结和解释的。基于大数据的第四个范式也应该有大量的已知数据，然后通过计算得出以前未知的理论。徐李认为，人类历史上的许多颠覆性科学创新和重大突破不包括在这四个范式中，更多的是来自天才的猜测，比如牛顿头上的苹果和爱因斯坦童年幻想的光。

然而，面对未知世界的巨大扩张，尚唐认为仅仅依靠人脑猜测是不够的，需要引入机器猜测。AI大型设备是商汤进行机器猜测的基础设施，也是探索人类创新的范式。

一方面，目前有一些AI算法不再完全依赖于标记的大数据，许多算法依赖于小数据，甚至不需要人类数据。

另一方面，当未知空间变大时，计算能力需要增加。常识认为算法越准确，计算能力就越少。事实上，过去10年里最好的AI算法对计算能力的需求几乎增加了100万倍。徐丽认为，生命科学、材料科学、医学等基础学科将首先受益于机器猜测，进入科学创新的新范式。

通用大模型是否通向AGI业内还有很多争论。从大模型到大设备，这种机器猜测背后会带来什么？AI算法生产更多的是数据越准确，模型就越准确的模式，背后是人类总是想要找到因果关系的思维模式。人类总是基于过去的理解来获得确定性的机理分解，然后建立一个新的模型来推导。

机器猜想可能会部分放弃对因果关系的痴迷，颠覆几千年来人类的思维实践。AI大型设备还将跳出精确数据输入的限制，通过更大规模的数据碰撞出更通用的大型模型。

写在最后

由于长期大规模研发投资，尤其是前几年AI过热甚至泡沫被挤压后，过去两年AI企业普遍面临着更严重的亏损问题。长期亏损、商业模式和盈利预期已成为AI企业上市的最大障碍。

相比之下，头部的商汤相对平静，在计算机视觉应用市场保持着领先的收入和市场份额。2021年WAIC，商汤成为了AI四小龙中唯一参会的厂商，这也侧面证明了昔日的AI四小龙正在逐渐分化。谁能先上市，就有机会借助二级市场的低成本融资，进一步拉大与朋友的差距。

目前AI7月20日，云从科技刚刚进入科技创新板IPO过会，一般上市难。AI行业带来好消息。今年以来，关于商汤IPO消息不断传出。近日，腾讯一线消息称，尚汤科技已确定A H保荐人为中金公司，最早将于8月向港交所提交上市申请。

商汤很早就明确了平台型AI公司定位。技术上，AI大型设备的重要性不言而喻，其通用模型碎片化场景适应性是降低模型开发成本、提高长尾场景开发效率的关键。AI大装置能否在更多行业场景发挥效果，「智能进化论」继续关注。

-END-

本文为「智能进化论」智能进化论专注于云计算和智能技术领域的深入评论。

锐单商城拥有海量元器件数据手册、IC替代型号，打造电子元器件IC百科大全！

押注AI大装置，商汤的“月亮与六便士”

趋势:万亿参数来袭，大模型有大智慧

脚：批量产出AI长尾应用

远方:用机器猜想开启人类创新的新范式

写在最后

相关文章