锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

无数据 不模型 亚马逊云科技持续引领数据基座构建三大核心能力

时间:2024-04-30 20:37:09

北京——2024年4月30日 亚马逊云科技继续引领云上数据办事立异,助力企业构建周全的数据基座以充沛发扬数据后劲,加快手艺落地。在天生式AI时期,数据是企业脱颖而出的关头——根底依赖于大规模高质量数据集,天生式AI的差异化上风来源于企业的专有数据,天生式AI使用发生的少量新数据也需求实时有效地加以治理和应用。亚马逊云科技继续引领数据基座构建必备的三大焦点才能,即模子微谐和预锻炼所需的数据处置才能、应用专有数据与模子倏地连系以发生怪异代价的才能,以及无效处置新数据以助推天生式AI使用继续倏地进展的才能,助力企业在天生式AI时期获得胜利。

亚马逊云科技大中华区产物部总经理陈晓建暗示:“企业需求的是懂营业、懂用户的天生式AI使用,而打造如许的使用需要从数据做起。亚马逊云科技构建数据基座的三大焦点才能涵盖从根底模子训练到天生式AI使用构建的首要场景,可以或许赞助企业轻松应答海量多模态数据,晋升根底模子才能。作为环球云计较的开创者和引领者,亚马逊云科技正在赞助各个行业、种种范围的企业打造强壮的数据基座,在确保用户营业和数据平安的前提下,将数据的怪异代价赋与根底模子和天生式AI使用,加快企业营业增进。”

优异的数据处置才能,倏地进步模子微谐和预锻炼品质

天生式AI根底模子微谐和预锻炼需要将海量的多样化原始数据转化为高质量的大数据集,这对数据存储、荡涤和治理都提出了更严格的挑衅。

在数据存储方面,扩展性和呼应速率是关头。Amazon Simple Storage Service(Amazon S3)工具存储几乎是云上扩展性的代名词,它支撑普遍的数据和谈,可以或许轻松应答种种数据范例,还支撑智能分层以下降锻炼本钱。特地构建的文件存储办事Amazon FSx for Lustre则可以或许供应亚毫秒耽误和数百万IOPS的吞吐功能,可以或许进一步加速模子优化的速率。

在数据荡涤方面,企业面临着沉重的数据荡涤加工使命,Amazon EMR Serverless和Amazon Glue能够赞助企业轻松实现数据清算、去重、甚至分词的操纵,让企业专一于天生式AI营业立异。Amazon EMR serverless接纳无服务器架构,赞助企业运转任何范围的阐发事情负载,主动扩大性能可在几秒钟内调解资本巨细,以餍足不息变迁的数据量和处置请求。Amazon Glue是一个简略可扩大的无服务器数据集成办事,能够轻松倏地地实现微调或预锻炼模子的数据预备事情。

在数据管理方面,企业难以在多个账户和区域中查找数据,也不足无效的数据管理对象。Amazon DataZone让企业可以或许跨构造界限大规模地发明、同享和治理数据,非但能够为多源多模态数据举行无效编目和管理,并且还供应简略易用的对立数据治理平台和对象,从而为用户解锁所有数据的潜能。

数据与模子倏地连系,让企业专有数据开释更大代价

天生式AI根底模子的局限性之一在于无奈实时领有企业专有数据,是以经由过程手艺手法加快数据与模子的连系成为企业数据基座的第二项关头才能。检索加强天生(Retrieval-Augmented Generation,RAG)手艺被广泛认为是完成数据与模子连系的首要路子之一,它经由过程将数据转换为向量并存储到向量数据库中,从而将语义的关联性转化为向量间的数学间隔题目,以完成内容的关联性计较。当代使用步伐需精准懂得用户需要并精确联系关系产物或内容,这一需要普遍存在于搜刮、谈论、购物车及产物保举等交互框架中,这些框架又依赖于性能各别的数据库,这使得数据库成为实行RAG手艺的现实平台。

亚马逊云科技将向量搜刮的支撑性能加入到支流的数据办事中,经由过程将数据和向量存储在一起来晋升数据查问功能。这可以或许让企业轻松应用RAG手艺将专有数据提供给根底模子,从而开释更大代价。另外,亚马逊云科技还为图数据库Amazon Neptune推出了阐发数据库引擎,以连系图数据库与大模子的上风,从而可以或许倏地从图形数据中猎取洞察,并举行更快的向量搜刮。

无效处置天生式AI使用的新数据,下降模子频仍挪用本钱并晋升功能

对天生式AI使用步伐而言,根底模子频仍挪用将会致使本钱的增添和呼应的耽误,是以若何处置天生式AI使用步伐新天生的数据,晋升模子挪用服从成为企业数据基座的第三项关头才能。Amazon Memory DB内存数据库经由过程缓存以前问答天生的新数据,完成对近似题目的倏地响应和正确回覆,同时无效下降根底的挪用频次。Amazon Memory DB可以或许存储数百万个向量,只需要几毫秒的呼应时候,可以或许以99%的召回率完成每秒百万次的查问功能。

另外,天生式AI使用步伐需求倏地霸占市场。亚马逊云科技经由过程供应无服务器数据库办事和Amazon OpenSearch Serverless用于向量搜刮,最大限度为企业减少运维担负和本钱,排除功能瓶颈,使企业可以或许专一于营业立异。

Amazon Music经由过程阐发用户和歌曲的特性,并将它们转换成向量以进步保举精准度。Amazon Music已经由过程Amazon OpenSearch将1亿首歌曲编码成向量并举行索引,认为环球用户供应及时音乐保举。Amazon Music今朝在Amazon OpenSearch中治理着10.5亿个向量,并能够处置每秒高达7,100次的查问峰值,无效支持其保举体系。

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章