锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

揭秘 AWS 基础架构底层运维和构建之道!

时间:2022-11-29 11:00:00 继电器2864150mini

6e040ceaff67b9463ffefe9a887015fa.gif

整理 | 夕颜

出品 | CSDN(ID:CSDNnews)

在去年的AWS re:Invent大会上,AWS全球基础设施和客户支持高级副总裁Peter DeSantis分享主题演讲AWS基础网络支撑高性能计算,以及让传统计算密集型应用更好地运用云共享性特性的秘诀;今年,他从运营的角度,延伸至半导体和数据中心可持续发展等领域,揭秘AWS对基础设施底层运行和构建的一些思考。

他的演讲值得注意什么?让我们做一个深入的解释。

如何稳定运行?

Everythingfails, all the time.

——Amazon CTO Werner Vogels

正如Werner建云时,任何环节都可能出现问题,几乎不可能没有问题。

2018年,AWS在re:Invent上次公布的一个数据:和AWS另一家规模最接近的服务提供商,云服务的停机时间是AWS七倍多。当时有人关注,AWS是如何做到支撑起巨大规模的云服务的同时,保持稳定、可靠的运营?Peter在今年的演讲中为大家揭秘。

总的来说,从细节开始,是的AWS支持如此大规模和复杂的基础设施,同时保持稳定和可靠的操作。

供电

具体来说,首先要从供电层面保证稳定性。供电是包括数据中心在内的任何基础设施的关键。一般从电网拿到电后,AWS经过Switch Gear配电控制系统供电,其中UPS备用电源系统现问题时,备用电源系统可立即接管电源,确保服务不中断,同时启动发电机组,为电池充电,直至电源恢复。

Peter解释说,一个完整的配电控制系统一般包括发电机、配电开关控制系统和三个关键部件UPS系统。

发电机组比较简单,AWS的基本逻辑就是加一组冗余发电机,发电机坏掉之后可以用另一台替换。

配电开关系统相对复杂,有一个特殊的术语叫做e-house,控制线路切断采用低压或中压控制开关和继电器。然而,嵌入在传统开关控制系统中的软件无法提前设置,许多功能设计不适合AWS使用。为了适应AWS他们自己制作了一套配电开关系统,以确保事故发生时,AWS处理故障的最快速度和极简过程。

UPS由于传统的系统更复杂,系统更复杂UPS控制产品功能复杂,但不一定是AWS需要的,且UPS铅酸电池质量重,风险高,不利于数据中心的安全。AWS该方法是将铅酸电池制成多个小电池,与框架的冗余电池一起使用,并使用自己开发的控制系统进行控制UPS,从而降低了铅酸电池的复杂性和破坏性。

任何链接都可能坏,减少坏链接对客户的影响,是AWS保持供电稳定的基本思路。

数据中心

然后回到数据中心本身。2001年,当AWS不存在的时候,Amazon run西雅图已经有了数据中心。海啸和地震频发的地方,AWS在数据中心建设方面积累了一些经验。

例如,所有设备不能放置在数据中心,数据中心之间应有适当的距离,以减少灾害造成的损坏。

两个数据中心的延迟至少为70毫秒,这是由物理距离决定的,不能改变。但减少延迟的影响,AWS综合考虑火灾、雷电、龙卷风、海啸、地震等因素的破坏半径后,发现数据中心之间的最佳距离为数十英里,数据中心的延迟在1毫秒内,数据中心之间的独立性最大化。

数据部署的概念不同于其他云服务提供商,AWS会细分区域和 可用区(Available Zone)的区别:

1) 设置远程可用区可以减少自然灾害(火灾和水灾)…)业务中断风险;

2)用户选择最近的网站访问,以低延迟访问AWS云资源;

3) AWS分别管理每个区域中的运维,每个AZ有独立的网络和连接来分割故障。

此外,AWS数据中心的设计逻辑是消除人类的干扰。人们可以实现一切,也可以破坏一切。因此,为了确保每个区域之间的运行完全独立,不相互干扰,当客户在世界各地部署多个区域时,可以减少损害的影响。

目前,AMS有遍及24 77个地理区可用区(AZ),该计划在澳大利亚、印度、印度尼西亚、日本、西班牙和瑞士建设6个新计划AWS18个可用区域。

半导体

AWS为了更好地适应大规模运营的独特需要,有自己的半导体。

2015年,以色列半导体公司Annapurnalabs被AWS收购后,从最早的开始,成为后者自己的半导体供应商Nitro 1、将于2021年发布Nitro 4,都是AWS云服务的硬件支持。

AWS 云平台可以通过 AWS Nitro 控制器向 Amazon EC2 添加网络、存储和安全资源,如EC2 Mac 实例中,AWS在Mini 上安装了 Nitro Controller,没有 Hypervisor 的 Nitro Controller 可安全快速地连接 Mac Mini。通过Nitro接口,可连接EC2和EBS等服务。据悉,Mac Mini 现在可以本地都可以使用 AWS 服务。

AWS Nitro 芯片发展迅速,最新版本 version 4为新的 C6gn 实例提供动力。

此外,AWS Inferentia是AWS云上最划算的推理芯片,搭配Nitro,可快速扩展到EC2 例子。在机器学习领域,AWS今年下半年将正式推出另一种芯片产品——AWS Trainium,我们可以期待它会给开发者带来什么样的能力。

绿色节能

去年,AWS2030年正式宣布要实现一个目标——让整个目标都实现Amazon100%的数据中心使用可再生能源。AWS提前5年实现这一目标,争取2025年 年 100 % 利用可再生能源。Peter特别报告了目标的一些进展。

451 Research 调查结果显示,AWS 基础设施的能源效率是被调查的美国企业数据中心的中位数 3.6 倍。由于服务器数量和服务器利用率较高,这一优势的三分之二以上。

AWS通过多种措施实现绿色节能:

  • 提高用水效率,减少冷却数据中心饮用水的使用。AWS 评估每一个 AWS 制定区域气候模式、地方水资源管理和可用性以及保护饮用水源的机会。

  • 2020 年 5 本月,亚马逊宣布了为中国、澳大利亚和美国的全球业务提供电力的五个新的太阳能项目 615 MW 可再生能源发电能力预计每年发电 120 万 MW。

  • 今年 3 本月,亚马逊宣布在澳大利亚、西班牙、瑞典和美国投资四个新的可再生能源项目,预计每年产生大约 840,000 MWh 接近额外产生的能 300 MW 可再生能源发电能力。

  • 在数据中心建设的水泥生产过程中,AWS 在混凝土生产中添加 CO2 进一步减少补充水泥材料的使用 CO2 的排放。

2020 2000年,亚马逊对可再生能源的总投资项目 35 一、装机容量超过 4 GW,这也是世界上单一企业在一年内对可再生能源的最大投资。这些新项目将使亚马逊的可再生能源总装机容量在 2020 年达到 6.5 GW,并成为历史上最大的企业可再生能源买家。

以上为Peter DeSantis今年对AWS深入分析基础设施趋势的所有内容,你最感兴趣的部分是什么?欢迎留言讨论~


 
     
 
     
更多精彩的推荐
 
     
 
     
 
     
 
     
 
     
 
     
 
     
 
     
 
     
?明年华为自研设备可升级鸿蒙系统;中芯国际联合会CEO提出辞呈;Git 2.30 RC版本发布|极客头条  ?HarmonyOS 手机应用开发者 Beta 版本的到来意味着开发者什么

☞国内数据中心变革的见证者,揭秘阿里巴巴数据中心技术积淀

☞微软收购 GitHub 两年后,大咖共论开源新生态

☞红帽 与 CentOS 之间的恩怨情仇

☞清华硕士分享思维导图:机器学习所需的数学基础
点分享点点赞点在看
锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章