传统数据中心的革命——创新策略如何改造数据中心基础设施,提高效率并释放医疗和金融领域的潜力The legacy data center revolution

环球医讯 / AI与医疗健康来源:www.datacenterdynamics.com美国 - 英语2024-11-15 17:00:00 - 阅读时长6分钟 - 2531字
本文探讨了传统数据中心设计的变革,特别是在高密度计算和AI应用方面的需求,以及这些变化如何影响医疗和金融行业。
传统数据中心创新策略医疗金融AI高性能计算效率提升电力分配冷却系统网络安全
传统数据中心的革命——创新策略如何改造数据中心基础设施,提高效率并释放医疗和金融领域的潜力

传统的数据中心设计在过去几十年中基本保持一致,通常每个机架支持8到10千瓦(kW),设计特点包括架空地板和周边冷却。然而,随着AI和高性能计算需求的增长,数据中心正朝着能够处理更高功率密度的方向转变,最高可达每机架100千瓦。

随着机架设计支持更高的功率需求,我们正在从部署100个10千瓦的机架转向更像10个100千瓦的机架用于AI集群。这显著减少了所需的IT占地面积和相关的电力分配。施耐德电气的Steven Carlini表示:“这不仅提供了更多的处理能力,还可能带来更高的收入,无论是来自托管租户还是AI模型用户。”

虽然传统数据中心的核心结构可能仍然存在,但关键组件需要进化以满足当前和未来的需求。在与_DCD_的对话中,施耐德电气创新和数据中心副总裁Steven Carlini分享了新兴技术趋势如何挑战传统基础设施的见解。

传统数据中心面临的挑战

随着对更高功率和冷却效率的需求不断演变,现有的传统设计难以跟上步伐。例如,旧设施中使用的架空地板最初是为了容纳布线和冷却系统而引入的,当时是实用的。然而,Carlini解释了为什么这种设计可能会在未来的数据中心中被淘汰:“我不认为新的加速计算AI数据中心会采用架空地板,因为数千公斤高功率GPU服务器的重量以及它们可能会被液体冷却的事实意味着架空地板无法支持这一点。”他补充说:“大部分电力分配和冷却管道实际上将在IT机架上方,数据中心将更加垂直化。”

随着数据中心越来越需要更高的功率密度,架空地板的局限性变得更加明显,尤其是它们已经承受了如此多的重量。这使得改造传统数据中心尤其具有挑战性,因为电力分配必须变得更加密集以满足现代需求。未来数据中心的设计将大不相同;拥有成千上万机架的行将不再令人印象深刻或受欢迎。

未来的数据中设计趋势

随着高密度计算需求的持续增长,数据中心设计正在发展以适应更大的电力需求。Carlini指出:“随着机架设计支持更高的功率需求,我们正在从部署100个10千瓦的机架转向更像10个100千瓦的机架用于AI集群。这显著减少了所需的IT占地面积和相关的电力分配。”

“我们使用DCIM软件不仅监控所有关键设备,还确保它们具有最新和最安全的加密。”Carlini继续说道:“例如,考虑下一代Nvidia Ruben架构,其建议的容量为每机架240千瓦。为240千瓦的机架设计并仅在40千瓦下运行是不切实际的;这种方法正在推动密度和冷却能力的极限。”

这一转型反映了数据中心架构的一个更广泛趋势,即效率和空间优化变得至关重要。Carlini进一步解释道:“未来的数据中心将拥有更少的空白空间或IT房间空间,更加注重外部设备。”这意味着将有更多的冷水机组放置在设施外部,而传统的电力分配系统和中低压开关设备的需求将减少,因为负载更加集中。这些变化不仅旨在简化操作,还旨在提高日益电力需求背景下的数据中心管理的整体效率。

关键垂直行业的应用:医疗和金融

AI应用正在越来越多地影响关键行业,包括医疗保健。随着大量医疗数据在线存储,AI在改善诊断方面的潜力巨大。Carlini指出:“有趣的是看诊断——如果你是一名医生,你知道不可能读取所有新发布的资料或审查每一个成功和不成功的病例。精明的医生可能不会直接使用AI进行诊断,但他们利用AI来收集历史数据并识别成功率更高的治疗趋势。”

这一概念也扩展到其他领域,突显了AI在个性化服务中的光明前景,如定制医疗和个性化财务建议。为了有效管理这些高级工作负载,Carlini概述了传统数据中心实施AI模型的三种潜在选项:

  1. 现成模型:利用云提供商提供的预构建AI模型,并按使用量付费。
  2. 私有云:在私有云环境中部署AI模型,实现定制以提高效率和优化电力使用。
  3. 内部开发:从头开始构建自定义AI模型。这是最耗时的选项,需要专门团队来开发、训练和优化特定应用的模型。

传统数据中心的实用解决方案

面对现代化数据处理能力的挑战,拥有较旧设施的公司面临一个关键问题:如何确定管理数据的最佳方法以满足当前和未来的需求?

为了解决这些挑战,公司通常首先评估其具体的应用需求。Carlini解释道:“用于维护的空调单元可能会无意中提供攻击者的访问点,从而扩大公司的攻击面。”例如,一个希望转型为智能工厂的制造设施需要集成各种IT系统,如销售点、CRM和供应链管理。一旦他们确定了必要的IT基础设施,他们会向施耐德咨询其所需设置的意见,重点关注电力、冷却,特别是备份时间。

他补充说,虽然大型云提供商提供了广泛的备份选项,但在本地部署的组织必须仔细考虑其电力可用性和潜在中断的成本。在当前的环境中,许多企业并不从事数据中心业务,而是寻求现成的解决方案来简化运营。“我们提供模块化、预制系统,这些系统在工厂中建造和测试,然后在现场部署所需的IT设备。”Carlini指出。这些系统配备了远程监控和管理软件,这对于缺乏内部数据中心经理的公司至关重要。因此,组织可以越来越多地依赖施耐德来解决其电力需求、协商公用事业合同和部署电力和冷却系统,特别是对于高密度AI应用。

然而,除了运营考虑之外,公司还必须应对部署AI应用程序的复杂性。网络安全方面,使用网络分段、隔离或空气隔离可以阻碍AI提取和报告敏感信息的能力,有效保护其敏感数据。Carlini强调施耐德在此领域的积极角色,他表示:“我们使用DCIM软件不仅监控所有关键设备,还确保它们具有最新和最安全的加密,包括UPS单元、电力分配和冷却系统,以确保包括网络访问卡在内的所有设备都配备最新的加密并受到潜在安全漏洞的保护。”

此外,他还指出了看似无关的系统中经常被忽视的漏洞。“例如,用于维护的空调单元可能会无意中提供攻击者的访问点,从而扩大公司的攻击面。”Carlini解释道。施耐德协助组织评估这些漏洞,确保基础设施的各个部分,包括边缘AI数据中心,都能安全连接而不暴露其他系统于风险之中。

总之,随着数据中心面临不断增长的需求,组织应采用创新解决方案,从传统设计演变为支持AI的高效设施,同时优先考虑网络安全。采用这些变化将提高运营效率并释放AI在关键领域如医疗保健和金融的潜力。


(全文结束)

大健康
大健康