谷歌用AI技术帮助数据中心散热节省成本达30%

    图片来源:deepmind 博客

    2016年,谷歌联合旗下的DeepMind,开始研究如何利用机器学习更好地冷却其数据中心,开发了一个人工智能驱动的推荐系统,以提高谷歌已经高度优化的数据中心的能源效率。最初想法很简单:即使是微小的改进也可以显着节约能源,减少二氧化碳排放,从而有助于应对气候变。

    不过当时系统只是提出建议,而人工操作员则决定是否实施这些建议。

    现在DeepMind将这个系统提升到一个新的水平:我AI系统不是人为实施的建议,而是直接控制数据中心冷却,同时保持在数据中心运营商的专家监督之下,操作人员仍然可以进行干预。这种首创的基于云的控制系统现在可以安全地为多个Google数据中心提供节能服务。

    新的冷却系统现在已经在一些谷歌的数据中心就位。每隔5分钟,系统就会轮询数据中心内的数千个传感器,并根据这些信息作出最佳操作。当然,这里有各种各样的制衡机制,因此谷歌的一个数据中心因为这种机制而陷入瘫痪的可能性很小。

    DME

    谷歌的数据中心包含数千台服务器,可支持谷歌搜索,Gmail和YouTube等热门服务。确保它们可靠,高效地运行是关键任务。DeepMind重新开始设计AI代理和底层控制基础设施,并考虑到安全性和可靠性,并使用八种不同的机制来确保系统始终按预期运行。

    该系统实施的一个简单方法是估计不确定性。另一种方法是双层验证。由AI计算的最佳操作将针对由我们的数据中心操作员定义的内部安全约束列表进行审查。一旦指令从云发送到物理数据中心,本地控制系统就根据其自己的约束集验证指令。这种冗余检查可确保系统保持在局部约束范围内,并且操作员可以完全控制操作边界。

    最重要的是,我们的数据中心操作员始终处于控制状态,可以随时选择退出AI控制模式。

    和大多数机器学习模型一样,这个模型在收集了更多数据后会变得更好。尽管只运行几个月的时间,与数据中心的历史能源使用量相比,它现在平均能够节省30%的能源,并且有了进一步的预期改进。这是因为随着时间的推移,这些系统会随着更多数据而变得更好,如下图所示。随着技术的成熟,系统的优化边界也将得到扩展,从而实现更大的节能。

    FINAL

    合作的谷歌数据中心运营商Dan Fuenffinger,表示说:“看到AI学会利用冬季条件并生产比普通水更冷的水,这令人惊讶,这降低了冷却所需的能量。”

    AI控制数据中心系统安全可靠地运行,同时始终如一地实现节能,这只是开始。从长远来看,我们认为有可能将这项技术应用于其他工业环境,并有助于在更大规模的范围内应对气候变化。

    博客原文:Safety-first AI for autonomous data centre cooling and industrial control


    <声明>
    文章仅代表作者观点,不代表智能链立场,智能链(www.zhinengl.com)也不对真实性背书。
    智能链尊重知识版权,遵循行业规范,转载稿件标明出处、版权归原作者或机构所有;如有侵权,请联系我们处理。
    智能链倡导知识分享,原创和编译文章(除非另有说明)欢迎转载,转载请注明出处、作者和原文链接。