詹姆斯·汉密尔顿在自己的游艇上(腾讯科技配图)
《连线》杂志网络版近日刊载文章称,设计日益复杂的数据中心“帝国”是亚马逊网络服务背后的推动力,这项服务不啻于一场革命。但是,伴随这种巨大成功而来的是一整套的计算问题,而身为亚马逊“杰出工程师”的詹姆斯·汉密尔顿正是负责解决这些问题的主要人物之一。
以下是这篇文章的全文:
在 2011年8月份某个阴雨连绵的周一,北弗吉尼亚一个1000万瓦特的变压器发生爆炸,在整个电网中带来了庞大的突增瞬间电压,对亚马逊位于弗吉尼亚州阿什伯恩(Ashburn)的一个数据中心造成了重创,导致这个数据中心的主电源关闭。在大约15分钟以后,詹姆斯·汉密尔顿(James Hamilton)恰好驶入了这个数据中心的停车场。
对阿什伯恩数据中心来说,汉密尔顿在那个时刻到来只是一个意外的惊喜。汉密尔顿是亚马逊的“杰出工程师”,他管理着该公司设计日益复杂的数据中心“帝国”,这个庞大的帝国是亚马逊网络服务(Amazon Web Services)背后的推动力——这项服务不啻于一场革命,它所聚集的在线服务为全球范围内的诸多公司提供运算能力,包括全球最大的在线视频服务提供商 Netflix、图片社交网站Pinterest和云存储服务提供商Dropbox等。
当汉密尔顿和他的团队赶到时,这个数据中心的备用发电机已经启动;但由于某种原因,备用发电机的电力未能传输到数据中心内部的服务器。汉密尔顿到达时,这些服务器已经耗尽了电池系统的大部分电力,这个系统的功能是在断电时暂时维持服务器的运行。“我们抵达时,服务器正开始宕机。”哈密尔顿在最近于拉斯维加斯召开的一次亚马逊会议上发表讲话时回忆道。“那真是太烦人了,太烦人了。”
“太烦人了”这种表述已经是婉转的说法。汉密尔顿的工作是用他冷静的头脑去应对这种情况,以及找出办法避免未来出现类似的问题。他和他的团队最终认识到,对于亚马逊来说,当时向数据中心服务器提供备用电力的发电机是不适用的——在数据中心里,像这样的宕机是永远都不能发生的。今天,这家公司已经设计了自己的电力装置,这种装置使用可编程逻辑控制器(programmable logic controller,PLC)。“我们已经拥有多家开关装置提供商。”汉密尔顿在拉斯维加斯会议上说道。“我们已经对所有这些提供商的PLC程序设计进行了仔细检查,也对我们所有的开关装置进行了编码复核。”
当亚马逊在2006年推出 EC2和S3网络服务时,这些服务令运算行业发生了改变。大型服务器厂商——其中最引人注目的是Sun Microsystems——此前一直都在筹划一个想法,那就是以类似于公用事业公司出售水或电力的方式来出售计算能力;但令所有人都感到大吃一惊的是,到最后却是亚马逊这家图书和CD零售商成功开发出了一整套服务,让市场乐意付钱购买。在七年以后的今天,这家公司正在运营一项价值巨亿的云计算业务,从知名云计算公司Rackspace到惠普等许多公司都想要复制亚马逊的成功。
但是,伴随这种巨大成功而来的是一整套的计算问题,而汉密尔顿正是负责解决这些问题的主要人物之一,他正在努力反思,想要建设云计算时代的数据中心。在很大程度上与其他两家云计算巨头——谷歌(微博)和微软—— 相似的是,亚马逊也几乎并未透露这家公司有关数据中心工作的细节,将其视为最重要的商业秘密。但是,鉴于汉密尔顿的崇高地位,他是亚马逊员工中为数不多地获许在博客上发表自己重大想法的人之一。现在,这位拥有一半加拿大血统的亚马逊工程师已经在业界建立起了配电系统专家的名声。
“他真的非常内行。”Netflix的云架构负责人阿德里安·柯克罗夫特(Adrian Cockcroft)说道,这家公司是亚马逊最引人瞩目的客户。“他从事这个领域的工作已经有很长时间,设计了很多有趣的东西。”
对 Netflix来说,亚马逊“即付即用”的计算服务是最理想的选择。在每个周日的晚上,到Netflix网站上观看电影的用户人数会大幅增加;然后到下个周一时,这些用户中的大多数都会突然消失。通过与亚马逊之间的合作,这家公司能在需要的时候获得必需的资源,在不需要的时候释放资源。但是,柯克罗夫特和 Netflix还必须相信,亚马逊有能力始终维持其庞大的数据中心的正常运作,而且价格也远低于Netflix自己运营数据中心的费用。这就是汉密尔顿负责的领域。
当苹果称其将建设一个占地100英亩(约合0.4平方千米)的太阳能电厂,来为该公司在北卡罗来纳州梅登(Maiden)运营的规模庞大的数据中心提供清洁能源时,大多数人都情不自禁地想要将其视为“上帝的绿色地球”(God’s Green Earth)那种美好未来的重大胜利。但汉密尔顿并不这么想。
“我就是算不过这笔账来。”他在去年写道。“我很想知道,这种庞大的太阳能电厂是否只是糟糕的想法和纯粹的营销。这种项目对环境的影响是肉眼可见的。”
汉密尔顿不是营销人员,而是一名工程师,只会从工程师的角度出发来看待问题。他指出,太阳能电厂必须庞大到令人觉得荒谬可笑的程度,才能大幅降低苹果规模巨大的数据中心将给周边环境所带来的压力。他极力主张,虽然苹果计划建设的这个太阳能电厂占地多达100英亩,但很可能只能提供运营数据中心所需要的4%左右的电力。
根据汉密尔顿的计算,如果想要为占地50万平方英尺(约合4.6万平方米)的数据中心提供全部电力,那么就需要建设一个1.81亿平方英尺(约合16.8平方千米)的太阳能电厂。“有很多方法能从根本上降低数据中心对环境造成的影响,同时又不需要占用如此之多的土地。”汉密尔顿说道。“我会首选降低配电、冷却、存储、网络和服务器的效率和提高整体利用率,来作为降低数据中心行业对环境造成之影响的最好方法。”