英特尔公司企业技术事业部院士兼微处理器技术实验室总监濮绍庭主题演讲。
随着应用互联网技术的全新团建框架不断的出现,目前的客户端--服务器架构正在经历一次前所未有的快速演进与变革。面对这一切,你准备好了么?
濮绍庭:大家早上好,这是我第三次到上海,每次到上海我都觉得特别开心,今天给大家讲的是超级数据中心,大家想什么是超级数据中心呢?我一会儿在讲的时间你肯定就会明白了。就到底都是为了使得功耗能进一步降低,以前我们都是要争取高性能,但是今后我们都必须要更加审慎,比如在创造高性能的时候,如何来使得功耗能够得到更加有效的管理。现在说到超级数据中心都对功耗越来越关注了,在接下来半小时我会给大家做详细介绍,我们如何和其他的有商进行合作以及其他的产学研单位进行合作,使得新技术运用于超级数据中心,功耗降下来。
什么是数据中心呢?想想我们今天每日的应用,比如像YOUTUBE,我们每天会在这里搜索上亿的视频,你再去雅虎、google、百度,用他们浏览网页,每天可以高达六千万次。每一个背后都需要数据中心的支持,所以需要一个非常占地的数据中心里面装满了电脑,高性能的电脑。运算能力非常强大,数据就是从那里来的。但这只是冰山一角,这是今天的状况,可是未来会怎样呢?想象一下,全世界的信息一两年信息量就会增长一倍两倍,以后我们的信息中心怎么建设,以后作为用户来说,你需要信息怎么办,今天我们所处理的信息量还只是冰山一角,关键是我们要预测未来会发生哪些变化,我想未来的变化今天也已经有一些迹象了。
第一,软件,我们机器的软件会发生变化,软件会跟数据一起从数据中心到你的电脑桌面,数据与软件一起为用户服务,这是一个趋势变化。另外就是本地存储,本地存储将成为历史上的一页,因为数据中心拥有巨大的数据量,你去访问那到那儿去提取数据,以后将采取这种分布存储。再看个人管理,现在你是自己管理自己的电脑,但是以后机器将个人管理走向集中管理化。另外机器的状态也会发生变化,今天的机器昨天的机器它的状态都是一种有状态,而未来将走向一种无状态,看到了未来需求的变化,我觉得一切都落在了数据中心上,这要求我们的数据中心要作出相应的调整。这一曲线反映的是06年到以后数据中心拥有的服务器的数量,左手边是服务器增长的比例,随着时间的推移,每一个数据中心服务器的数量更高,到了2011年每一个数据中心对服务器的需求量要增长900%,意味着几年以后数据衷心的服务器量要求特别大,怎么样管理呢?我觉得能耗非常重要。在数据中心什么都非常重要,能源重要,因为你增加的服务器的数量,相应的能耗也会增加,你不喜欢,另外密度很重要。你增加的六倍的服务器占地就会增加六倍,密度增加了,存储空间也增加了,I/O也增加了,安全要求也更高了,可靠性的问题,应用的问题,还有成本如何保证。
我们看看未来建立这种超级数据中心需要哪些技术帮助我们满足这些最主要因素。首先看看服务,未来的超级数据中心给你提供哪些服务呢?他提供的是时时的服务,举个google的例子,你去搜索西班牙旅游,它就去数据中心帮你搜索,应用是非常聪明的应用,右手边是建议你去哪里吃饭,这是做广告的,你要去西班牙它给你介绍西班牙的饭店,大家会想是火腿,火腿跟西班牙有什么关系呢?事实上你要去西班牙,去西班牙吃美味,有可能会对火腿感兴趣,他就把火腿的信息也展现给你,当然这是智能的体现了。数据中心的电脑也要具备这样的智能,可以时时去判断,到数据库去搜索,与你的搜索信息有关的东西,这就是为什么存储运算的性能对于支持时时服务是非常重要的。时时提供这种服务现在目前还有一些难度,有一些鸿沟,横轴是延迟时间,竖轴是硬盘的空间,我们知道硬盘可以存储很多的数据,但是你这个硬盘延迟的也非常厉害,如果你要提供时时服务的话,你希望延迟越短越好。你可以通过建立大量的内存来实现,但是,你用大量的内存之后延迟就减少了,你买了这些内存成本就上去了。如果你还要实施服务的话,这两个曲折怎么办,延迟做得好就要花很多钱买内存,技术可以帮你解决这个问题。在intel我们正在做一项研究,为数据库未来在成本与时间延迟方面权衡提供技术支持,以前成本主要是买硬件,未来数据库的成本将不再是主要来自硬件这一块,再过几年我们会看到耗电量的钱跟你买硬件差不多,甚至更贵。比如你买一个机器花了两万四,一年当中耗电量又很多钱,主要成本不再是机器,而是电耗。随着设备的折旧每年的功耗成本会增长30%,过不了几年,用电成本将超过数据中心里的硬件成本,如果是不改变技术的话你还敢建立超级数据中心吗?当然了如果你不缺钱的话是可以的。我们只能从技术的角度想办法让未来的超级数据中心在技术上在能耗上在财务上可行。
接下来几分钟我只要谈这一点,耗电的问题,怎么解决这个问题,方法很简单,我们只要做小的改动就可以产生大的收获,像改变生态系统等等。左手边是传统的供电,就是今天服务器主要用这种供电方式,都是很古老的电子技术了,其结果就是它的效果只有55%—70%,什么意思呢?即使你做得非常好,你也有30%的电量是浪费掉的。如果你没有控制很好的用电的话,45%的用电量都是浪费的。我们这里想办法怎么样提高无效的电,变成有效的电。我们看看右手边,就是我们想出来的解决方案。有了我们新的供电单元,能效提高了90%,怎么做得呢?因为以前我们有不同的电转换,在新的这儿我们只有一个电压,我们实行单电压,单电压之后能耗有效降低,虽然只是小小的技术,但是对未来组建超级数据中心来说意义重大,帮你节省电,当然这不仅仅是供电效率的提高。
我们在数据中心在这里Y轴是效率,横轴是我们的输电,当输电发生中断的时候会对数据中心的效率造成重大影响。在供电方面如果没有电,它就降为零,还有配电,配电也会造成输送中的效率浪费。在数据中心我们很多电是在输电的过程中浪费掉的,在配电过程中浪费掉的,这个时候我们要到硬件这想办法,让工程师想想怎么提高输送电的效率。有一个办法是提高配电系统的效率,但是你提高了它完整的效率以后也做不到100%的利用,因为你再提高就是做到70%的效率,其中还有35%(一半)浪费在输电上面。
我想这个问题的关键就在于做太多不必要的电压转换了,今天我们的做法是一个数据中心会有供电,比如480伏的电,把交流电变成直流电,然后直流电再转回交流电,这是在供电这。再到配电这,也是把480伏的变成208伏,从交流直流,每一个电压转换的过程都是浪费电了。我们的科学家在考虑怎么样改变硬件的设计,这是我们实验的简化图,电来的480伏作为不间断电源转换成高压直流电,一路上都是高压直流电,没有转换,因为没有转换所以在配电过程中没有浪费。然后到电源单元了,它可以达到90%的效率,前面我们说了用高压直流电可以达到90%的效率。这种高压直流电分配的体系根据我们现在的研究我们小范围的试用了一下,效果不错,我们这个原形已经在伯克利的实验室里造出来了,这是伯克利的实验中心,他在用我们高压直流电的机器,我想这代表了未来的超级数据中心。
通过这样做我们得到了哪些成果呢?我想采用了这样的技术之后,我们每瓦的服务器的性能提高了60%,这样对服务器来说如果你用传统的电压不断转换的系统的话,以前实验室在不增加电源供应的情况下,原来只能运转1100台服务器,现在采用了高压直流系统以后可以运转1700个服务器。
说了很多关于节能能效的问题,解决了能效的问题我们就可以支持更多的电脑,拥有了更多的电脑之后则可以拥有更多的数据,数据一增加安全性问题又体现出来了,我们看一看企业对安全性的关切是越来越大。安全的威胁有些是来自内部有些是来自外部,当你的数据中心是小型中心和超大型的时候,你面临的威胁是来源不同的。竖轴反映的是随着你的数据中心的规模发生变化,不同来源的威胁所占的比例。在大的数据中心里,内部安全威胁是主要的安全威胁,而小型的威胁是外部的。我们知道有一种IPSEC端到端的加密技术,这是大家非常熟悉的加密技术,防止了黑客侵入,等于在数据源就加密,给它发送,到数据端再解密,在这个过程中是安全的。当一个包从一个地方到另一个地方,经过交换机,交换机没有办法检查你的包,因为是加密的包,这时候通不过交换机的QOS这一关,所以用端到端加密虽然更安全,但是也增加了信息处理的麻烦。这个时候考虑能不能换一个方法,采用LINKSEC的方法,它是说你从一个节点到另一个节点这个过程是加密的,每一步都加密解密加密解密,这样做每一个节点都会检查包裹。吉姆在吗?您能不能给我们做一个演示。
吉姆:像您说的一样,当信息被加密以后,今天的网络面临一个问题,如果有病毒通过邮件传送的病毒怎么办。往往发现邮件病毒的时候已经太晚了,他已经传染你的整个网络了。有了这种加密方式的好处是每一个节点都检查你的内容,如果在这个节点发现你的有病毒系统就及时告知用户有病毒,这样可以帮你省几十万人民币或是任何一种币种,节省了操作成本。给你一个例子看一下,现在屏幕上我们看到是一个简单的网络拓扑图,这里有邮件服务器、客户机、各种连接,侵入发现系统,还有一个小的hub,你这个hub看了信息包,我先发一封邮件,发出的邮件就是这样的方式传播出去,这时候侵入检测系统的就能够发现,但是这样的一个机制还是说太晚了一些。如果用LINKSEC的话,这是平台级的安全解决方案,当然它需要一定的计算能力,在核心层必须要提供计算能力。但毕竟这是一个在OS以下在平台层能够解决问题的一项技术。
我们看看它如何运作,发出了邮件之后,电子邮件的文本是这样的方式在传,侵入检测体系就能够进行检查,而黑客那边能够看到数据包,但是却无能为力,毕竟这是加密的,这对黑客来说带来了他侵入系统的难度。因为讲到加密,加密肯定需要比较大的计算能力,而且在检查数据包的时候肯定要花更多的资源,花这么多资源还是值得的,因为你的网络更加安全。
濮绍庭:另外服务质量怎么样?
吉姆:服务质量还是不错的。
濮绍庭:大家刚刚看到像LINKSEC是简单的技术,却可以更加安全。我们看看超级数据中心是怎样的规模呢?意味着数百万台服务器的数据中心,我们现在一般讲的数据中心都是上千台服务器,而如果是一百万台服务器的话,它的占地大约是25万平方米,相当于是18个标准的足球场,耗电大约是500兆瓦,500兆瓦是怎样的规模呢?相当于33万户家庭的用电规模。因为对于超级数据中心来说如果我们现在不拥有节电节能技术的话根本无法运作超级数据中心,因为它实在是烧电的大户。我们说了必须速度更快,带宽和输出度都得实现万亿级的要求,这是超级数据中心的要求。带宽是万亿次节级的,输出是万亿位的,数据库必须支持。
还是让吉姆重新回来,介绍一下intel这方面的突破。
吉姆:intel跟合作厂商做了大量的合作,刚才我们讲了,Clovertown这个是集合的。我们有一个厂商,他能够将十个处理器一共是四十个内核放到一个客户机里面,而且占地并不太大,非常安静,因为你现在可以听得出来风扇声音并不大,这样一个小小的盒子,却能够实现万亿级浮点运算,这么一个盒子有这么大的运算能力,太强了,这样的运算能力要实现非常不容易,而且先前管理这么大的运算能力也很大难度,通过新的内核技术可以使管理很容易。这个是加州污染检测的模拟,在座可能有跟检测有关的工作人员,你会意识到这样的运算会很耗能力,我们一共有并行的32个内核在进行,几年前实现万亿级计算的话需要很大的计算机才能实现,现在小小的盒子就可以实现。
濮绍庭:这些都说明现在已经看到地平线上浮现出越来越多的技术,这些技术使我们实现超级计算中心。接下来介绍一下产学研的合作,大学这块对万亿级运算来说是至关重要的,下面有请程教授,来自清华大学的。
程教授:我们的研究组在这方面有很多研究经验,根据我们对用户的需求和了解来看,他们有非常大的需求。在过去几年我们很高兴和intel一起在这方面取得了很多有意义的工作。
濮绍庭:能不能谈谈您在这个领域你们自己的研究。
程教授:intel安腾2处理器构成了2亿次的处理机,我们在这个系统上开发了并行调试器,高可用系统等,为我们清华大学服务,运用了很多科学运算程序。
濮绍庭:确实,你们在大学所做的研究工作还是非常深入的,那么intel在这方面帮你们提供了哪些支持和你们的期望呢?
程教授:这个系统的维护费用实在很高,我们的小组在存储系统、计算机存储结构、电源管理等方面有很多经验,我们希望今后和intel一起努力,为高性能计算用户提供高性能系统。
濮绍庭:刚才介绍了和清华大学的合作其实我们很早就意识到万亿次级的运算能力有多重要,我给大家看看我们在这个项目当中的测试芯片。在这个芯片上它的性能是一万亿次浮点运算,刚才给大家看了服务器的实际产品这给大家看的是一个参考的模型。内核是八十内核,每个内核是路由器连接,相当于芯片上有计算网络,这样的芯片要求内存或是带宽是万亿位的。这边有一个处理器,下面是封装,中间是内存,这些内存也意味着输入输出速度非常快,带宽要实现万亿次级,我们也在同大学在这方面展开研究,给大家看看进一步介绍。
谈谈输入输出的带宽也是要实现万亿位,用电路的传统方式成本很高,特别是当距离越长的时候,短的距离用电的方式实现是可靠的技术,距离稍微长一些功耗不得了了。对超级数据中心实现计算性能怎么推进输入输出技术,谈到的新的技术就是硅光子技术,是成本高的技术,虽然性能非常好,而最近我们在硅光子方面有新的突破,就是混合硅激光,中间是激光器,左边是调节器,右面是光探测器,全都是把它集成。
来给大家介绍一下这样的混合硅激光技术。我们所使用磷化铟这样的材料,在使用当中大家看到激光的枪体用硅,发光用磷化铟发光,我们看到混合激光器是怎样的物理构造。最上面的磷化铟发光区域,再往下就是光导区域,给大家看一个短片,我们了解一下是如何有这样的机制的。
大家看到混合激光器确实是化为现实了,而且它给输入输出带来巨大的机遇,因为有了这样的混合激光器之后就能够实现万亿位的输入输出带宽,对于超级数据中心来说,如果你在调制的时候达到每秒40GB,以往是每秒20GB,以后将达到40GB以上,如果是25个激光器的话,这时候做一个乘法,就可以实现万亿位的计算和带宽,这也是一个构建的模块,你可以构建一个输入输出的系统。左边是带有调制器的混合激光器,你再将这些子系统放在一起,把多功器放在里面,除了多功器里面还有光测器以及发射器接受器进行集成,可以在系统级得到这些的板子,通过光纤进行互联。所以在这里面就实现的混合激光技术的输入输出系统,它带来什么样的好处呢?应该说在输入输出的带宽上实现的重大的突破。我们来看看信号速度是在横轴上,而Y轴上是成本,或者说是能效比,如果用电路的方式实现的话,到了Y轴的10就饱和了不能突破了,硅光子在相同的能效比例上就能够实现近50倍的速度提升。
刚才一直谈超级数据中心以及它存在的理由,而要运行这样的超级数据中心性能上有很大的要求,在能耗上、密度上、存储上、安全上、可靠性、可用性、成本上都有非常高的要求,刚才给大家介绍了在这一方面我们有那些助推的技术可以使超级数据中心化为现实。我们的前景非常光明,我也觉得有了这个技术一定可以使超级数据中心化为现实。谢谢各位。
(责任编辑:梁冰) |