搜狐首页-新闻-体育-娱乐-财经-IT-汽车-房产-家居-女人-TV-ChinaRen-邮件-博客-BBS-搜狗 
曙光曾宇主题演讲:高性能计算的平民化应用趋势

时间:2005年04月26日16:01  来源:搜狐数码天下 热点排行】 【推荐】 【打印】【关闭
我来说两句 我来说两句 即时新闻通知 进入新闻论坛 相关新闻:
 

主题:高性能计算的平民化应用趋势
曙光信息产业(北京)有限公司研发中心总经理  曾宇:

    各位来宾,下午好,感谢《微电脑世界》报提供这个机会跟大家一起交流。

    我的报告分成三个部分,第一部分,我们一起看一下高性能计算发展的现状以及趋势。其次谈一下面向网格的曙光,在工业化、标准化进程中所使用的构建技术。其次谈一下曙光在未来几年中高性能研发思路。

    去年10月份拓扑500排名的趋势情况。摩尔定律已经成为推动中国高性能计算永恒的定律,我们不能说这个定律能延续多少年,起码在未来的十到十五年以内,摩尔定律将继续推动中国高新技术产业的发展。可以说从1950年开始到现在,全球最快的计算机每四年性能增加两个功能,这是非常了不得的趋势。1997年以前我们曾经做过预测,百万计算机在2005年前已经出现,实际上已经得到了印证,目前全球运算速度最快的IBM的已经到135万次。

    我们今天已经面临HPC结构相对平稳的时期,这个时期会持续三到四年,这个时间非常有利于应用的普及,同时非常有利于学术界、产业界在体系架构方面做出全新的突破。这个数据在1997年,在整个高性能TOP500排名中,今天已经超过50%。从计算部件的发展趋势来看,整个高性能计算的计算空间发展,已经由商业化的、标准化的计算平台所推动。基于Intel和IBM具有非常高的管理带宽和延迟的CPU构建我们的架构体系已经成为主要的趋势。由此验证市场已经成为推动当今中国应用的主要推动力。

    我们在IT界,体系结构的发展经历了BS、CS,再到今天的运行计算。虽然到今天为止,我们的体系架构会出现短期的稳定,但是不断的发展将是永恒的旋律。新型的体系结构,在未来的三到四年之内,包括最近我们在做基于能力的研究,实际上也是在做创新工作。同时我们在轻型体系架构方面的研究重点,会由单纯的提高CPU的速度,再到单纯的提高CPU一级、二级的访问延迟。其次我们应该看到商品化、标准化以及好用性、平民化也已经成为今天要考虑的重点因素。

    我们也应该看到,针对专用的,针对特定行业应用的专门的服务器研发,已经成为当今研发的主流,怎样根据特定的应用研发专用的服务器,我们做了非常好的应用,针对运行非常好的计算,采用像素的CPU构建集群。曙光也在这方面做了大量工作,包括我们构建了气象服务器,在未来的一两年中还会构建石油应用服务器等等一些专用服务器,也是这样的思路。

    纯粹的基于线性求解的Linpack手段已经被中国的存储带宽、LO带宽所取代。

    在工业化和标准化方面曙光所做的工作。谈到Cluster,从应用上来说有三种。一种是核武器,强调的是针对特定利用在最短的时间提供最高的系统,比如国防领域、气象领域,我们可能会采用专用配件,也会采用专用的软件。在这种模式下,成本并不是我们重点要考虑的因素。第二种,要做高科技武器,采用一部分通用部件,同时要定制一些专用部件,这样最大化的提高性价比,讲究在单位的功耗下,单位的成本下,最大化的满足用户的访问性。第三种,实际上更多的是DRY,根据商品化的属性,根据开源的软件构建我们的集群,更多的带来低成本的营运模式。

    回顾曙光研发的高性能计算机的历史过程,更多的看到两个S曲线。在1994年研发曙光一套计算机,随后1999年研发了2000。在2003年研发了曙光3000,去年研发了中国商业化的第一台面向网格的曙光3000。到今天为止,曙光高性能计算机能够充分满足商务信息应用处理、网络信息处理,空间信息采集领域等等,HP已经采用了曙光的服务器。去年6月份TOP500我们排名获奖的情况,曙光4000使中国成为第三个进入TOP500排名的国家。

    从体系架构来说,整个曙光基础架构层、集群操作层、网格系统层等等。在基础架构层,研发了自主知识产权的主板,其次我们自主研发了通讯网络,支持虚拟存储,同时我们还有自己的电源管理网络,可以做到主板逻辑信号进行分析。提供了网格路由器、网格零部件。我们提供数据库、分析工具等等。在集群操作系统中提供将近12个布线,这些布线囊括了监控、管理并行、数据存储到文件系统方方面面的系统。

    在网格系统中整合了网格路由器、交换机、控制台、网络监控等等。实际上曙光4000的研制也使得曙光公司能够为我国的科研、教育、政府、国防安全和工业界提供商业化的,万次到二十万次的高性能设备,同时也使中国成为第三个进入TOP排名的国家。采用64位的服务器处理器,使中国的业务更早的、更廉价的使用64位运算,给用户带来更多的选择,有利于整个计算机产业格局的形成。

    曙光4000从去年作为中国两个网格服务商之一,到目前为止已经到了50万小时。这么高的可靠度,更多的由我们采用的工业化、标准化的集群系统,不可能做到。首先我们针对曙光4000用户,研发了具有自主知识产权的高速通讯协议,其次我们研发了自主知识产权的,能够支持海量数据处理的可扩展的软件系统。同时我们还研发了商业化、标准化、智能化的集群操作系统。比如技术监控,一般来讲进行软件的简单配送进行统一,在曙光4000中采用独立的芯片,可以实现远程监控,可以实现日制查询、审计,可以做到全局的资源管理,包括交换机设备、存储设备,都可以进行智能监控。在整个模块的作用下,采用仪器化的、模块化的设计方法。

    在集群管理系统中,一方面企业的通常做法可能采用开源的部件构建管理,对曙光来说,我们专门投入大量的技术研发基础管理软件,可以做到全局资源的管理和调度,可以做到对应用的逻辑划分,可以做到跟服务器节点时段逻辑划分的调度,也支持应用在线搜索,支持应急的管理和监控。整个智能监控管理系统有非常好的扩展性,可以支持我们的节点。整个系统对资源的消耗也是非常低的,并且在整个管理系统中集成了电信管理工具,可以让管理员非常方便、简洁的对1024的节点进行统一的调度。

    在集群控制系统方面,一般的厂商只是针对BIOS进行简单的分发,在曙光的集群系统中,一方面保留各个节点的差异,同时支持自动公开,最大的好处可以做到在节点出现故障的时候,能让系统管理员非常简洁、方便的修复整个集群系统。同时,也大量的降低我们对用户厂商的依赖。在网络建设方面的基础构架,一般的厂商,经过简单的模拟信号的互联,来实现电源的切换。在曙光的技术格局中,监控系统可以实现640个节点,甚至可以到1024节点的监控,在以太网上进行远程监控。我们还可以实现ORD,可以在远程,或者Cluster节点进行监控的管理。还可以实现对远方的节点进行重启,节约空间,优化布局,同时也可以极大扩展监控的灵活性和部署的灵活性。

    电源管理网络方面可以实现CPU,可以做到主板模拟信号进行切换。

    正是基于工业化、标准化、模块化、仪器化的设计,让曙光4000建立非常高标准的应用。

    我们研发了具有自主知识产权的高密度主板,集成了自主设计的PM管理接口接收模块,我们可以汇集11万次接收能力,极大拓展了集群。带宽,包括延迟非常优越。

    在网格使用方面我们研发了多个网格零部件,网格路由器,网格交换机,使得曙光4000是唯一一款具有网格使用特征的高性能路由器。

    归纳起来,细分专用,应用导向,两高两低,顶天立地,工业标准,安全智能,分散集中,体系创新。第一个思路是细分专用,应用导向。谈到高性能计算的时候,高性能计算的研发速度一直是两个速度,一个是在最短的时间内,最快的解决问题。其次高生产力计算机,持续的在单位成本、单位功耗、单位密度等等条件下,能起到持续的接入。曙光来说,针对非常明确的用户,针对行业用户的特点,研发针对性强的专业计算机,是曙光长期以来一直坚持的思路,包括我们在去年为华纳精英研发了曙光4000H,专门构建了加速卡。不同的应用,所要克服的技术瓶颈并不是完全一样的,比如系统模型,可能重点解决计算,解决存储器延迟,解决网络带宽能力,针对不同的应用,选择不同的体系架构,来为用户架设一条非常有用的,能够切实提高用户回报率的方法。比如我们需要形成一个非常好的规模,需要非常高的网络能力,同时代宽能力要非常优越,在选择CPU的时候可能要做一些个性化的服务。  

    高性能到今天为止,已经经历了硬件建设相对平静的时期,给我们整合上层应用提供了非常好的时间和空间。我们在去年整个采购高性能软件所花的费用将近十个亿,这意味着在业务软件方面还有大量的工作要做。如果今天在座的有软件厂商的代表,我呼吁大家投入更多的精力整合上层软件,基本上到今天为止,很少看到国有软件在高性能市场上。针对这个特点,我们可能会在未来几年内考虑上层应用软件的特点,考虑上层应用软件的走势,包括CPG等等软件的走势,同时会考虑相关行业的平台要求,比如说石油领域,现在非常希望有一些非常好的软件,我们也会投入大量的精力做这样的工作。

    第二是两高两低,顶天立地。一方面要满足高端技术,不断地做体系结构的创新,另一方面要满足大众化的,具有很高的可视度的需求,同时要大幅度提高我们的生产能力,同时降低成本,降低功耗,这是在过去几年高研发的思路。

    进一步提升工业标准化,强化安全性和智能化。从整个商品化的差别来说,商品化超级计算机需要的是这种工业标准,需要网络一体化,需要应用好用化,服务的高品质化,同时也需要针对行业用户定制专门的系统,还需要安全化以及监控管理的智能化。未来几年我们在工业标准方面,在安全方面,在智能方面会下大力气,包括可能会整合信箱设计,优化布局,简化内部设计。会提高产品的工业水平,同时会针对专门用户领域设计高性能的计算机。在安全性方面还会做相关的面向网格应用的,面向基础应用的网格要素,检测、防火墙等等。在管理方面会开发一些更容易使用的模块,让用户使用起来更加安全,更加可靠,更加方便。

    分散集中,结构创新,是推动整个计算机产业不断向前发展的主要方面。怎样在高可用、高效性、高密度、低价格、低功耗、低成本中找到平衡点,需要体系架构的创新,我们已经整合了相关的应用,我们正在推出相关的设计,可能会集中分布的CPU资源、存储资源,基于操作系统模型统一标准,给网络终端使用,这个模型的软件模拟基本在今年年底就能实现。在未来两三年内能看到。

    我们要实现的目标,在未来三年之内,使工业标准的集群,性能和集群密度提高到新的水平,成本和功耗降低一个生产水平,可靠性达到99.99%,要比现在的曙光4000提高一百倍,最终目的是工业标准系统真正成为生产系统。


相关搜索: 曙光 高性能计算

页面功能   【我来说两句】 【热点排行】 【推荐】 【字体:  】 【打印】  【关闭

 ■ 相关链接
·曙光信息产业(北京)有限公司 曾宇先生
·二代身份证背后的64位、四路和曙光4000A
·曙光以“自主”技术“创新”领军突围
·64位时代的到来:启动曙光4000A
·冲浪平台完成梦幻重组 LINUX产业赢利曙光乍现

 ■ 我来说两句
用  户:        匿名发出:
请各位遵纪守法并注意语言文明。
 
*经营许可证编号:京ICP00000008号
*《互联网电子公告服务管理规定》
*《全国人大常委会关于维护互联网安全的规定》
手机
包月自写5分钱/条

最新制作 想唱就唱
夏天的味道 哪一站



精品专题推荐:
谁说赚钱难告诉你秘诀
测IQ交朋友,非常速配
就让你笑火暴搞笑到底

短信订阅
焦点新闻魅力贴士伊甸指南魔鬼辞典



公社热图


·[组图]大陆第一美女模特
·[图]这就是人死后世界?
·女星中的九大混血妖姬









搜狐商城
 
·数码|iPod nano¥1799
·I T|1G 微盘特价¥399
·家电|飞利浦耳机特价
·家电|USB音箱5折
·家电|飞利浦耳机特价
更多...
-- 给编辑写信
Copyright © 2017 Sohu.com Inc. All Rights Reserved.搜狐公司 版权所有 全部新闻 全部博文