1998年,网格(Net Grid)的概念第一次在美国被提出。 2001年9月10日,《福布斯》杂志的科技版《Forbes ASAP》发表文章,预测信息技术的下一波大浪潮将在2004年出现,这一波浪潮的本质特征就是万维网(World Wide Web)升级为网格(Great Global Grid),2020年,由此产生的互联网将成长为一个20万亿美元产值的大产业。 目前,世界上绝大多数先进国家的国家科学部门和高校已经建立了自己的网格系统,IBM、微软、HP、Sun、Oracle等公司都投入巨资开始开发网格技术。 那么,究竟何为网格?网格在中国的现状和未来怎样? 本报记者专访了中国教育科研网格计划专家组组长金海教授和清华大学高性能计算研究中心主任郑纬民教授。
火车上,教育部长急电网格专家
华中科技大学计算机学院副院长金海教授清楚地记得,那是2002年的8月,他在一列急速行驶的火车上接到了时任教育部副部长的周济博士的电话。 周部长在电话里告诉金海教授,希望他尽快来京一谈,商议大事:建立中国最大的教育科研网格。 金海教授告诉本报记者,那次会见里周部长告诉他,最近在欧洲考察时,对国外科教界的对网格的重视印象深刻。他看到英国的E-science国家中心已经建立9个网格;而爱丁堡大学利用网格技术加快对科学数据的访问、检索和分析过程,搜索过程可以从5小时缩短到5分钟,效率提高20倍。周部长告诉金海教授,中国科教界的网格研究和建设必须迎头赶上,刻不容缓,应该马上开始动手工作。而ChinaGird这个名称,也是周济部长亲自定下的。 刚刚从美国南加州大学完成博士后研究回国的金海教授对国外网格技术的发展有深刻的体会。他看到欧美日等西方发达国家已经竞相投入了网格技术的研究,深深感到了中国加快在网格技术方面追赶的必要性。“网格技术起步时间还很短,中国的网格技术研究仅仅比美国晚2-3年,如果加快步伐,我们完全可以赶上世界先进水平。”金海教授这样说。 当年11月,来自华中科大、北大、清华、北航等国内一流高校的专家在北京开始了筹建中国教育科研网格计划的第一次会议。对于这次会议,金海教授对本报记者说:“大家都是同行,也都是分布式计算、高性能计算、计算机集群方面的专家,彼此已经很熟悉,也早就对我国的网格建设交换过意见。听说教育部要开始建中国教育科研网格,都很兴奋。这时候,国家还没有立项,还没有具体的支持,大家就自费在北京开了个筹备会议,都希望能早点开始这项工作,当时的气氛真是好极了,大家的情绪也高极了。” 而在这之前,国家863计划的CN_Grid计划、国家自然科学基金委员会的网格基础理论研究项目、中科院计算所的“织女星”网格等等研发工作已经开展了一段时间,中国科技界对建立自己的广域网格已经有了相当的理论准备和实践经验。 国家级的网格建设需要标准化,2003年9月12日,中国网格论坛(CGF:China Grid Forum)第一次会议在北京翠宫饭店举行。出席会议的有中国工程院副院长邬贺全院士、中科院计算所所长李国杰院士、中国航天科技集团李伯虎院士等权威和IBM、PLATFORM、浪潮、曙光等企业界代表。这个论坛的目的在于促进中国网格标准化建设和世界接轨,具有极为重大的意义。 9月16日,金海教授从教育部的一份传真函中获得证实:教育部决定正式启动“教育科研网格(ChinaGrid)”项目,教育部副部长赵沁平任项目领导小组组长,37岁的金海挑起大梁,担任项目专家组组长,全国共有12所高校、13名教授任专家组成员。 2003年,是中国网格的“大年”,注定将被载入史册。
何为网格?
要了解网格为何受到如此重视,必须知道何为网格。 目前,国际上对于网格的定义还很不一致。但一般来说,网格就是把广泛范围内的存储资源、数据资源、信息资源、知识资源、专家资源、设备资源实现全面共享和协同计算的一种实现方式。它既可以连接起整个Internet,也可以是地区性的网格、企事业内部网格、局域网网格、甚至家庭网格和个人网格。它的根本特征是资源共享,消除资源孤岛。 金海教授告诉记者,网格(Net-Grid)中的Grid一词过去主要用于指电力网络。人们在用电的时候,只需要插上插头就可以用。而不必理会如何发电,或是由哪个发电厂供电。而用Gird的方式规划的网格,则可以让人们在需要使用计算能力和各种资源时,如同使用电力一样方便,而不用理会是谁提供的。 国际网格权威,开发国际网格标准的Globus项目共同领导者福斯特在最近的一次采访中说,“网格技术是以合理的形式共享资源的方法。” IBM的网格运算策略副总裁鲍尔斯认为,网格运算是朝向未来的一步,届时电脑运算能力就像电力和水一样,只要有人需要,就可使用。他表示,网格的长期远景基本上就是将IT资源虚拟化。” 金海教授告诉记者:网格的本质其实是一种软件,或者准确的称为中间件。它建立在两个成熟技术之上:现有的计算机和发达的光纤网络。网格软件的作用在于把这些不同大小、不同架构的计算机所拥有的计算能力和存储的资源整合起来,且不仅仅是整合,还将协调、分配给每个需要使用的人。就好像是电网的调配中心,本身并不用发电,而是把全国各个电厂发来的电,通过电网分配给各个地区。 或许有人会觉得这有些像Internet,事实上,目前的因特网技术只联结了2%的计算装置, 对剩余98%的计算能力和存储的据量信息就束手无策了。并且即便如此,由于现有的互联网缺乏智能化,人们能搜索和利用到的还仅仅是整个互联网资源上极小的一部分而已。 网格的意义就在于,将世界各地的计算机中存储的信息链结起来,创建一个使得任何事物彼此联系的空间。”
巨大需求无处不在
事实上,虽然概念听起来很玄妙,网格已然悄悄来到中国人的身边,而中国科教界对网格的需求也十分迫切。 清华大学东主楼B区2层,幽暗的长廊和实验室门口的一盏盏红灯显得很神秘,这是计算机学院的实验室区。在这里,清华大学高性能计算中心主任郑纬民教授告诉记者的几个故事,或许可以说明这一切。 清华大学高性能计算中心目前的两千亿次“东方红日”计算集群是目前国内高校领域所拥有的性能较高的集群之一,然而它的运算能力已经远远不能满足科研的需求。 “今年春节前后,生物系的一个老师要做一个水稻基因的测序,找到了清华里运算能力最强的我们中心。结果他这一个测序计算,让我们的整个集群算了整整5个星期,每天24小时不停才算完。而其它所有的计算工作只能停下来等他算完。”郑纬民教授说。“如果有了网格,这个问题就很好解决。网格会把这个计算任务分配给各个集群,有的在北大算,有的在华中科大算,有的在清华算,很快就可以算完,而且不耽误别的工作”。 而就在这个“水稻计算”后不久,抗击非典型肺炎的战役在全国打响了。在抗非斗争中,对病毒基因的蛋白质测序需要极其巨大的运算能力,这个问题交到了清华。 时间紧迫,再也不能像以前那样依赖单个集群了。而问题是,清华大学的许多院系如计算机学院、生科院等都有性能比较强大的计算集群,但任何一台单一主机的运算能力又都还不足够大。而这些集群有的是IBM架构的、有的则是I/A架构的,如果用传统的方法,这些计算能力是无法整合的。 而郑教授领导的高性能计算中心,把清华大学的各种高性能计算机组成了一个网格。这个网格提供了前所未有的强大运算能力,很快就计算出了结果。“非典病毒的变异性不强,这个结论就是在清华算出来的”。说到这点的时候,郑纬民教授显得很自豪,也很欣慰。 网格的另一个特色,即应用的简单化在上面的故事里得到了彻底的体现。郑纬民教授向记者展示了清华的“生物信息网格”。 在指导下,记者在一台连入互联网的PC机里,用IE浏览器登入“生物信息网格”主页面,又来到“SARS防治”页面。在这个页面下,有“病毒测序”、“蛋白质分析”等多个选项,用鼠标单击后,只要在弹出的页面里输入各项数据,点击发送后。系统将请求发送到网格上,使用者只要等待结果就可以了。 作为一个生物工作者,完全不用理会决定采用何种软件,分配到哪个集群进行计算等问题,只要输入数据和进行若干选择即可。 网格要提供给人们的,就是这样一种简便的应用。
中国的网格雄心
围绕网格的国际竞争从未停止,IBM的“全球计算平台”,微软的的“无处不在的计算”,Intel的“计算和通讯的融和”,以及联想的“关联应用”,都是围绕着网格技术进行的。 中科院院士李国杰9月在京说了这样一句话:网格是1995-2010年时段计算机体系结构、操作系统、用户界面领域最重要的突破性创新,它为中国提供了一个前所未有的机会。 2003年9月28日上午,武汉满城桂花飘香。记者赶到华中科技大学南一楼4层时,金海教授正在主持一个40人的会议。 这个会议是为了制定合同。10月15日,教育部将和华中科技大学签订一份价值2500万元的总合同,这笔资金来自211工程专项基金,由国家发展与改革委员会审批拨出。 而华中科技大学大学将再和清华大学、北京大学、北京航空航天大学、华南理工大学、上海交通大学、东南大学、国防科技大学、西安交通大学、东北大学、山东大学和中山大学共12所高校签订分合同,共同承建是这一“十五”计划中的国家“211工程”公共服务体系“CERNE(中国教育科研网)高速地区网和重点学科信息服务体系建设”项目。 在项目中,华中科技大学、北大、清华和北航将承担体系设计的工作,另外8所高校则分别根据所长,承担网络安全、软件应用、生物信息、图像传输、远程教育等应用项目。 参加项目的每个高校,都承诺建立一个运算能力至少在5000亿次以上的超级运算集群,并通过CERNET连接。而ChinaGrid的目标是:在2005年建立聚合能力超过15万亿次量级的教育科研网格,并争取在网格计算的基础研究和应用研究方面走在世界前列。 工作已经开始进行。在华中科大,金海教授在规划ChinaGrid整体目标的同时,已计划在今年年底建成具有峰值计算能力为5000亿次和存储能力为5TB(1TB=1000GB,1GB=1000MB)的网格节点;而在清华大学,郑纬民教授告诉记者,一个运算能力达到1万亿次的集群已经开始建设;在上海交大,一台运算能力接近3000亿次的IBM大型主机已经开始运转,另一台也将很快到位……中国教育科研网格计划,正在高速前进。 而意义还不止于此,中国教育科研网格计划的最终目标在于连接100所部属高校的计算中心,建立中国第一,也是世界上最大的超级网格之一。 而在这一过程中,100所高校将有数以千计的师生投入建设,这将为中国未来的网格技术培养一支巨大的人才队伍,影响今后10年的中国网格发展。 中国未来的网格十年,已然起步。
|